ChatGPT e Gemini usaram vídeos do YouTube para treinar IAs, diz jornal

08/04/2024

Fonte: Imagem: GettyImages

As empresas Google e OpenAI, dona do ChatGPT, foram acusadas de usar vídeos do YouTube para treinar modelos de linguagem de inteligência artificial (IA). A informação foi revelada em uma reportagem publicada no The New York Times.

Segundo a matéria, as duas companhias utilizaram transcrições de vídeos do YouTube para alimentar a base de dados de IAs generativas como o Gemini e o próprio ChatGPT. O problema? Isso foi feito sem a devida autorização dos canais e representa uma possível violação dos termos de serviço da plataforma.

O motivo envolve as próprias regras do YouTube, que impede o uso dos clipes para treinamento de chatbots. Recentemente, o próprio CEO da plataforma de vídeos criticou o possível uso dos materiais pela Sora, a IA generativa de vídeos que tem impressionado a indústria pelas criações audiovisuais.

Usar vídeos do YouTube para treinar IAs é ilegal?

Usar vídeos do YouTube para alimentar IAs sem autorização do dono do canal é considerado ilegal pelos termos de serviço do YouTube. Essa é uma regra parecida com a de utilização de textos de livros ou artigos de jornais, por exemplo.

No caso da OpenAI, a companhia teria utilizado o modelo de linugagem Whisper de transformação de áudios em texto para fazer a transcrição de vídeos do YouTube. Esses materiais são então adicionados à biblioteca do GPT, incorporados à base de conhecimentos do serviço.

Esse caso é tão polêmico quanto o uso de outros materiais da internet para treinar a IA, já que não envolve qualquer tipo de solicitação ou bonificação ao detentor dos direitos autorais do conteúdo. Além disso, o ChatGPT não costuma citar as fontes ou inspirações da geração de respostas, ou textos.

Até agora, a OpenAI não se manifestou sobre as acusações. Na entrevista já citada, o CEO do YouTube, Neal Mohan, disse desconhecer se o ChatGPT tem ou não vídeos entre os seus conteúdos absorvidos da internet.

O caso do Google é um pouco diferente, até pela empresa ser a dona do YouTube. De acordo com a reportagem, a companhia também utilizou transcrições de vídeos para aprimorar o Gemini, nome tanto do modelo de linguagem quanto do atual chatbot da marca.

Nesse caso, a companhia não negou as acusações. Porém, ela afirma que só fez isso em casos específicos, com a devida autorização dos donos de canais em uma parceria pré-estabelecida.

Fonte(s): TecMundo