A Google e a OpenAI foram acusados de utilizarem vídeos do YouTube para treinar os seus modelos de Inteligência Artificial (IA). A estratégia visava acessar uma grande quantidade de dados de forma económica, mas pode ter violado os direitos de autor de vários criadores, como relatado pelo jornal The New York Times.
Segundo o jornal, tanto a Meta (anteriormente Facebook) quanto a OpenAI e o Google teriam utilizado transcrições de vídeos do YouTube sem autorização prévia.
Empresas negam violação de direitos
Segundo o relatório publicado no último dia 6, a OpenAI utilizou a ferramenta de reconhecimento de voz Whisper para transcrever mais de um milhão de horas de vídeos do YouTube. Todas essas informações teriam sido utilizadas para alimentar o poderoso sistema de IA GPT-4, no qual o modelo mais recente do chatbot do ChatGPT é executado. A Google, dona do YouTube, terá feito o mesmo.
"OpenAI, Google e Meta ignoraram as políticas corporativas, alteraram suas próprias regras e discutiram contornar a lei de direitos de autor enquanto procuravam informações online para treinar os seus mais novos sistemas de inteligência artificial", afirmou o jornal.
Em resposta às acusações, a OpenAI afirmou que cada um dos seus modelos de IA "tem um conjunto de dados único que nós curámos para ajudar na compreensão do mundo e permanecer competitivos globalmente em pesquisa".
A Google também respondeu e confirmou a utilização de conteúdo do YouTube para treinar os modelos de IA, mas destacou que o material utilizado foi permitido sob acordos com criadores. A Meta, por sua vez, afirmou ter feito "investimentos agressivos" para integrar a IA nos seus serviços e ter tido acesso autorizado a milhões de imagens e vídeos publicamente partilhados no Instagram e no Facebook para treinar seus modelos.
Mais de 10 mil grupos comerciais ajudam na criação de uma nova lei de direitos de autor
No ano passado, o The New York Times processou a OpenAI e a Microsoft por utilizarem sem permissão artigos de notícias protegidos por direitos de autor para treinar chatbots de IA. Na altura, as duas gigantes da tecnologia defenderam-se com o argumento de que se tratava de uma "utilização justa", permitida pela lei de direitos de autor, porque transformaram as obras para um propósito diferente.
No entanto, este foi apenas um dos inúmeros processos judiciais por questões de direitos de autor e licenciamento que o crescente uso das suas obras por empresas de IA tem provocado. De acordo com o The New York Times, mais de 10 mil grupos comerciais, autores, empresas e outros enviaram comentários no ano passado sobre a utilização de obras criativas por modelos de IA para o Escritório de Direitos de Autor.
Esta agência federal está a preparar orientações sobre como a lei de direitos de autor deve ser aplicada na era da IA. E todos esses comentários e depoimentos serão levados em conta para a elaboração da nova lei ou das novas formas de a aplicar.