Demorou, mas finalmente uma grande empresa de notícias deu início à multidão de processos que deve se seguir contra a OpenAI e outras empresas donas de grandes modelos de IA generativa (veja aqui, aqui e aqui).
O New York Times, gigante do jornalismo, lançou uma contestação legal contra a OpenAI, acusando a empresa de pirataria de direitos autorais em grande escala. Milhões de artigos do NYT, afirmam, foram roubados na mão grande para treinar chatbots que agora ameaçam seu próprio sustento.
A briga pode definir regras para o uso de material coletado na internet para treinar modelos de inteligência artificial.
Modelos de IA Generativa Treinados com Materiais Protegidos
O New York Times está processando a OpenAI e sua empresa-mãe Microsoft. A acusação é de violação de direitos autorais por treinar modelos de IA generativa com material protegido. O jornal alega que LLMs (large language models) como os GPT3.5 e 4 do ChatGPT foram treinados com seu material sem permissão e sem nenhum pagamento. Além disso, o jornal argumenta que o uso de seu conteúdo pela OpenAI rouba audiências.
Alucinações e Dano comerciais
Outra questão destacada no processo do Times é a tendência do ChatGPT e outros modelos de IA generativa de alucinar. Os advogados do Times afirmam que o ChatGPT às vezes cita mal o jornal, causando danos comerciais. O jornal exige que os usuários não obtenham uma cópia não autorizada nem uma falsificação imprecisa de seus artigos.
O uso de Material Protegido é Justo?
Os líderes da OpenAI insistem que sua prática de realizar scrapings de grandes áreas da internet, incluindo artigos do New York Times, é protegida por uma doutrina legal conhecida como uso justo. Ela permite que o material seja reutilizado sem permissão em certos casos, incluindo usos para pesquisa e ensino.
Os tribunais alegam que o uso justo de uma obra protegida por direitos autorais é legal quando existe a geração de algo novo que seja “transformador”. O Times argumenta que isso não se aplica à forma como a OpenAI reproduz reportagens originais. “Não há nada de ‘transformador’ em usar o conteúdo do Times sem pagamento para criar produtos que substituam o Times e roubem audiências dele”, afirmam os advogados do Times no processo.
O que o Times quer?
O Times está pedindo bilhões de dólares em indenizações. Além disso, os advogados do jornal estão solicitando a destruição dos conjuntos de dados dos LLMs que usam suas obras com direitos autorais.
Ética e o Futuro da IA Generativa
A batalha legal do Times com a OpenAI pode ter ramificações abrangentes para a indústria editorial digital. Esse tema já é considerado um potencial divisor de águas para o futuro das tecnologias de IA generativa.
Portanto, 2024 promete ter um passeio selvagem pelo campo minado ético da IA e dos direitos autorais. Seu próximo feed de notícias será criado por bots ou escrito por jornalistas vencedores do Prêmio Pulitzer? Essa luta pelo controle da narrativa e pela definição dos limites da IA está apenas começando.