OpenAI Acusada de Treinar GPT-4o com Livros Pagos sem Autorização
2025-04-02

Um novo artigo do AI Disclosures Project acusa a OpenAI de usar livros pagos sem licença, principalmente da O'Reilly Media, para treinar seu modelo GPT-4o. O artigo usa o método DE-COP para demonstrar que o GPT-4o apresenta um reconhecimento significativamente maior do conteúdo pago da O'Reilly do que o GPT-3.5 Turbo, sugerindo dados não autorizados substanciais em seu treinamento. Embora a OpenAI possua algumas licenças de dados e ofereça mecanismos de exclusão, isso se soma aos desafios legais existentes relacionados às suas práticas de direitos autorais. Os autores reconhecem limitações em sua metodologia, mas os resultados levantam sérias preocupações sobre os métodos de aquisição de dados da OpenAI.
IA