OpenAI wegen Training von GPT-4o mit nicht lizenzierten kostenpflichtigen Büchern beschuldigt
Ein neuer Bericht des AI Disclosures Project wirft OpenAI vor, nicht lizenzierte, kostenpflichtige Bücher, hauptsächlich von O'Reilly Media, zum Trainieren seines GPT-4o-Modells verwendet zu haben. Der Bericht verwendet die Methode DE-COP, um zu zeigen, dass GPT-4o eine deutlich stärkere Erkennung von O'Reillys kostenpflichtigen Inhalten aufweist als GPT-3.5 Turbo, was auf umfangreiche nicht autorisierte Daten in seinem Training hindeutet. Obwohl OpenAI über einige Datenlizenzen verfügt und Opt-out-Mechanismen anbietet, verschärft dies die bestehenden rechtlichen Herausforderungen im Zusammenhang mit seinen Urheberrechtspraktiken. Die Autoren räumen Einschränkungen ihrer Methodik ein, aber die Ergebnisse werfen ernsthafte Bedenken hinsichtlich der Datenbeschaffungsmethoden von OpenAI auf.