Studie: OpenAI hat GPT-4o möglicherweise mit kostenpflichtigen O’Reilly-Büchern trainiert

Eine neue Untersuchung des AI Disclosures Project legt nahe, dass OpenAI sein GPT-4o-Modell ohne Lizenzvereinbarung mit kostenpflichtigen Büchern von O’Reilly Media trainiert hat. Die Forscher Tim O’Reilly, Ilan Strauss und Sruly Rosenblat analysierten, wie gut verschiedene OpenAI-Modelle Inhalte aus O’Reilly-Büchern erkennen. Laut der von Kyle Wiggers auf TechCrunch vorgestellten Studie zeigte GPT-4o eine deutlich bessere Erkennung kostenpflichtiger O’Reilly-Inhalte im Vergleich zu älteren Modellen wie GPT-3.5 Turbo. Das Forschungsteam nutzte die DE-COP-Methode, um zu testen, ob das Modell zwischen menschlich verfassten Texten und KI-generierten Versionen unterscheiden kann. Obwohl kein endgültiger Beweis vorliegt, deuten die Ergebnisse darauf hin, dass OpenAI zunehmend nicht-öffentliche Bücher zum Training seiner fortschrittlicheren KI-Modelle verwendet. OpenAI reagierte nicht auf Anfragen zu diesen Vorwürfen.

Mehr zum Thema:

Bleib up-to-date: