KI verliert durch synthetische Trainingsdaten an Qualität

KI-Systeme zeigen zunehmend Qualitätsverluste aufgrund der übermäßigen Nutzung synthetischer Trainingsdaten. Dies beschreibt Rick Song, CEO von Persona, in einem Artikel für VentureBeat. Das als „Modellkollaps“ bekannte Phänomen tritt auf, wenn KI-Systeme wiederholt mit künstlich erzeugten statt menschlich erstellten Daten trainiert werden. Eine in Nature veröffentlichte Studie zeigt, dass Sprachmodelle nach neun Trainingsiterationen mit synthetischen Daten vollständig degenerieren. Die Folgen können schwerwiegend sein, besonders in kritischen Anwendungsbereichen. Song empfiehlt Unternehmen, in Werkzeuge zur Datenherkunftsverfolgung zu investieren, KI-Erkennungsfilter einzusetzen und mit vertrauenswürdigen Datenanbietern zusammenzuarbeiten. Zusätzlich sollten Nutzer geschult werden, synthetische Inhalte zu erkennen.

Über den Autor

Mehr zum Thema:

Bleib up-to-date:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (2. Ausgabe, September 2025)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklichgewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen