Führende KI-Forscher uneins über die Definition eines „World Model“

In der KI werben führende Persönlichkeiten und Unternehmen wie Fei-Fei Li von World Labs, Yann LeCun von Meta und Google DeepMind für sogenannte „World Models“. Der Begriff beschreibt jedoch drei grundlegend verschiedene Technologien, was zunehmend für Verwirrung sorgt. Eine Analyse von Entropy Town erklärt, dass jede Gruppe etwas anderes unter einem Weltmodell versteht.

Ursprünglich stammt der Begriff aus der Kognitionswissenschaft. Er beschreibt die Fähigkeit des Gehirns, eine interne Simulation der Realität zu erstellen, um Ereignisse vorherzusagen und Handlungen zu planen. In der KI wird der Begriff heute mehrdeutig verwendet.

World Labs

World Labs, das von der Stanford-Professorin Fei-Fei Li geleitete Startup, hat mit Marble ein Produkt vorgestellt, das laut der Analyse ein „Weltmodell als Benutzeroberfläche“ darstellt. Marble erzeugt aus Texteingaben oder Bildern statische, begehbare 3D-Szenen. Dafür nutzt es eine Technik namens Gaussian Splatting. Es ist vor allem ein Werkzeug für Menschen, um 3D-Inhalte für Spiele oder virtuelle Realität zu erstellen, und kein System, mit dem eine KI selbstständig denkt.

Meta

Yann LeCun, der Chefwissenschaftler für KI bei Meta, versteht unter dem Begriff hingegen ein „Weltmodell als Kognition“. Sein Ansatz konzentriert sich auf die Entwicklung eines internen, vorausschauenden Gehirns für einen KI-Agenten. Dieses Modell erzeugt keine Bilder für den Nutzer. Stattdessen lernt es ein komprimiertes, inneres Verständnis der Welt, um die Folgen von Handlungen zu antizipieren und zu planen.

Google DeepMind

Google DeepMind verfolgt einen dritten Weg, den Entropy Town als „Weltmodell als Simulator“ bezeichnet. Das Modell Genie kann aus Textanweisungen interaktive, videospielähnliche Welten erschaffen. In diesen Simulationen kann ein KI-Agent wie SIMA von DeepMind trainieren, physikalische Gesetze lernen und Anweisungen befolgen. Das Weltmodell wird hier zu einem virtuellen Trainingsplatz, auf dem eine KI Fähigkeiten erlernt, bevor sie in der echten Welt eingesetzt wird.

Diese drei Ansätze, eine Schnittstelle für Menschen, ein internes Gehirn für Agenten und ein Trainingssimulator, werden alle mit demselben Begriff beworben. Die Analyse stellt fest, dass die Finanzierung dieser Projekte ironischerweise erst durch den Erfolg von Sprachmodellen wie ChatGPT ermöglicht wurde.

Über den Autor

Mehr zum Thema:

Bleib up-to-date:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (2. Ausgabe, September 2025)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklichgewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen