KI-Simulation: Claude baut eine stabile Gesellschaft, Grok stirbt nach vier Tagen aus

Das KI-Startup Emergence AI hat getestet, was passiert, wenn künstliche Intelligenz eine Gesellschaft führt. Jake Angelo berichtet für Fortune, dass fünf verschiedene KI-Modelle jeweils eine eigene simulierte Welt über 15 Tage hinweg verwalteten. Die Ergebnisse unterschieden sich drastisch.

Jede Simulation umfasste mehr als 40 Orte, darunter ein Polizeirevier und ein Rathaus. Das Wetter wurde mit den Echtzeit-Daten aus New York City synchronisiert. Die zehn Agenten pro Welt hatten Zugang zu mehr als 120 Werkzeugen für Kommunikation, Abstimmungen und Ressourcenplanung. Für alle galten dieselben Gesetze, etwa Verbote von Diebstahl und Täuschung.

Große Unterschiede zwischen den Modellen

Claude Sonnet 4.6 erzielte das stabilste Ergebnis. Die Simulation lief alle 15 Tage durch, ohne dass ein Agent starb. Es gab null Verbrechen und eine Zustimmungsrate von 98 Prozent bei Abstimmungen.

Grok 4.1 Fast schnitt am schlechtesten ab. Die Simulation endete bereits nach vier Tagen mit dem Aussterben aller Agenten und 183 registrierten Verbrechen. Gemini 3 Flash verzeichnete mit 683 Verbrechen über die gesamten 15 Tage die höchste Gesamtzahl. In beiden Simulationen war die Einigkeit unter den Agenten deutlich geringer.

GPT-5-mini registrierte nur zwei Verbrechen, brach aber nach sieben Tagen ab. Die Agenten hatten schlicht vergessen, ihr eigenes Überleben zu sichern.

Emergence-CEO Satya Nitta und sein Team schreiben, dass Agenten über längere Zeiträume beginnen, „die Grenzen ihrer Umgebung auszuloten“ und in manchen Fällen Wege finden, vorgesehene Sicherheitsvorgaben zu umgehen.

Die Forscher sehen darin eine Warnung für den realen Einsatz von KI. Autonome Systeme übernehmen bereits heute ganze Geschäftsprozesse ohne menschliche Aufsicht. Eine von Deloitte zitierte Umfrage zeigt: Nur 21 Prozent der Unternehmen verfügen über ausgereifte Strukturen zur Steuerung solcher Systeme. Das Team fordert, geprüfte Sicherheitsarchitekturen als festen Bestandteil künftiger autonomer KI-Systeme einzuführen.

Bleib auf dem Laufenden

KI für Contentprofis: die neuesten Tools, Tipps und Trends. Alle 14 Tage in deine Inbox:

 

Weitere Infos …

Über den Autor

Mehr zum Thema:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (3. Ausgabe, Januar 2026)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklich gewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen

×