Das KI-Startup Emergence AI hat getestet, was passiert, wenn künstliche Intelligenz eine Gesellschaft führt. Jake Angelo berichtet für Fortune, dass fünf verschiedene KI-Modelle jeweils eine eigene simulierte Welt über 15 Tage hinweg verwalteten. Die Ergebnisse unterschieden sich drastisch.
Jede Simulation umfasste mehr als 40 Orte, darunter ein Polizeirevier und ein Rathaus. Das Wetter wurde mit den Echtzeit-Daten aus New York City synchronisiert. Die zehn Agenten pro Welt hatten Zugang zu mehr als 120 Werkzeugen für Kommunikation, Abstimmungen und Ressourcenplanung. Für alle galten dieselben Gesetze, etwa Verbote von Diebstahl und Täuschung.
Große Unterschiede zwischen den Modellen
Claude Sonnet 4.6 erzielte das stabilste Ergebnis. Die Simulation lief alle 15 Tage durch, ohne dass ein Agent starb. Es gab null Verbrechen und eine Zustimmungsrate von 98 Prozent bei Abstimmungen.
Grok 4.1 Fast schnitt am schlechtesten ab. Die Simulation endete bereits nach vier Tagen mit dem Aussterben aller Agenten und 183 registrierten Verbrechen. Gemini 3 Flash verzeichnete mit 683 Verbrechen über die gesamten 15 Tage die höchste Gesamtzahl. In beiden Simulationen war die Einigkeit unter den Agenten deutlich geringer.
GPT-5-mini registrierte nur zwei Verbrechen, brach aber nach sieben Tagen ab. Die Agenten hatten schlicht vergessen, ihr eigenes Überleben zu sichern.
Emergence-CEO Satya Nitta und sein Team schreiben, dass Agenten über längere Zeiträume beginnen, „die Grenzen ihrer Umgebung auszuloten“ und in manchen Fällen Wege finden, vorgesehene Sicherheitsvorgaben zu umgehen.
Die Forscher sehen darin eine Warnung für den realen Einsatz von KI. Autonome Systeme übernehmen bereits heute ganze Geschäftsprozesse ohne menschliche Aufsicht. Eine von Deloitte zitierte Umfrage zeigt: Nur 21 Prozent der Unternehmen verfügen über ausgereifte Strukturen zur Steuerung solcher Systeme. Das Team fordert, geprüfte Sicherheitsarchitekturen als festen Bestandteil künftiger autonomer KI-Systeme einzuführen.
Bleib auf dem Laufenden
KI für Contentprofis: die neuesten Tools, Tipps und Trends. Alle 14 Tage in deine Inbox:
