Googles neustes KI-Modell Gemini 3 geht weit über die Fähigkeiten von Chatbots hinaus. Das Modell agiert als ein „Agent“, der komplexe Ziele verstehen und mehrstufige Aufgaben auf einem Computer selbstständig ausführen kann. Ethan Mollick berichtet in seinem Substack-Newsletter „One Useful Thing“ über seine Tests mit dem neuen System. Sein Fazit ist, dass sich KI von einem Werkzeug, das Konzepte beschreibt, zu einem Werkzeug entwickelt, das diese Konzepte umsetzen kann.
Mollick verdeutlicht diesen Fortschritt an einem Beispiel. Vor drei Jahren konnte eine KI ein Gedicht über eine Fantasie-Idee schreiben. Mit der gleichen Anweisung erstellte Gemini 3 ein voll spielbares Computerspiel. Dies ist möglich, da das Modell Code schreiben und ausführen kann. Es kann auf Anweisungen in normaler Sprache hin auf Dateien zugreifen, im Internet recherchieren oder Webseiten erstellen.
In einem Test beauftragte Mollick die KI, all seine bisherigen Artikel zu analysieren, seine Prognosen zu identifizieren, deren Richtigkeit online zu prüfen und eine Webseite mit den Ergebnissen zu bauen. Die KI plante das Projekt und führte es aus, wobei sie für wichtige Schritte eine Freigabe einholte. Mollick verglich die Zusammenarbeit mit der Leitung eines menschlichen Mitarbeiters.
In einem weiteren Versuch analysierte das Modell einen Ordner mit unstrukturierten Forschungsdaten und erstellte daraus eine 14-seitige wissenschaftliche Arbeit mit eigenen Hypothesen.
Mollick betont, dass die KI weiterhin menschliche Aufsicht benötigt. Die Rolle des Nutzers wandle sich jedoch vom Korrigieren von Fehlern zum Anleiten eines fähigen digitalen Assistenten.
