Google hat Gemini 2.0 vorgestellt, sein neuestes KI-Modell, das bedeutende Fortschritte in multimodalen Fähigkeiten und autonomen Agentenfunktionen bietet. Die experimentelle Version, Gemini 2.0 Flash, wird zunächst Entwicklern und ausgewählten Testern über Googles KI-Plattformen zur Verfügung gestellt.
Laut Google kann das neue Modell Text, Bilder und mehrsprachiges Audio generieren und arbeitet dabei doppelt so schnell wie sein Vorgänger, Gemini 1.5 Pro. Das Unternehmen gibt an, dass 2.0 Flash native externe Werkzeuge wie Google Search und Code-Ausführung nutzen kann, was komplexere Aufgaben ermöglicht. Während das Basismodell sofort verfügbar ist, sind Bildgenerierung und Audiofunktionen bis zur breiteren Veröffentlichung im Januar 2025 auf erste Zugangspartner beschränkt.
Die Ankündigung stellt drei wichtige Forschungsprototypen vor, die auf Gemini 2.0 aufbauen: Project Astra, Project Mariner und Jules. Project Astra funktioniert als universeller KI-Assistent mit verbesserten Dialogfähigkeiten und Werkzeugintegration. Project Mariner, implementiert als Chrome-Erweiterung, kann Weboberflächen navigieren und Online-Aufgaben ausführen, wobei es laut Google eine Erfolgsquote von 83,5% bei Benchmark-Tests erreicht. Jules ist für die Unterstützung von Entwicklern bei Programmieraufgaben konzipiert.
Google betont seinen Fokus auf verantwortungsvolle KI-Entwicklung und implementiert Sicherheitsmaßnahmen wie SynthID-Wasserzeichen für synthetische Inhalte und umfangreiche Testprotokolle. Das Unternehmen berichtet, dass Gemini 2.0 verbesserte Sicherheitstrainings und automatisierte Risikobewertungssysteme enthält, um potenzielle Missbrauchsrisiken zu adressieren.
Die Veröffentlichung repräsentiert Googles strategische Wendung hin zu „agentischen“ KI-Systemen, die unter Benutzeraufsicht autonome Aufgaben ausführen können. Diese Entwicklung positioniert Google in direkter Konkurrenz zu anderen KI-Unternehmen wie OpenAI und Anthropic im sich schnell entwickelnden Markt für künstliche Intelligenz.
Die technische Infrastruktur hinter Gemini 2.0 umfasst Trillium, Googles Tensor Processing Unit (TPU) der sechsten Generation, die nun Cloud-Kunden zur Verfügung steht. Google berichtet, dass Trillium-Chips exklusiv sowohl für das Training als auch für die Inferenz des neuen Modells verwendet wurden, was das Engagement des Unternehmens in kundenspezifische KI-Hardware demonstriert.
Quellen: Google, TechCrunch, VentureBeat, Bloomberg, The Verge, The Verge