Google hat bedeutende Updates für seine Gemini-KI-Modellreihe angekündigt, darunter neue Funktionen und Leistungsverbesserungen. Das Unternehmen präsentierte Gemini 2.5 Pro mit „Deep Think“, einem experimentellen Modus für verbessertes Reasoning, sowie ein verbessertes 2.5 Flash-Modell, das bessere Leistung bei geringerem Ressourcenverbrauch bietet.
Gemini 2.5 Pro und Deep Think
Laut Google führt Gemini 2.5 Pro weiterhin im Bereich Coding und steht nun an der Spitze mehrerer Benchmark-Ranglisten, darunter WebDev Arena mit einem ELO-Score von 1415 und alle Kategorien von LMArena, das KI anhand menschlicher Präferenzen bewertet.
Der neue experimentelle „Deep Think“-Modus ermöglicht es dem Modell, mehrere Hypothesen zu prüfen, bevor es antwortet. Google berichtet von beeindruckenden Ergebnissen bei schwierigen Benchmarks:
- Starke Leistung bei der USA Mathematical Olympiad (USAMO) 2025
- Führungsposition bei LiveCodeBench für Programmierung auf Wettbewerbsniveau
- 84,0% Punktzahl bei MMMU, das multimodales Verständnis und Reasoning testet
Derzeit ist Deep Think nur ausgewählten Testern über die Gemini API zugänglich, während Google zusätzliche Sicherheitsbewertungen durchführt.
Verbesserungen bei Gemini 2.5 Flash
Das aktualisierte Gemini 2.5 Flash, das für Effizienz und Geschwindigkeit konzipiert wurde, bietet Verbesserungen in den Bereichen Reasoning, Multimodalität, Coding und Verständnis langer Kontexte. Google gibt an, dass das Modell 20-30% effizienter arbeitet und bei Auswertungen weniger Tokens verwendet, während es eine hohe Leistung beibehält.
Das neue 2.5 Flash ist jetzt in Google AI Studio für Entwickler, Vertex AI für Unternehmensnutzer und in der Gemini-App für Verbraucher verfügbar, wobei die allgemeine Verfügbarkeit für Anfang Juni geplant ist.
Neue Funktionen in der Gemini-Familie
Beide Modelle erhalten neue Funktionen:
Native Audio-Ausgabe: Die Live API bietet jetzt audiovisuelle Eingabe und native Audio-Ausgabe für natürlichere Gesprächserlebnisse. Nutzer können Tonfall, Akzent und Sprechstil steuern.
Text-to-Speech: Neue Text-to-Speech-Funktionen unterstützen mehrere Sprecher in über 24 Sprachen mit der Fähigkeit, Nuancen wie Flüstern zu erfassen.
Project Mariner: Computer-Nutzungsfunktionen werden in die Gemini API und Vertex AI integriert, wodurch Modelle mit Computersystemen interagieren können.
Verbesserte Sicherheit: Google berichtet von erheblichen Verbesserungen beim Schutz vor Sicherheitsbedrohungen wie indirekten Prompt-Injection-Angriffen.
Verbesserungen der Entwicklererfahrung: Neue Funktionen umfassen Thought Summaries für ein besseres Verständnis der Reasoning-Prozesse und Thinking Budgets, die es Entwicklern ermöglichen, den Token-Verbrauch zu kontrollieren.
Neue Abo-Stufen
Google führt auch zwei Abonnement-Pläne ein:
- Google AI Pro (19,99 $/Monat): Ersetzt und erweitert Gemini Advanced mit höheren Ratenlimits und speziellen Funktionen.
- Google AI Ultra (249,99 $/Monat, nur USA): Bietet Zugang zu den leistungsstärksten Modellen, höchsten Ratenlimits und frühen Zugang zu experimentellen KI-Produkten, einschließlich Deep Think nach dessen Einführung.
Quellen: Google, Google, VentureBeat