Google Gemini 3 Flash verspricht das Ende des Kompromisses zwischen Leistung und Kosten

Google hat Gemini 3 Flash veröffentlicht und positioniert das Modell als Lösung für einen Kompromiss in der künstlichen Intelligenz zwischen Geschwindigkeit und Leistungsfähigkeit. Das Modell kombiniert laut Google Reasoning auf Doktorandenniveau mit höheren Verarbeitungsgeschwindigkeiten und niedrigeren Kosten im Vergleich zu größeren Modellen.

Gemini 3 Flash ist jetzt das Standard-Modell in der Gemini App weltweit und ersetzt das bisherige Gemini 2.5 Flash. Google erklärt, dass das Modell allen Gemini Nutzern kostenlos zur Verfügung steht. Das Modell wird auch als Standard im AI Mode in Google Search ausgerollt.

Nach Angaben von Google erreicht Gemini 3 Flash 90,4 Prozent im GPQA Diamond Benchmark und 33,7 Prozent ohne Tools im Humanity’s Last Exam. Beide Benchmarks testen Wissen und Reasoning auf Expertenniveau. Das Unternehmen berichtet, dass das Modell 81,2 Prozent im MMMU Pro erreicht, einem multimodalen Benchmark. Damit entspricht es der Leistung von Gemini 3 Pro in diesem Test.

Im SWE-bench Verified Coding Benchmark erzielt Gemini 3 Flash 78 Prozent. Google gibt an, dass dies sowohl die Gemini 2.5 Serie als auch das größere Gemini 3 Pro Modell übertrifft. Harvey, eine KI-Plattform für Anwaltskanzleien, berichtet, dass das Modell eine Verbesserung beim Reasoning von 7 Prozent in ihrem internen BigLaw Bench im Vergleich zu Gemini 2.5 Flash erreichte.

Die unabhängige Benchmarking-Firma Artificial Analysis verzeichnete einen Durchsatz von 218 Output Tokens pro Sekunde für Gemini 3 Flash. Die Firma stellt fest, dass das Modell damit 22 Prozent langsamer ist als das Gemini 2.5 Flash ohne Reasoning, aber deutlich schneller als Wettbewerber wie GPT-5.1 high mit 125 Tokens pro Sekunde. Google behauptet, das Modell sei dreimal schneller als Gemini 2.5 Pro.

Das Modell nutzt laut Google variable Thinking Level. Dies erlaubt es, den Rechenaufwand basierend auf der Aufgabenkomplexität anzupassen. Google erklärt, dass Gemini 3 Flash durchschnittlich 30 Prozent weniger Tokens verwendet als Gemini 2.5 Pro für typische Aufgaben.

Der Preis liegt bei 0,50 Dollar pro Million Input Tokens und 3 Dollar pro Million Output Tokens über die Gemini API. Dies ist ein höherer Basispreis als bei Gemini 2.5 Flash mit 0,30 Dollar pro Million Input Tokens und 2,50 Dollar pro Million Output Tokens. Google argumentiert jedoch, dass die reduzierte Token-Nutzung bei vielen Aufgaben zu insgesamt niedrigeren Kosten führen kann.

Für Entwickler ist Gemini 3 Flash über Google AI Studio, Vertex AI, Google Antigravity, Gemini CLI und Android Studio verfügbar. Das Modell enthält Standard Context Caching. Google gibt an, dass dies die Kosten um 90 Prozent für Anfragen mit wiederholtem Inhalt reduzieren kann. Eine Batch API Option bietet 50 Prozent Kostenersparnis für asynchrone Verarbeitung.

Resemble AI berichtet, dass Gemini 3 Flash viermal schnellere multimodale Analysen im Vergleich zu Gemini 2.5 Pro für Deepfake Detection Workflows liefert. Unternehmen wie JetBrains, Bridgewater Associates, Figma, Cursor, Latitude und Warp haben begonnen, das Modell zu nutzen.

Tulsee Doshi, Senior Director Product für Gemini Models bei Google, erklärt, dass das Unternehmen Flash als Workhorse Modell positioniert, das sich aufgrund seiner Preisstruktur für Bulk Tasks eignet. Google berichtet, dass seit der Veröffentlichung von Gemini 3 über eine Billion Tokens pro Tag über die API verarbeitet werden.

Quellen: Google Blog, Google Blog, Google Blog, TechCrunch, VentureBeat

Über den Autor

Mehr zum Thema:

Bleib up-to-date:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (2. Ausgabe, September 2025)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklichgewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen