Google hat das KI-Modell Gemini 3.1 Flash-Lite vorgestellt. Es richtet sich an Entwickler, die viele Aufgaben gleichzeitig und kostengünstig verarbeiten wollen. Das Gemini Team schreibt im Google Blog, dass das Modell ab sofort als Vorschauversion über die Gemini API, Google AI Studio und Vertex AI verfügbar ist.
Der Preis liegt bei 0,25 US-Dollar pro Million Eingabe-Token und 1,50 US-Dollar pro Million Ausgabe-Token. Laut dem Artificial Analysis Benchmark liefert das Modell seine erste Antwort 2,5-mal schneller als das Vorgängermodell Gemini 2.5 Flash. Die Ausgabegeschwindigkeit liegt 45 Prozent höher.
Auf der Arena.ai-Bestenliste erreicht 3.1 Flash-Lite einen Elo-Score von 1.432. Bei den Benchmarks GPQA Diamond und MMMU Pro erzielt es 86,9 beziehungsweise 76,8 Prozent. Damit übertrifft es vergleichbare Konkurrenzmodelle und sogar einige größere ältere Gemini-Modelle.
Ein besonderes Merkmal sind einstellbare Denkstufen. Entwickler können steuern, wie viel Rechenaufwand das Modell für eine Aufgabe betreibt. Das ist nützlich für häufig wiederkehrende Aufgaben wie Übersetzungen oder Inhaltsmoderation. Auch komplexere Aufgaben wie das Erstellen von Benutzeroberflächen sind möglich.
