Tests zeigen beeindruckende Leistung von Googles Gemini 2.0 Flash

Der unabhängige Entwickler Simon Willison hat umfangreiche Tests des neuen Gemini 2.0 Flash Modells von Google durchgeführt und die Ergebnisse in seinem Blog dokumentiert. Das Modell zeigte demnach herausragende Fähigkeiten bei der Analyse komplexer Bilder. Bei einem Test mit einem chaotischen Pelikanbild lieferte es etwa präzise Beschreibungen der Vogelarten und ihrer Umgebung. In räumlichen Erkennungstests konnte das Modell erfolgreich Begrenzungsrahmen um mehrere Pelikane in überfüllten Bildern zeichnen.

Die Tests bestätigten auch die Fähigkeit des Modells, Python-Code zu schreiben und auszuführen. Eine wichtige Neuerung ist die Streaming-API, die Echtzeit-Kommunikation mit Audio- und Videoeingabe ermöglicht. Willison testete diese Funktion über die AI Studio-Plattform und bestätigte die Kompatibilität mit Chrome und Mobile Safari.

Die Bild- und Audio-Ausgabefunktionen sind noch nicht öffentlich verfügbar. Sie sollen Anfang 2025 eingeführt werden und versprechen verbesserte Möglichkeiten bei der Bildbearbeitung und Sprachsynthese.

Mehr zum Thema:

Bleib up-to-date:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (2. Ausgabe, September 2025)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklichgewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen