Google hat sein Bildmodell Gemini 2.5 Flash Image, auch bekannt als Nano Banana, allgemein für den produktiven Einsatz freigegeben. Laut dem Unternehmen gehören zu den neuen Funktionen die Unterstützung für zehn verschiedene Bildformate, von Querformat für Filme bis zu vertikalen Formaten, sowie die Möglichkeit, reine Bildausgaben festzulegen.
In einem Beitrag gab Google mehrere Tipps, wie Anwender das in der Gemini-App integrierte Modell optimal nutzen können.
- Konsistenz wahren: Das Modell kann Figuren und Szenen über mehrere Bilder hinweg wiederverwenden. So lassen sich Kleidung, Posen oder Hintergründe ändern, während die Ähnlichkeit der Motive erhalten bleibt.
- Details bearbeiten: Nutzer können bestimmte Elemente in einem Bild mit natürlicher Sprache verändern. Ein Prompt wie „Der Mund des Hundes ist geschlossen“ kann ein Foto anpassen, ohne den Rest der Szene zu beeinflussen. Dies funktioniert auch, um die Farbe eines Objekts zu ändern.
- Kreativ erkunden: Statt komplexer Prompts kann das Modell einfache, dialogorientierte Anweisungen interpretieren. Es ermöglicht auch, bis zu drei separate Bilder zu einer neuen Komposition zu verbinden.
Für Entwickler ist das Modell über die Gemini API in Google AI Studio und Vertex AI zugänglich. Google hob mit dem Werkzeug erstellte Apps hervor, wie eine virtuelle Umkleidekabine und einen Animator, der Bilder in GIFs umwandelt, um dessen Fähigkeiten zu demonstrieren.