Google veröffentlicht Tipps für bessere Bilderzeugung mit Gemini

Google DeepMind erklärt in einem neuen Beitrag, wie Nutzer die verbesserte Bilderzeugung in Gemini optimal nutzen können. Produktmanagerin Naina Raisinghani teilte konkrete Strategien für wirksamere Eingaben mit dem aktualisierten Modell.

Das Unternehmen empfiehlt sechs wichtige Elemente in Eingaben: Motiv, Komposition, Handlung, Ort, Stil und Bearbeitungsanweisungen. Nutzer sollten bei der Motivbeschreibung spezifisch und bei Änderungswünschen direkt sein.

Google beschrieb fünf Haupttechniken für effektive Nutzung. Nutzer können Charakterkonsistenz über mehrere Bilder durch klare Anfangsbeschreibungen erreichen. Das System ermöglicht präzise Bearbeitungen durch natürliche Befehle ohne Neuerstellung ganzer Szenen.

Kreative Komposition erlaubt die Verschmelzung mehrerer Konzepte in einzelne Bilder. Stil-Transfer kann die Ästhetik vollständig ändern und dabei das ursprüngliche Motiv bewahren. Das Modell kann auch logisch schlussfolgern und realistische Entwicklungen vorhersagen.

Google räumte aktuelle Schwächen bei Stilisierung, Textdarstellung und Seitenverhältnissen ein.

Über den Autor

Mehr zum Thema:

Bleib up-to-date:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (2. Ausgabe, September 2025)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklichgewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen