Google hat Imagen 4 veröffentlicht, sein neuestes KI-Modell zur Bilderzeugung aus Textbeschreibungen. Das Modell ist zunächst nur über die Gemini API und Google AI Studio verfügbar. Die Ankündigung erfolgte im offiziellen Google Developer Blog.
Das Unternehmen bietet zwei Modellvarianten an:
- Imagen 4 dient als Hauptmodell für allgemeine Bildgenerierung und kostet 0,04 Dollar pro Bild.
- Imagen 4 Ultra konzentriert sich auf präzise Umsetzung von Anweisungen und kostet 0,06 Dollar pro generiertem Bild.
Google erklärt, Imagen 4 biete deutliche Verbesserungen bei der Darstellung von Text in Bildern. Die Ultra-Variante soll Ergebnisse liefern, die genauer den Nutzervorgaben entsprechen.
Die Modelle stehen derzeit als kostenpflichtige Vorschauversion über die Gemini API zur Verfügung. In Google AI Studio gibt es begrenzte kostenlose Tests. Google plant zusätzliche Abrechnungsmodelle und höhere Nutzungslimits in den kommenden Wochen.
Alle von Imagen 4 erzeugten Bilder enthalten ein unsichtbares SynthID-Wasserzeichen. Google zeigte die Fähigkeiten mit Beispielen wie Comic-Panels, Vintage-Postkarten und Modefotografie.
Das Unternehmen demonstrierte die Vielseitigkeit des Modells bei verschiedenen Kunststilen. Die Beispiele umfassten komplexe mehrteilige Comics mit eingebettetem Text und detaillierte Landschaftsaufnahmen.
Google erwartet, die Modelle in den kommenden Wochen allgemein verfügbar zu machen. Imagen 4 könnte dabei ein direkter Konkurrent für ChatGPTs Bildgenerierung sein, die mit ihren Fähigkeiten für viel Aufsehen gesorgt hat.