Google zeigt neue Video- und Bild-KI Veo 3 und Imagen 4

Google hat sein Angebot im Bereich generativer KI-Tools aktualisiert und erweitert: Neu sind Veo 3, Imagen 4 und das Filmwerkzeug Flow. Veo 3, das neueste Videogenerierungsmodell des Unternehmens, integriert Audiofunktionen wie Dialoge zwischen Charakteren und Umgebungsgeräusche wie Verkehrslärm oder Vogelgesang. Diese Funktion unterscheidet es von Wettbewerbern wie OpenAIs Sora.

Laut Eli Collins, VP bei Google DeepMind, „überzeugt Veo 3 von Text- und Bild-Prompts bis hin zu realistischer Physik und präziser Lippensynchronisation.“ Das Modell ist für Ultra-Abonnenten in den USA sofort über die Gemini-App und für Unternehmensnutzer auf Vertex AI verfügbar.

Neben Veo 3 veröffentlichte Google Imagen 4, sein verbessertes Bildgenerierungsmodell mit höherer Detailqualität und besserer Typografie. Das Unternehmen gibt an, dass es schärfere Bilder mit komplexen Details erzeugt und verschiedene Seitenverhältnisse bis zu 2K-Auflösung unterstützt.

Google stellte außerdem Flow vor, ein „KI-Filmwerkzeug“, das die fortschrittlichen Modelle des Unternehmens kombiniert, um Nutzern zu helfen, filmische Inhalte durch natürlichsprachliche Prompts zu erstellen.

Alle mit diesen neuen Tools erzeugten Inhalte werden mit SynthID-Wasserzeichen versehen, Teil von Googles verantwortungsvollem KI-Ansatz. Das Unternehmen hat auch SynthID Detector eingeführt, ein Überprüfungsportal zur Identifizierung von KI-generierten Inhalten.

Mehr zum Thema:

Bleib up-to-date: