Google zeigt KI-Videogenerator Veo 2

Google DeepMind hat sein neuestes KI-Videogenerierungsmodell Veo 2 als direkten Konkurrenten zu OpenAIs Sora vorgestellt. Das neue Modell ist derzeit über Googles Labs‘ VideoFX-Plattform verfügbar, wobei der Zugang über eine Warteliste und Anmeldung über ein Google-Formular erfolgt.

Laut Google kann Veo 2 Videos mit einer Länge von bis zu zwei Minuten in Auflösungen bis zu 4K (4096 x 2160 Pixel) generieren, wobei die aktuelle Implementierung in VideoFX die Ausgabe auf 720p-Auflösung und acht Sekunden beschränkt. Das Unternehmen gibt an, dass das Modell ein verbessertes Verständnis von realer Physik, menschlicher Bewegung und kinematografischer Kontrolle bietet, einschließlich der Möglichkeit, Genres, Objektive und filmische Effekte zu spezifizieren.

Das neue Modell beinhaltet mehrere technische Verbesserungen gegenüber seinem Vorgänger, insbesondere in Bereichen wie Bewegungsdarstellung, Fluiddynamik und Lichteigenschaften. Google erklärt, dass Veo 2 realistischere Texturen und schärfere Bilder erzeugt, besonders in Szenen mit viel Bewegung. Das Unternehmen berichtet, dass in internen Tests menschliche Bewerter die Ausgaben von Veo 2 gegenüber konkurrierenden Modellen, einschließlich Sora, in Bezug auf allgemeine Präferenz und Prompt-Genauigkeit bevorzugten.

Um potenziellem Missbrauch vorzubeugen, hat Google seine SynthID-Wasserzeichentechnologie implementiert, um KI-generierte Inhalte zu kennzeichnen. Das Unternehmen räumt ein, dass Veo 2 zwar einen Fortschritt in der Videogenerierung darstellt, aber weiterhin Herausforderungen mit Halluzinationen bestehen, wie falschen anatomischen Merkmalen sowie Schwierigkeiten mit der Konsistenz in komplexen Szenen.

Die Veröffentlichung erfolgt inmitten zunehmenden Wettbewerbs im Bereich der KI-Videogenerierung, wobei verschiedene Unternehmen wie RunwayML, Pika Labs und Luma AI ihre eigenen Lösungen auf den Markt bringen. Während einige Filmemacher und Kreative beginnen, diese Technologien zu nutzen, bleibt in der kreativen Gemeinschaft Skepsis hinsichtlich der Konsistenz und Zuverlässigkeit KI-generierter Videoinhalte bestehen.

Quellen: Google DeepMind, VentureBeat, TechCrunch

Mehr zum Thema:

Bleib up-to-date: