Google DeepMind präsentiert umfangreiche Updates für seine Videoplattform Flow. Die Neuerungen umfassen das Modell Veo 3.1 und erweiterte kreative Steuerungsmöglichkeiten. Jess Gallegos und Thomas Iljic berichten im offiziellen Google Blog.
Nutzer haben seit dem Start vor fünf Monaten über 275 Millionen Videos mit Flow erstellt. Die aktuellen Updates reagieren auf Nutzerwünsche nach mehr künstlerischer Kontrolle und umfassender Audiounterstützung.
Veo 3.1 bietet demnach detailreicheren Sound, verbesserte narrative Kontrolle und gesteigerten Realismus mit lebensechten Texturen. Das Modell soll Textvorgaben besser folgen und die audiovisuelle Qualität bei der Umwandlung von Bildern in Videos soll ebenfalls verbessert sein.
Mehrere bestehende Funktionen verfügen nun über generiertes Audio. „Ingredients to Video“ ermöglicht die Kombination mehrerer Referenzbilder zur Steuerung von Charakteren, Objekten und Stil. „Frames to Video“ erzeugt nahtlose Übergänge zwischen Start- und Endbild. Die „Extend“-Funktion erstellt längere Videos von bis zu einer Minute, indem sie die Handlung aus der letzten Sekunde eines Clips fortsetzt.
Neue Bearbeitungswerkzeuge ermöglichen präzisere Anpassungen. Das „Insert“-Tool fügt Elemente in Szenen ein. Flow berechnet dabei automatisch komplexe Details wie Schatten und Beleuchtung. Eine kommende Funktion erlaubt das Entfernen unerwünschter Objekte oder Personen. Flow rekonstruiert dann den Hintergrund nahtlos.
Das Modell Veo 3.1 steht über die Gemini API für Entwickler, Vertex AI für Unternehmenskunden und die Gemini App zur Verfügung.
