Google hat sein KI-Werkzeug Gemini um eine neue Funktion erweitert, die Fotos in acht Sekunden lange Videos mit Ton umwandeln kann. Dies gab David Sharon in einem offiziellen Blogbeitrag bekannt. Er ist bei Google für die multimodale Generierung in den Gemini Apps verantwortlich.
Die Funktion basiert auf Veo 3, Googles neuestem Modell zur Videogenerierung. Anwender können ein Foto hochladen und mit einer Texteingabe die gewünschte Animation und den Ton beschreiben. Gemini erstellt daraus ein dynamisches Video aus dem statischen Bild. Die Foto-zu-Video-Funktion wird schrittweise für Abonnenten von Google AI Pro und Ultra in ausgewählten Ländern eingeführt. Laut Google enthalten alle generierten Videos sichtbare und unsichtbare Wasserzeichen, um sie als KI-Inhalte zu kennzeichnen.