Ein neues KI-Modell namens Infinity generiert realistische sprechende Charaktere. Es basiert auf einem Video-Diffusions-Transformer, der mit Audioeingaben trainiert wurde. Laut der Entwickler ist es das erste Modell dieser Art. Nutzer können ihre Skripte eingeben und erhalten daraus Videos mit animierten Figuren, die den Text sprechen. Es kann verschiedene Sprachen verarbeiten, animiert auch Gemälde oder Skulpturen und beherrscht sogar Gesang. Allerdings gibt es noch Schwächen bei Tieren, Cartoons und der Darstellung bekannter Persönlichkeiten. Die jetzige Version ist bei alldem nur ein Zwischenstand, denn das Modell wird weiter aktiv trainiert, erklärten die Entwickler auf Hacker News. Weitere Informationen sowie Beispielvideos finden sich in diesem Blogpost.
Infinity generiert sprechende Charaktere
Über den Autor
Bleib up-to-date:
Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (2. Ausgabe, September 2025)
Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklichgewinnbringend für deine Arbeit ein?
Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.