Infinity generiert sprechende Charaktere

Ein neues KI-Modell namens Infinity generiert realistische sprechende Charaktere. Es basiert auf einem Video-Diffusions-Transformer, der mit Audioeingaben trainiert wurde. Laut der Entwickler ist es das erste Modell dieser Art. Nutzer können ihre Skripte eingeben und erhalten daraus Videos mit animierten Figuren, die den Text sprechen. Es kann verschiedene Sprachen verarbeiten, animiert auch Gemälde oder Skulpturen und beherrscht sogar Gesang. Allerdings gibt es noch Schwächen bei Tieren, Cartoons und der Darstellung bekannter Persönlichkeiten. Die jetzige Version ist bei alldem nur ein Zwischenstand, denn das Modell wird weiter aktiv trainiert, erklärten die Entwickler auf Hacker News. Weitere Informationen sowie Beispielvideos finden sich in diesem Blogpost.

Bleib auf dem Laufenden

Mehr zum Thema: