ByteDance hat ein neues KI-System entwickelt, das aus einzelnen Fotos realistische Videos erzeugen kann. Das System mit dem Namen OmniHuman generiert Videos von Menschen, die sprechen, singen und sich natürlich bewegen, berichtet VentureBeat. Die Entwickler trainierten die KI mit mehr als 18.700 Stunden Videomaterial, wie aus einer auf arXiv veröffentlichten Forschungsarbeit hervorgeht. Das Besondere an OmniHuman ist die Kombination verschiedener Eingabesignale wie Text, Audio und Bewegungsdaten. Dieser Ansatz ermöglicht es dem System, aus umfangreicheren und vielfältigeren Datensätzen zu lernen als bisherige Methoden. Während die Technologie neue Möglichkeiten für digitale Unterhaltung und Kommunikation eröffnet, warnen Experten vor möglichem Missbrauch zur Erstellung täuschend echter synthetischer Medien.
ByteDance OmniHuman erstellt realistische Videos aus einem einzigen Foto
Schlagwörter: Video