OpenAI hat Sora 2 veröffentlicht, eine aktualisierte Version seines Text-zu-Video-Modells. Gleichzeitig startet das Unternehmen eine neue soziale App für iOS mit dem Namen „Sora“. Dies ist der bisher größte Schritt des Unternehmens in den Bereich sozialer Anwendungen, mit der Nutzer KI-generierte Videos erstellen und teilen können. Die App ist zunächst auf Einladungsbasis in den USA und Kanada verfügbar.
Das neue Modell Sora 2
Laut einem Blogbeitrag des Unternehmens stellt Sora 2 einen großen Fortschritt gegenüber der ersten Version vom Februar 2024 dar. OpenAI behauptet, das neue Modell sei physikalisch genauer und könne Szenen erzeugen, die den Gesetzen der Physik besser gehorchen. Wenn beispielsweise ein generierter Basketballspieler einen Wurf verfehlt, prallt der Ball realistisch vom Korbbrett ab, anstatt unnatürlich in den Korb zu teleportieren.
Sora 2 integriert zudem synchronisierten Ton, einschließlich Dialogen, Soundeffekten und Hintergrundgeräuschen. Das Unternehmen gibt an, das Modell sei besser steuerbar und könne komplexe Prompts umsetzen, um realistische, filmische oder Anime-Stil-Videos zu erstellen. OpenAI verglich den Fortschritt mit dem Sprung von GPT-1 zu GPT-3.5 bei seinen Sprachmodellen.
Die soziale App „Sora“ und Cameos
Die neue Sora-App konzentriert sich auf eine Funktion namens „Cameos“. Nutzer können ein kurzes Video von sich aufnehmen, um ein digitales Abbild zu erstellen, das dann in jede KI-generierte Szene eingefügt werden kann. Das Unternehmen betont die Kontrolle der Nutzer über diese Funktion:
- Nutzer entscheiden, ob Freunde ihr Cameo verwenden dürfen.
- Sie erhalten eine Benachrichtigung, wenn ihr Cameo verwendet wird.
- Sie haben die Möglichkeit, jedes Video mit ihrem Abbild zu genehmigen oder zu löschen.
Die App erlaubt es Nutzern auch, die Kreationen anderer zu „remixen“, indem sie den Text-Prompt ändern oder ihr eigenes Cameo hinzufügen. OpenAI erklärte, das Ziel sei eine soziale Plattform, die Kreativität und die Verbindung zwischen Freunden fördert, anstatt passiven Konsum.
OpenAI hat mehrere Sicherheitsmaßnahmen für die App vorgestellt. Mit Sora erstellte Videos werden durch digitale Zertifikate und sichtbare Wasserzeichen als KI-generiert gekennzeichnet. Das Unternehmen bietet über ChatGPT eine Kindersicherung an, um Einstellungen für jugendliche Nutzer zu verwalten, etwa zur Bildschirmzeit oder für Direktnachrichten. Laut Axios besteht der Ansatz von OpenAI zum Urheberrecht darin, dass Rechteinhaber die Entfernung verletzender Inhalte beantragen müssen, ähnlich wie bei der Bilderzeugung.
Der Zugang zur App wird schrittweise freigeschaltet. Frühe Nutzer des ursprünglichen Sora werden bevorzugt, gefolgt von Abonnenten von ChatGPT Pro, Plus und Team und schließlich kostenlosen Nutzern. Der Dienst ist anfangs mit gewissen Einschränkungen kostenlos.