Google DeepMind Genie 2 generiert interaktive 3D-Umgebungen

DeepMind hat Genie 2 vorgestellt, ein künstliches Intelligenz-Modell, das aus einzelnen Bildern und Textbeschreibungen spielbare 3D-Umgebungen erschaffen kann. Es stellt eine Weiterentwicklung gegenüber seinem Vorgänger Genie 1 dar, der auf 2D-Welten beschränkt war.

Laut DeepMind kann Genie 2 interaktive Umgebungen generieren, die auf Tastatur- und Mauseingaben reagieren und es Benutzern oder KI-Agenten ermöglichen, Charaktere innerhalb der generierten Welten zu steuern. Das Modell demonstriert Fähigkeiten wie Objektinteraktionen, Charakteranimationen, Physiksimulationen und Lichteffekte, wobei die Umgebungen bis zu einer Minute lang konsistent bleiben.

Das Unternehmen positioniert Genie 2 hauptsächlich als Forschungs- und Prototyping-Werkzeug, insbesondere für das Training und die Evaluierung von KI-Agenten. Das Modell wurde mit Videodatensätzen trainiert und verwendet einen autoregressiven latenten Diffusionsansatz, wobei DeepMind keine spezifischen Details über die Trainingsdatenquellen offengelegt hat. Während die Technologie vielversprechend ist, bestehen aktuelle Einschränkungen in der kurzen Dauer der generierten Umgebungen und möglichen urheberrechtlichen Überlegungen bezüglich der Trainingsdaten.

Quellen: Google DeepMind, TechCrunch

Mehr zum Thema:

Bleib up-to-date:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (2. Ausgabe, September 2025)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklichgewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen