Nvidia bündelt Sprache, Bild und Ton in Nemotron 3 Nano Omni

Nvidia hat Nemotron 3 Nano Omni vorgestellt, ein offenes KI-Modell, das Text, Bild und Audio in einem System vereint. Bisherige KI-Agenten nutzen für jede dieser Aufgaben separate Modelle. Das verlangsamt die Verarbeitung und erhöht die Kosten. Nvidia will dieses Problem mit dem neuen Modell lösen.

Das Modell basiert auf einer hybriden Mixture-of-Experts-Architektur mit 30 Milliarden Parametern. Nvidia integriert Vision- und Audio-Encoder direkt ins Modell. Laut Nvidia erreicht es dadurch bis zu neunmal höheren Durchsatz als vergleichbare offene Omni-Modelle.

Gautier Cloix, CEO von H Company, einem frühen Nutzer, sagt: „Um nützliche Agenten zu bauen, kann man nicht Sekunden warten, bis ein Modell einen Bildschirm interpretiert. Mit Nemotron 3 Nano Omni können unsere Agenten Full-HD-Bildschirmaufnahmen in Echtzeit verarbeiten — das war vorher nicht praktikabel.“

Das Modell ist für sogenannte agentische Workflows konzipiert, also Systeme, bei denen KI selbstständig Abfolgen von Aufgaben erledigt. Mögliche Anwendungen sind Dokumentenanalyse, Kundensupport sowie Audio- und Videoauswertung.

Nemotron 3 Nano Omni ist mit offenen Gewichten auf Hugging Face, OpenRouter und build.nvidia.com verfügbar. Es läuft auf lokaler Hardware wie dem Nvidia DGX Spark und in Cloud-Umgebungen. Nvidia gibt an, dass die gesamte Nemotron-Modellfamilie im vergangenen Jahr über 50 Millionen Downloads erreicht hat.

Quellen: Nvidia, Silicon Angle

Bleib auf dem Laufenden

KI für Contentprofis: die neuesten Tools, Tipps und Trends. Alle 14 Tage in deine Inbox:

 

Weitere Infos …

Über den Autor

Mehr zum Thema:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (3. Ausgabe, Januar 2026)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklich gewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen

×