Nvidia hat ein leistungsstarkes Open-Source-KI-Modell veröffentlicht, das augenscheinlich mit proprietären Systemen führender Unternehmen wie OpenAI und Google konkurrieren kann. Das als NVLM 1.0 bezeichnete Modell zeigt herausragende Leistungen bei Bild- und Sprachaufgaben und verbessert zudem die reinen Textfähigkeiten. Michael Nuñez berichtet darüber für VentureBeat.
Das Hauptmodell NVLM-D-72B mit 72 Milliarden Parametern kann komplexe visuelle und textuelle Eingaben verarbeiten, wie etwa Memes interpretieren und mathematische Probleme schrittweise lösen. Nvidia macht die Modellgewichte öffentlich zugänglich und verspricht, den Trainingscode zu veröffentlichen. Diese Entscheidung ermöglicht Forschern und Entwicklern beispiellosen Zugang zu modernster KI-Technologie.