Wissenschaftler der Mohamed bin Zayed University of Artificial Intelligence haben ein neues KI-Modell entwickelt, das seine Schlussfolgerungen transparent macht. Wie Michael Nuñez in VentureBeat berichtet, vereint LlamaV-o1 die Analyse von Bildern und Text mit einer schrittweisen Erklärung seiner Denkprozesse. Das Modell überzeugt bei komplexen Aufgaben wie der Interpretation von Finanzdiagrammen und medizinischen Bildern. Es erreichte einen Reasoning-Score von 68,93 und übertraf damit sowohl Open-Source-Konkurrenten als auch einige proprietäre Modelle wie Claude 3.5 Sonnet. Die Forscher stellten zudem VRC-Bench vor, einen neuen Bewertungsstandard mit über 1.000 Testfällen.
LlamaV-o1 nutzt fortschrittliche Techniken wie Beam Search und systematisches Lernen. Das System arbeitet fünfmal schneller als vergleichbare Modelle bei gleichbleibender Genauigkeit. Diese Transparenz macht es besonders wertvoll für Branchen wie Gesundheitswesen und Finanzsektor, wo Entscheidungsprozesse nachvollziehbar sein müssen. Die Forscher warnen jedoch davor, das Modell für kritische Entscheidungen einzusetzen.