Multimoda Arena sieht GPT-4o als Spitzenreiter

Die neue „Multimodal Arena“ von LMSYS vergleicht die Leistung verschiedener KI-Modelle bei bildbezogenen Aufgaben und zeigt: GPT-4o von OpenAI führt die Rangliste an, dicht gefolgt von Claude 3.5 Sonnet und Gemini 1.5 Pro. Überraschend: Open-Source-Modelle wie LLaVA-v1.6-34B erzielen vergleichbare Ergebnisse wie einige proprietäre Modelle. Der Haken? Trotz Fortschritten zeigt der CharXiv-Benchmark von Princeton, dass KI bei komplexen Aufgaben wie der Interpretation wissenschaftlicher Diagramme noch weit hinter den menschlichen Fähigkeiten zurückbleibt.

Mehr zum Thema:

Bleib up-to-date: