Alibabas Qwen-Team hat zwei bedeutende KI-Modelle – Qwen2.5-VL und Qwen2.5-Max – vorgestellt, die fortschrittliche Fähigkeiten in verschiedenen Aufgabenbereichen demonstrieren. Laut Unternehmensangaben können diese Modelle Text- und Bildanalysen durchführen, Computer und mobile Geräte steuern und mit etablierten KI-Systemen von OpenAI, Anthropic und Google in mehreren Bewertungskategorien konkurrieren. Die Qwen2.5-VL-Modellfamilie umfasst drei Versionen, wobei die 72B-Hauptversion eine spezielle Genehmigung für den kommerziellen Einsatz durch Großnutzer erfordert.
Die neuen Modelle, insbesondere Qwen2.5-Max, verwenden eine Mixture-of-Experts-Architektur, die nach Angaben von Alibaba weniger Rechenressourcen benötigt als herkömmliche Ansätze. Das Unternehmen berichtet, dass seine Modelle in Tests zu fortgeschrittenem Denken und Wissen konkurrenzfähige Ergebnisse im Vergleich zu Branchenführern wie GPT-4o und Claude-3.5-Sonnet erzielen. Das Qwen2.5-Max-Modell zeigt nach Unternehmensangaben starke Leistungen in der Codegenerierung und bei Reasoning-Aufgaben, mit Werten von 38,7% bei LiveCodeBench und 89,4% beim Arena-Hard-Test.
Der Zeitpunkt dieser Veröffentlichungen ist bemerkenswert, da sie kurz nach der erfolgreichen Einführung der Modelle des chinesischen KI-Labors DeepSeek erfolgen, die Auswirkungen auf die US-Technologiemärkte hatte. Während die Qwen-Modelle technische Fortschritte demonstrieren, unterliegen sie bestimmten Einschränkungen bei Diskussionsthemen gemäß chinesischer Vorschriften. Alibaba Cloud gibt an, dass die Modelle mit über 20 Billionen Tokens trainiert wurden, wobei Fragen zur Datensouveränität und regulatorischen Compliance für potenzielle Nutzer wichtige Überlegungen bleiben.
Quellen: TechCrunch, VentureBeat, Reuters