Alibaba veröffentlicht Qwen3.5, ein multimodales KI-Modell mit 397 Milliarden Parametern

Alibaba hat Qwen3.5 vorgestellt, ein neues KI-Modell, das als multimodaler Agent Text, Bilder und Videos verarbeiten kann. Das QwenTeam kündigt diese Entwicklung auf der Webseite des Unternehmens an.

Das Modell enthält 397 Milliarden Parameter. Pro Aufgabe aktiviert es jedoch nur 17 Milliarden davon. Das Team betont, dieser Ansatz optimiere Geschwindigkeit und Kosten. Die Architektur kombiniert lineare Aufmerksamkeitsmechanismen mit einer sparse Mixture-of-Experts-Technologie. Das System verarbeitet Text in 201 Sprachen und Dialekten. Die Vorgängerversion unterstützte 119 Sprachen.

Qwen3.5 zeigt wettbewerbsfähige Leistung in zahlreichen Benchmark-Tests. Bei Wissensaufgaben wie MMLU-Pro und SuperGPQA erreicht es 87,8 und 70,4 Punkte. Damit liegt es nahe an Konkurrenzmodellen wie GPT-5.2 und Gemini-3 Pro. Besonders stark schneidet das Modell bei Anweisungsbefolgung ab. Hier erzielt es 76,5 Punkte auf IFBench und 67,6 auf MultiChallenge.

Bei visuellen Aufgaben erreicht das System 88,6 auf MathVision und 90,3 auf Mathvista. Diese Werte übertreffen mehrere Konkurrenzmodelle. In Tests zum Dokumentenverständnis wie OmniDocBench1.5 erzielt es 90,8 Punkte. Das ist der höchste Wert unter den verglichenen Systemen. Das Modell kann bis zu eine Million Token verarbeiten. Das entspricht etwa zwei Stunden Videomaterial.

Das System integriert mehrere Agentenfähigkeiten. Es kann Websuchen durchführen, Code ausführen und Kontext über mehrere Interaktionen hinweg behalten. Bei Programmieraufgaben erreicht Qwen3.5 auf SWE-bench Verified 76,4 Punkte und auf SecCodeBench 68,3 Punkte. Für visuelle Agentenaufgaben wie AndroidWorld erzielt es 66,8 Punkte.

Nutzer können auf das Modell über Alibaba Cloud ModelStudio zugreifen oder es über Qwen Chat ausprobieren. Die gehostete Version heißt Qwen3.5-Plus. Sie enthält integrierte Werkzeuge für Reasoning, Websuche und Codeinterpretation. Das Team bietet API-Zugang mit Optionen für Denkmodus und Suchfunktionalität.

Die Entwicklung umfasste umfangreiches Reinforcement Learning über verschiedene Aufgaben und Umgebungen. Das Team berichtet, dieser Skalierungsansatz habe sich auf steigende Schwierigkeit und Verallgemeinerungsfähigkeit konzentriert. Das Training nutzte eine Infrastruktur, die gemischte Text-, Bild- und Videodaten mit nahezu 100 Prozent Durchsatzeffizienz verarbeitet.

Der Dekodierungsdurchsatz des Modells ist 8,6-mal schneller als Qwen3-Max bei 32k Kontextlänge. Bei 256k Kontextlänge ist er 19-mal schneller.

Alibaba positioniert Qwen3.5 als Grundlage für universelle digitale Agenten. Das Team erklärt, die zukünftige Entwicklung werde sich auf Systemintegration konzentrieren. Dazu gehören persistenter Speicher für sitzungsübergreifendes Lernen, „embodied interfaces“ für reale Interaktion und Mechanismen für selbstgesteuerte Verbesserung.

Über den Autor

Mehr zum Thema:

Bleib up-to-date:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (3. Ausgabe, Januar 2026)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklich gewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen