Alibaba stellt neue effiziente KI-Modellarchitektur vor

Alibaba hat eine neue Generation von KI-Modellen namens Qwen3-Next vorgestellt, die auf hohe Leistung bei geringem Rechenaufwand ausgelegt ist. Crystal Liu schreibt für Alibaba, dass die neue Architektur dies durch mehrere Innovationen erreicht. Das erste Modell der Serie, Qwen3-Next-80B, ist ab sofort als Open Source verfügbar.

Laut dem Unternehmen aktiviert dieses Modell mit 80 Milliarden Parametern bei der Anwendung nur 3 Milliarden Parameter. Dieser Ansatz, bekannt als „Mixture of Expert“ (MoE) Architektur, senkt den Rechenbedarf erheblich. Alibaba gibt an, dass das Modell sein früheres 32-Milliarden-Parameter-Modell übertrifft, aber weniger als 10 Prozent der Trainingskosten benötigt. Bei der Verarbeitung großer Textmengen soll es zudem einen mehr als zehnmal höheren Durchsatz erreichen. Das Modell unterstützt ein großes Kontextfenster von 256.000 Tokens, das auf eine Million erweitert werden kann.

Zusätzlich hat Alibaba Qwen3-ASR-Flash veröffentlicht, ein neues Modell zur automatischen Spracherkennung. Es unterstützt elf Sprachen sowie verschiedene Dialekte und soll auch in lauten Umgebungen gut funktionieren und sogar Liedtexte mit Hintergrundmusik transkribieren.

Das Unternehmen präsentierte auch eine Vorschau auf sein bisher größtes Modell, Qwen3-Max, mit über einer Billion Parameter. Dieses Modell soll komplexe Anweisungen zuverlässiger befolgen und deutlich seltener Falschinformationen erzeugen. Es unterstützt über 100 Sprachen und ist für fortgeschrittene Anwendungen optimiert.

Mehr zum Thema:

Bleib up-to-date: