Alibaba veröffentlicht QwQ-32B, ein leistungsstarkes Reasoning-Modell
Alibabas Qwen-Team hat QwQ-32B vorgestellt, ein neues Open-Source-Sprachmodell, das trotz deutlich geringerer Parameterzahl die Leistung viel größerer Modelle wie DeepSeek-R1 erreicht. Das unter der Apache 2.0-Lizenz veröffentlichte Modell mit 32 Milliarden Parametern nutzt Reinforcement Learning (RL), um seine Reasoning-Fähigkeiten für komplexe Problemlösungsaufgaben zu verbessern. Hauptmerkmale und Fähigkeiten QwQ-32B zeigt beeindruckende Leistungen bei mathematischem Denken, Programmierfähigkeiten … Weiterlesen …