Das chinesische KI-Unternehmen MiniMax hat M2.5 veröffentlicht, ein neues großes Sprachmodell, das laut Unternehmensangaben mit Spitzenmodellen von Anthropic und Google mithalten soll — zu deutlich niedrigeren Kosten.
MiniMax bietet zwei Versionen über seine API an. M2.5-Lightning verarbeitet 100 Token pro Sekunde und kostet 0,30 Dollar pro Million Eingabe-Token und 2,40 Dollar pro Million Ausgabe-Token. Das Standard-Modell M2.5 läuft mit halber Geschwindigkeit zum halben Preis. MiniMax zufolge ist das Modell damit zehn- bis zwanzigmal günstiger als Claude Opus 4.6.
Das Modell verwendet eine sogenannte Mixture-of-Experts-Architektur mit insgesamt 230 Milliarden Parametern, aktiviert davon aber nur 10 Milliarden gleichzeitig. MiniMax hat M2.5 mit einem eigens entwickelten Reinforcement-Learning-Framework namens Forge trainiert — in Hunderttausenden realer Umgebungen, darunter Programmieraufgaben, Dokumentenbearbeitung und Webrecherche.
Beim Coding-Benchmark SWE-Bench Verified erreicht M2.5 einen Wert von 80,2 %. Beim BrowseComp-Test, der Webrecherchefähigkeiten misst, erzielt es 76,3 %. MiniMax gibt an, dass M2.5 die SWE-Bench-Auswertung 37 % schneller abschließt als das Vorgängermodell.
Das Unternehmen erklärt, dass M2.5 intern bereits 30 % aller Aufgaben bei MiniMax übernimmt und 80 % des neu eingereichten Codes generiert. Das Modell wurde als Open Source auf Hugging Face unter einer angepassten MIT-Lizenz veröffentlicht.
Quellen: MiniMax, VentureBeat
