Command A+: Cohere veröffentlicht leistungsstärkstes Open-Source-Modell

Das kanadische KI-Unternehmen Cohere hat Command A+ vorgestellt, ein großes Sprachmodell für komplexes Reasoning, Dokumentenverarbeitung und autonome Arbeitsabläufe. Carl Franzen berichtet für VentureBeat, dass das Modell kostenlos auf Hugging Face unter einer Apache-2.0-Lizenz verfügbar ist. Damit ist es das erste Cohere-Modell, das jeder ohne Einschränkungen nutzen, verändern und kommerziell einsetzen darf.

Cohere-Chef Aidan Gomez bestätigte, dass das Unternehmen ein Modell erstmals unter einer so offenen Lizenz veröffentlicht. Frühere Modelle wie Command R und Command R+ waren zwar für Forschungszwecke zugänglich, verboten aber den kommerziellen Einsatz ohne kostenpflichtige Lizenz.

Effizient durch Architektur

Command A+ verfügt insgesamt über 218 Milliarden Parameter, von denen jedoch nur 25 Milliarden gleichzeitig aktiv sind. Diese sogenannte Sparse-Mixture-of-Experts-Architektur leitet jede Anfrage nur an die jeweils passenden Modellteile weiter. Das spart Rechenleistung erheblich. Das Modell läuft auf einer einzigen NVIDIA-Blackwell-B200-GPU oder nur zwei NVIDIA-H100-GPUs. Damit ist es deutlich zugänglicher als proprietäre Konkurrenzmodelle, die Schätzungen zufolge Billionen von Parametern umfassen.

Cohere hat das Modell zusätzlich durch Quantisierung stark komprimiert, also die Datenmenge reduziert, die nötig ist, um die Modellparameter zu speichern. Dabei bleibt die Genauigkeit laut Unternehmensangaben weitgehend erhalten. Im Vergleich zum Vorgängermodell soll die Ausgabegeschwindigkeit um bis zu 63 Prozent gestiegen sein.

Für den Unternehmenseinsatz konzipiert

Native Quellenangaben verknüpfen jede Aussage direkt mit dem zugehörigen Dokument oder Datenbankresultat und verringern so das Risiko unerkannter Fehler
Unterstützung für 48 Sprachen, mit verbesserter Effizienz für Arabisch, Japanisch und Koreanisch
Ein Kontextfenster von 128.000 Token ermöglicht die Verarbeitung langer Dokumente, Bilder und Diagramme
Direkte Anbindung an Datenbanken, Programmierschnittstellen und Suchwerkzeuge für autonome Arbeitsabläufe

In wichtigen Leistungstests erzielte das Modell deutliche Verbesserungen gegenüber seinem Vorgänger. Bei einem Test für komplexes Schlussfolgern im Telekommunikationsbereich stieg der Wert von 37 auf 85 Prozent. Bei einem anspruchsvollen Mathematiktest erreichte das Modell 90 Prozent, nach zuvor 57 Prozent.

Da die Apache-2.0-Lizenz den Betrieb auf eigenen Servern oder in abgeschotteten Netzwerken erlaubt, können Unternehmen aus regulierten Branchen das Modell vollständig in ihrer eigenen Infrastruktur betreiben, ohne auf Coheres Dienste angewiesen zu sein.

Command A+: Cohere veröffentlicht leistungsstärkstes Open-Source-Modell für den freien kommerziellen Einsatz

Effizient durch Architektur

Für den Unternehmenseinsatz konzipiert

Mehr zum Thema:

Effizient durch Architektur

Für den Unternehmenseinsatz konzipiert

Bleib auf dem Laufenden

Mehr zum Thema: