Das kanadische KI-Unternehmen Cohere hat Command A+ vorgestellt, ein großes Sprachmodell für komplexes Reasoning, Dokumentenverarbeitung und autonome Arbeitsabläufe. Carl Franzen berichtet für VentureBeat, dass das Modell kostenlos auf Hugging Face unter einer Apache-2.0-Lizenz verfügbar ist. Damit ist es das erste Cohere-Modell, das jeder ohne Einschränkungen nutzen, verändern und kommerziell einsetzen darf.
Cohere-Chef Aidan Gomez bestätigte, dass das Unternehmen ein Modell erstmals unter einer so offenen Lizenz veröffentlicht. Frühere Modelle wie Command R und Command R+ waren zwar für Forschungszwecke zugänglich, verboten aber den kommerziellen Einsatz ohne kostenpflichtige Lizenz.
Effizient durch Architektur
Command A+ verfügt insgesamt über 218 Milliarden Parameter, von denen jedoch nur 25 Milliarden gleichzeitig aktiv sind. Diese sogenannte Sparse-Mixture-of-Experts-Architektur leitet jede Anfrage nur an die jeweils passenden Modellteile weiter. Das spart Rechenleistung erheblich. Das Modell läuft auf einer einzigen NVIDIA-Blackwell-B200-GPU oder nur zwei NVIDIA-H100-GPUs. Damit ist es deutlich zugänglicher als proprietäre Konkurrenzmodelle, die Schätzungen zufolge Billionen von Parametern umfassen.
Cohere hat das Modell zusätzlich durch Quantisierung stark komprimiert, also die Datenmenge reduziert, die nötig ist, um die Modellparameter zu speichern. Dabei bleibt die Genauigkeit laut Unternehmensangaben weitgehend erhalten. Im Vergleich zum Vorgängermodell soll die Ausgabegeschwindigkeit um bis zu 63 Prozent gestiegen sein.
Für den Unternehmenseinsatz konzipiert
- Native Quellenangaben verknüpfen jede Aussage direkt mit dem zugehörigen Dokument oder Datenbankresultat und verringern so das Risiko unerkannter Fehler
- Unterstützung für 48 Sprachen, mit verbesserter Effizienz für Arabisch, Japanisch und Koreanisch
- Ein Kontextfenster von 128.000 Token ermöglicht die Verarbeitung langer Dokumente, Bilder und Diagramme
- Direkte Anbindung an Datenbanken, Programmierschnittstellen und Suchwerkzeuge für autonome Arbeitsabläufe
In wichtigen Leistungstests erzielte das Modell deutliche Verbesserungen gegenüber seinem Vorgänger. Bei einem Test für komplexes Schlussfolgern im Telekommunikationsbereich stieg der Wert von 37 auf 85 Prozent. Bei einem anspruchsvollen Mathematiktest erreichte das Modell 90 Prozent, nach zuvor 57 Prozent.
Da die Apache-2.0-Lizenz den Betrieb auf eigenen Servern oder in abgeschotteten Netzwerken erlaubt, können Unternehmen aus regulierten Branchen das Modell vollständig in ihrer eigenen Infrastruktur betreiben, ohne auf Coheres Dienste angewiesen zu sein.
Bleib auf dem Laufenden
KI für Contentprofis: die neuesten Tools, Tipps und Trends. Alle 14 Tage in deine Inbox:
