Zamba2-7B ist besonders effizient

5. Februar 202516. Oktober 2024 von SCR

Zyphra veröffentlicht mit Zamba2-7B ein neues, kleines Sprachmodell, das in Sachen Qualität und Leistung die führenden Modelle von Mistral, Google und Meta übertreffen soll. Laut Aussagen des Zyphra-Teams ist Zamba2-7B ideal für den Einsatz auf Endgeräten, Consumer-GPUs und Unternehmensanwendungen.

Zamba2-7B ist im Vergleich zu Modellen wie Llama3-8B deutlich effizienter. Es erreicht den ersten Token 25 % schneller, verarbeitet 20 % mehr Token pro Sekunde und benötigt weniger Speicher.

Die Architektur von Zamba2-7B wurde gegenüber dem Vorgänger Zamba1-7B verbessert. Es gibt zwei statt nur einem Shared-Attention-Block und LoRA-Projektoren für jeden Shared-MLP-Block. Das Modell wurde mit einem 3 Billionen Token umfassenden Datensatz trainiert und in einer separaten „Annealing“-Phase optimiert. Es ist Open Source und unter Apache-2.0-Lizenz verfügbar.

_{Über den Autor}

Artikel mit dem Autornamen SCR wurden mit KI-Hilfe erstellt. Jan Tissler wählt die Themen manuell aus. Jeder Beitrag wird von ihm vor der Veröffentlichung kontrolliert und bearbeitet. Er übernimmt die volle redaktionelle Verantwortung für die Inhalte. Lies mehr darüber, wie diese Website entsteht und welche Prompts zum Einsatz kommen.

Mehr zum Thema:

Schlagwörter: Open Source, Text, Zyphra

Bleib up-to-date:

Newsletter

RSS Feed

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (3. Ausgabe, Januar 2026)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklich gewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen

Direkt beim Anbieter …

Bei Amazon …