Zyphra veröffentlicht mit Zamba2-7B ein neues, kleines Sprachmodell, das in Sachen Qualität und Leistung die führenden Modelle von Mistral, Google und Meta übertreffen soll. Laut Aussagen des Zyphra-Teams ist Zamba2-7B ideal für den Einsatz auf Endgeräten, Consumer-GPUs und Unternehmensanwendungen.
Zamba2-7B ist im Vergleich zu Modellen wie Llama3-8B deutlich effizienter. Es erreicht den ersten Token 25 % schneller, verarbeitet 20 % mehr Token pro Sekunde und benötigt weniger Speicher.
Die Architektur von Zamba2-7B wurde gegenüber dem Vorgänger Zamba1-7B verbessert. Es gibt zwei statt nur einem Shared-Attention-Block und LoRA-Projektoren für jeden Shared-MLP-Block. Das Modell wurde mit einem 3 Billionen Token umfassenden Datensatz trainiert und in einer separaten „Annealing“-Phase optimiert. Es ist Open Source und unter Apache-2.0-Lizenz verfügbar.
Über den Autor
Der Autorname SCR steht für Inhalte, die mit KI-Hilfe erstellt wurden. Die Themen werden manuell ausgewählt. Jeder Beitrag wird vor der Veröffentlichung kontrolliert und bearbeitet. Redaktionelle Verantwortung: Jan Tissler. Lies mehr darüber, wie diese Website entsteht und welche Prompts zum Einsatz kommen.
Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation
Der aktuelle und umfassende Überblick für Marketing-Profis (2. Ausgabe, September 2025)
Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklichgewinnbringend für deine Arbeit ein?
Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.