Hugging Face stellt ressourcensparendes KI-Modell vor

Hugging Face hat ein neues KI-Modell namens SmolVLM entwickelt, das Bild- und Textverarbeitung kombiniert. Wie Michael Nuñez berichtet, benötigt das Modell nur 5,02 GB GPU-Arbeitsspeicher. Vergleichbare Systeme brauchen bis zu 13,70 GB. SmolVLM nutzt eine fortschrittliche Kompressionstechnologie für die Bildverarbeitung. Das System verarbeitet Bilder mit 384×384 Pixeln durch nur 81 visuelle Token. Es ist in drei verschiedenen Varianten verfügbar. Die Software wird unter der Apache 2.0 Lizenz veröffentlicht. Das Modell basiert auf dem SigLIP-Bildencoder und SmolLM2 für die Textverarbeitung. Die Trainingsdaten stammen aus den Datensätzen The Cauldron und Docmatix.

Über den Autor

Mehr zum Thema:

Bleib up-to-date:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (2. Ausgabe, September 2025)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklichgewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen