H2O.ai hat zwei neue Vision-Language-Modelle vorgestellt, H2OVL Mississippi-2B und H2OVL Mississippi-0.8B, die auf die Verbesserung der Dokumentenanalyse und der optischen Zeichenerkennung (OCR) ausgerichtet sind. Trotz ihrer geringen Größe zeigen diese Modelle eine konkurrenzfähige Leistung im Vergleich zu größeren Modellen großer Technologieunternehmen, wobei das Modell 0.8B bei der OCRBench-Texterkennungsaufgabe hervorragend abschnitt. CEO Sri Ambati betonte, dass diese Modelle so entwickelt wurden, dass sie kosteneffektiv sind und gleichzeitig eine hohe Leistung in verschiedenen dokumentenintensiven Arbeitsabläufen bieten, berichtet VentureBeat. Die Modelle sind auf Hugging Face verfügbar, so dass Entwickler sie an spezifische Anforderungen anpassen können.
Bleib auf dem Laufenden
KI für Contentprofis: die neuesten Tools, Tipps und Trends. Alle 14 Tage in deine Inbox:
Artikel mit dem Autornamen SCR wurden mit KI-Hilfe erstellt. Jan Tissler wählt die Themen manuell aus. Jeder Beitrag wird von ihm vor der Veröffentlichung kontrolliert und bearbeitet. Er übernimmt die volle redaktionelle Verantwortung für die Inhalte. Lies mehr darüber, wie diese Website entsteht und welche Prompts zum Einsatz kommen.
Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation
Der aktuelle und umfassende Überblick für Marketing-Profis (3. Ausgabe, Januar 2026)
Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklich gewinnbringend für deine Arbeit ein?
Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.