H2O.ai hat zwei neue Vision-Language-Modelle vorgestellt, H2OVL Mississippi-2B und H2OVL Mississippi-0.8B, die auf die Verbesserung der Dokumentenanalyse und der optischen Zeichenerkennung (OCR) ausgerichtet sind. Trotz ihrer geringen Größe zeigen diese Modelle eine konkurrenzfähige Leistung im Vergleich zu größeren Modellen großer Technologieunternehmen, wobei das Modell 0.8B bei der OCRBench-Texterkennungsaufgabe hervorragend abschnitt. CEO Sri Ambati betonte, dass diese Modelle so entwickelt wurden, dass sie kosteneffektiv sind und gleichzeitig eine hohe Leistung in verschiedenen dokumentenintensiven Arbeitsabläufen bieten, berichtet VentureBeat. Die Modelle sind auf Hugging Face verfügbar, so dass Entwickler sie an spezifische Anforderungen anpassen können.