Das französische KI-Startup Mistral hat sein erstes multimodales Modell Pixtral 12B veröffentlicht. Anders ausgedrückt: Es verfügt über 12 Milliarden Parameter und kann sowohl Bilder als auch Text verarbeiten. Es basiert auf Mistral’s bestehendem Textmodell Nemo 12B und soll in der Lage sein, Fragen zu einer beliebigen Anzahl von Bildern in beliebiger Größe zu beantworten.
Pixtral 12B ist derzeit über GitHub und die KI-Entwicklungsplattform Hugging Face unter einer Apache 2.0 Lizenz frei verfügbar. Laut Mistral kann das Modell ohne Einschränkungen heruntergeladen, angepasst und genutzt werden. Eine öffentliche Demo-Version gibt es zum jetzigen Zeitpunkt noch nicht, soll aber bald über Mistrals Chatbot und API-Plattformen zugänglich sein.
Mit diesem Schritt erweitert Mistral sein Portfolio an KI-Modellen und tritt in direkten Wettbewerb mit etablierten Anbietern wie OpenAI und Anthropic. Das erst ein Jahr alte Startup, an dem Microsoft eine Minderheitsbeteiligung hält, gilt als europäische Antwort auf OpenAI und konnte kürzlich in einer Finanzierungsrunde 645 Millionen US-Dollar einsammeln. Die Strategie des Unternehmens umfasst bisher die Veröffentlichung kostenloser offener Modelle, kostenpflichtige Versionen sowie Beratungsdienstleistungen für Firmenkunden.
Quellen: TechCrunch, VentureBeat