Mistral veröffentlicht Voxtral Transcribe 2: Transkription direkt auf dem Handy

Mistral AI hat Voxtral Transcribe 2 veröffentlicht, eine Familie von Speech-to-Text-Modellen für Batch-Verarbeitung und Echtzeit-Transkription. Das Unternehmen positioniert die Technologie als präziser und deutlich günstiger als konkurrierende Services und ermöglicht gleichzeitig lokale Verarbeitung für sensible Daten.

Die Veröffentlichung umfasst zwei Modelle. Voxtral Mini Transcribe V2 verarbeitet voraufgezeichnete Audiodateien für $0.003 pro Minute, was laut Mistral etwa ein Fünftel der Kosten großer Konkurrenten entspricht. Voxtral Realtime verarbeitet Live-Audio mit einer Latenz, die sich bis auf 200 Millisekunden konfigurieren lässt. Beide Modelle unterstützen 13 Sprachen, darunter Englisch, Deutsch, Chinesisch, Hindi, Spanisch und Arabisch.

Pierre Stock, Vice President of Science Operations bei Mistral, betonte den Privacy-Vorteil lokaler Verarbeitung. Das Realtime-Modell nutzt 4 Milliarden Parameter und ist damit klein genug für Smartphones und Laptops, ohne Audio an externe Server zu übertragen. Das adressiert Bedenken in regulierten Branchen wie Healthcare und Finance, wo Datensouveränität relevant ist.

Das Unternehmen gibt an, dass Voxtral Realtime unter Apache 2.0 Open-Source-Lizenz verfügbar ist. Entwickler können die Model Weights herunterladen und modifizieren, ohne Lizenzgebühren zu zahlen. API-Zugang kostet $0.006 pro Minute.

Enterprise-Features umfassen Speaker Diarization, die identifiziert, wer wann gesprochen hat, und Context Biasing, worüber Kunden Listen mit spezialisierter Terminologie bereitstellen können, die das Modell bei der Transkription bevorzugen soll. Mistral sagt, die Modelle behalten ihre Genauigkeit in lauten Umgebungen wie Fabrikhallen und Call-Centern bei.

Das Unternehmen behauptet, seine Modelle erreichen niedrigere Word Error Rates als Angebote von OpenAI, Google und spezialisierten Transkriptionsdiensten. Mistral hat einen Audio Playground in Mistral Studio veröffentlicht, damit Entwickler die Technologie testen können.

Quellen: Mistral News, VentureBeat

Über den Autor

Mehr zum Thema:

Bleib up-to-date:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (3. Ausgabe, Januar 2026)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklich gewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen