Das New Yorker Startup Hume hat EVI 3 vorgestellt, ein KI-Modell für Gespräche, das Nutzern die Erstellung eigener synthetischer Stimmen über Spracheingabe ermöglicht. Die Technologie zielt auf Anwendungen vom Kundensupport bis zur virtuellen Begleitung ab, berichtet Carl Franzen für VentureBeat. Nutzer können Persönlichkeitsmerkmale, Stimmqualitäten und emotionale Töne festlegen. So entstehen Stimmen von warmherzigen Begleitern bis zu eigenwilligen Erzählern. Interne Tests mit 1.720 Nutzern zeigten, dass EVI 3 OpenAIs GPT-4o Sprachmodell in allen Kategorien übertraf. Dazu gehören Natürlichkeit, Ausdrucksstärke und Empathie. Das System bietet 300-Millisekunden-Antwortzeiten und unterstützt Englisch und Spanisch. Während derzeit eine Live-Demo verfügbar ist, startet der API-Zugang für Entwickler in den kommenden Wochen. Anders als Konkurrenten wie ElevenLabs fehlt EVI 3 bisher das Stimmklonen. Hume plant diese Funktion für sein separates Octave Text-zu-Sprache-Modell.