Das Startup Hume AI hat ein neues Text-to-Speech-System namens Octave eingeführt, das emotional nuancierte KI-Stimmen erzeugt. Laut einem Bericht von Carl Franzen für VentureBeat basiert das Modell auf einem Large Language Model, das Ton, Rhythmus und Sprachmelodie kontextabhängig anpassen kann. Nutzer können Emotionen auf Satzebene durch einfache Textbefehle wie „fröhlicher“ oder „sarkastischer“ steuern. Octave richtet sich an Content-Ersteller für Hörbücher, Podcasts und Videospiel-Dialoge. Das System behält konsistente Charakterstimmen über längere Inhalte bei und versteht kontextuelle Hinweise. Hume bietet verschiedene Abonnements an, beginnend mit einem kostenlosen Plan für 10.000 Zeichen pro Monat bis hin zu Enterprise-Lösungen mit unbegrenzter Nutzung. Internen Tests zufolge übertrifft Octave den Wettbewerber ElevenLabs in Audioqualität, Natürlichkeit und Stimmanpassung.