OpenAI hat seine Realtime-API, die sich derzeit in der Beta-Phase befindet, um fünf neue ausdrucksstarke Stimmen für Speech-to-Speech-Anwendungen erweitert. Durch die Einführung von Prompt-Caching wurden die Kosten für Entwickler gesenkt. Laut der von VentureBeat zitierten API-Dokumentation von OpenAI ermöglicht die native Speech-to-Speech-Funktion eine geringe Latenz und nuancierte Ausgaben. Das Unternehmen präsentierte drei der neuen Stimmen namens Ash, Verse und Ballad in einem Beitrag auf X (ehemals Twitter). OpenAI warnt, dass in der Beta-Version noch keine clientseitige Authentifizierung verfügbar ist und aufgrund von Netzwerkbedingungen Probleme bei der Verarbeitung von Echtzeit-Audio auftreten können. Mit Prompt-Caching plant OpenAI, die Preise für die Echtzeit-API zu senken, indem es einen Rabatt von 50 % auf zwischengespeicherte Texteingaben und einen Rabatt von 80 % auf zwischengespeicherte Audioeingaben gewährt.