Das Startup Nari Labs hat mit Dia ein Open-Source-Sprachmodell veröffentlicht, das natürlich klingende Dialoge erzeugen kann. Wie VentureBeat-Journalist Carl Franzen berichtet, soll das 1,6 Milliarden Parameter umfassende Modell mit Angeboten von ElevenLabs, OpenAI und Googles NotebookLM konkurrieren können. Mitgründer Toby Kim entwickelte Dia „ohne Finanzierung“ mit Unterstützung von Google, das Zugang zu TPU-Chips gewährte. Das Modell unterstützt fortschrittliche Funktionen wie emotionale Tonalität, Sprechermarkierungen und nonverbale Audiohinweise. Nutzer können verschiedene Sprecher kennzeichnen und nonverbale Elemente wie Lachen oder Husten einbauen. Dia steht unter der Apache 2.0-Lizenz zur Verfügung, die kommerzielle Nutzung erlaubt. Direkte Vergleiche zeigen, dass Dia bei natürlichem Timing, emotionaler Bandbreite und nonverbalen Signalen besser abschneidet als Konkurrenzprodukte. Das zweiköpfige Team hinter Nari Labs lädt zu Beiträgen über Discord und GitHub ein.