Sesame zeigt KI-Assistenten mit natürlicher Gesprächspräsenz

Sesame, ein Startup unter der Leitung des Oculus-Mitbegründers Brendan Iribe, hat einen neuen KI-Sprachassistenten namens Maya vorgestellt, der darauf abzielt, „das Uncanny Valley der Konversationssprache“ zu überwinden. Laut eines kürzlich erschienenen Artikels des Technologiejournalisten Sean Hollister bietet Maya natürlichere und ansprechendere Gespräche im Vergleich zu bestehenden Sprachassistenten wie Amazon’s Alexa oder Google’s Gemini.

Das Unternehmen behauptet, sein Conversational Speech Model (CSM) verleihe KI-Interaktionen eine „Stimmpräsenz“, die durch emotionale Intelligenz, natürliche Gesprächsdynamik, Kontextbewusstsein und konsistente Persönlichkeitsmerkmale authentischer wirkt.

Funktionsweise der Technologie

Sesames Technologie betrachtet Sprachgenerierung als ganzheitliche multimodale Lernaufgabe. Das Unternehmen hat ein System entwickelt, das:

  • Transformer-Modelle nutzt, um Gesprächshistorie für natürlichere Sprache einzubeziehen
  • als einstufiges Modell arbeitet, um Effizienz und Ausdrucksfähigkeit zu verbessern
  • ein einzigartiges Compute-Amortisationsschema verwendet, um Speicherengpässe zu überwinden

Laut der von Sesame veröffentlichten technischen Dokumentation übertrifft ihr System bestehende Ansätze in objektiven Tests wie Homographen-Unterscheidung und Aussprache-Konsistenz. Bei subjektiven Bewertungen ohne Gesprächskontext zeigten menschliche Zuhörer keine klare Präferenz zwischen Mayas generierter Sprache und echten menschlichen Aufnahmen, was auf ein hohes Maß an Natürlichkeit hindeutet.

Zukunftspläne und Unternehmenshintergrund

Sesame hat angekündigt, KI-Brillen zu entwickeln, die den ganzen Tag getragen werden können und „hochwertiges Audio und bequemen Zugang zu Ihrem Begleiter bieten, der die Welt zusammen mit Ihnen beobachten kann.“ Frühe Prototypbilder zeigen ein schlankes Design, wobei nur wenige technische Details mitgeteilt wurden.

Das Unternehmen wird von Risikokapitalgebern wie Andreessen Horowitz, Spark Capital und Matrix Partners unterstützt – allesamt frühere Investoren von Oculus VR. Neben Iribe gehören zum Führungsteam der ehemalige Ubiquity6-CTO Ankit Kumar und der ehemalige Forschungstechnikdirektor von Meta Reality Labs, Ryan Brown.

Sesame hat sich verpflichtet, seine Modelle unter einer Apache 2.0-Lizenz quelloffen zu machen und plant, in den kommenden Monaten von Englisch auf über 20 Sprachen zu erweitern. Das Unternehmen erkennt aktuelle Einschränkungen an und merkt an, dass ihr System zwar hochwertige Gesprächsprosodie erzeugt, aber nur den Inhalt eines Gesprächs modellieren kann, nicht dessen Struktur.

Interessierte können Maya über eine Demo auf der Sesame-Website ausprobieren, die einen Hinweis enthält, dass Anrufe zur Qualitätskontrolle aufgezeichnet, aber innerhalb von 30 Tagen gelöscht und nicht für maschinelles Lernen verwendet werden.

Quellen: The Verge, Sesame

Mehr zum Thema:

Bleib up-to-date: