KI-Stimmklonungsdienste haben mangelhafte Schutzmaßnahmen

Die meisten KI-Dienste zur Stimmklonung bieten unzureichenden Schutz gegen nicht einvernehmliche Stimmimitationen, wie eine Untersuchung von Consumer Reports zeigt. Von sechs führenden öffentlich zugänglichen Tools haben fünf leicht zu umgehende Sicherheitsvorkehrungen. NBC News berichtet, dass vier Dienste (ElevenLabs, Speechify, PlayHT und Lovo) lediglich das Ankreuzen eines Kästchens zur Bestätigung der Autorisierung verlangen. Resemble AI fordert …

Weiterlesen …

ElevenLabs’ Spracherkennungsmodell Scribe liefert 96,7% Genauigkeit

ElevenLabs hat Scribe v1 veröffentlicht, ein neues Spracherkennungsmodell mit Höchstwerten bei der Genauigkeit in 99 Sprachen. Wie Carl Franzen für VentureBeat berichtet, übertrifft das Modell Konkurrenzprodukte von Google, OpenAI und Deepgram mit einer Genauigkeitsrate von 96,7% für Englisch. Scribe kann bis zu 32 verschiedene Sprecher in einer Audiodatei unterscheiden und erkennt nichtverbale Elemente wie Lachen …

Weiterlesen …

Sesame zeigt KI-Assistenten mit natürlicher Gesprächspräsenz

Sesame, ein Startup unter der Leitung des Oculus-Mitbegründers Brendan Iribe, hat einen neuen KI-Sprachassistenten namens Maya vorgestellt, der darauf abzielt, „das Uncanny Valley der Konversationssprache“ zu überwinden. Laut eines kürzlich erschienenen Artikels des Technologiejournalisten Sean Hollister bietet Maya natürlichere und ansprechendere Gespräche im Vergleich zu bestehenden Sprachassistenten wie Amazon’s Alexa oder Google’s Gemini. Das Unternehmen …

Weiterlesen …

Hume AI stellt Octave vor, ein Text-to-Speech-Modell mit emotionalen Steuerelementen

Das Startup Hume AI hat ein neues Text-to-Speech-System namens Octave eingeführt, das emotional nuancierte KI-Stimmen erzeugt. Laut einem Bericht von Carl Franzen für VentureBeat basiert das Modell auf einem Large Language Model, das Ton, Rhythmus und Sprachmelodie kontextabhängig anpassen kann. Nutzer können Emotionen auf Satzebene durch einfache Textbefehle wie „fröhlicher“ oder „sarkastischer“ steuern. Octave richtet …

Weiterlesen …

Spotify erweitert KI-Hörbücher durch ElevenLabs-Kooperation

Der Streaming-Dienst Spotify geht eine neue Partnerschaft mit dem KI-Unternehmen ElevenLabs ein. Wie The Verge berichtet, können Autoren künftig Hörbücher mit der KI-Sprachsynthese von ElevenLabs auf Spotify veröffentlichen. Das System unterstützt 29 Sprachen für die Vertonung. Für die Produktion eines durchschnittlichen Hörbuchs ist ein Pro-Abonnement für 99 Dollar monatlich erforderlich. Spotify will damit besonders kleineren …

Weiterlesen …

Riffusion stellt kostenlose KI-Plattform für personalisierte Musikproduktion vor

Das KI-Startup Riffusion aus San Francisco hat eine neue kostenlose Webplattform zur KI-gestützten Musikproduktion eingeführt. Wie Michael Nuñez bei VentureBeat berichtet, kann das KI-Modell Fuzz vollständige Songs aus Textbeschreibungen, Audioclips oder visuellen Eingaben generieren. Das System lernt dabei die musikalischen Vorlieben der Nutzer kennen und passt sich individuell an. Riffusions CEO Seth Forsgren betont, dass …

Weiterlesen …

Google erweitert NotebookLM um interaktive KI-Funktionen und Unternehmensversion

Google hat bedeutende Aktualisierungen seiner KI-gestützten Notiz-Anwendung NotebookLM vorgestellt, darunter eine neue interaktive Funktion für Audio Overviews und eine unternehmensorientierte Version namens NotebookLM Plus. Die Anwendung, die für ihre Funktion bekannt wurde, Podcast-ähnliche Gespräche zwischen KI-Moderatoren auf Basis von Quellmaterialien zu generieren, ermöglicht es Nutzern nun, während der Wiedergabe direkt mit diesen synthetischen Moderatoren zu …

Weiterlesen …

ElevenLabs startet KI-gestütztes Podcast-Produktionssystem

Das Technologie-Startup ElevenLabs hat ein neues KI-System zur Podcast-Erstellung vorgestellt. Wie Ashley Carman für Bloomberg berichtet, ermöglicht die Software die Umwandlung von Textdokumenten in Podcasts mit künstlichen Stimmen. Das System unterstützt 32 Sprachen und bietet Zugriff auf tausende KI-generierte Stimmen. Benutzer können Transkripte bearbeiten und Audiodateien in hoher Qualität exportieren. Das in New York ansässige …

Weiterlesen …

Hume AI stellt neue Stimmanpassungssoftware vor

Das Technologieunternehmen Hume AI hat eine neue Software namens Voice Control vorgestellt, mit der Entwickler künstliche Stimmen individuell anpassen können. Wie Carl Franzen für VentureBeat berichtet, können Nutzer dabei zehn verschiedene Stimmmerkmale über Schieberegler einstellen. Die Software erfordert keine Programmierkenntnisse und verzichtet bewusst auf Stimmklonen, um ethische Bedenken zu berücksichtigen. Das System basiert auf der …

Weiterlesen …

Nvidia stellt neues KI-Audiomodell Fugatto vor

Der Technologiekonzern Nvidia hat ein neues KI-Modell namens Fugatto entwickelt, das Audio generieren und modifizieren kann. Wie Stephen Nellis für Reuters berichtet, ermöglicht die Technologie die Umwandlung bestehender Klänge, die Änderung von Sprachakzenten und die Erzeugung neuartiger Audioeffekte durch Texteingaben. Das Modell kann beispielsweise Klavierpassagen in Gesang umwandeln oder eine Trompete wie einen bellenden Hund …

Weiterlesen …