KI-Tool von Amazon kann jetzt Audio-Werbung erstellen

Amazon hat auf der Amazon unBoxed-Konferenz ein generatives KI-Tool vorgestellt, mit dem Werbetreibende neben Bildern und Videos auch Audio-Anzeigen erstellen können. Wie AdWeek berichtet, ermöglicht die neue Funktion Werbetreibenden, Anzeigen mit minimalen Produktinformationen zu erstellen, und ist Teil einer größeren Suite von Tools, die die Effizienz von Kampagnen auf Amazon-Plattformen wie Prime Video und Twitch … Weiterlesen …

Transkriptions-KI Gladia sammelt Kapital ein

Gladia, ein Anbieter für KI-gestützte Transkription und Audio-Intelligenz, hat 16 Millionen US-Dollar Finanzierung erhalten. Das Pariser Unternehmen will damit eine neue Echtzeit-Transkriptions- und Analyse-Engine entwickeln. CEO Jean-Louis Quéguiner erklärte gegenüber VentureBeat, dass er die Firma aus Frust über bestehende Dienste gründete, die Akzente schlecht erkennen. Die neue Engine von Gladia kann über 100 Sprachen in … Weiterlesen …

Play 3.0 mini ist für Gespräche mit KI-Assistenten optimiert

Play.ht veröffentlicht sein neues Sprachmodell „Play 3.0 mini“. Das KI-gestützte Text-to-Speech-Modell kann in über 30 Sprachen sprechen und jede Stimme oder jeden Akzent imitieren. Es bietet laut Play.ht branchenführende Geschwindigkeit und Genauigkeit. Play 3.0 mini wurde speziell für den Einsatz in Conversational AI entwickelt und soll besonders zuverlässig und kosteneffizient sein. Das Modell erreicht eine … Weiterlesen …

Rep.ai erstellt „digitale Zwillinge“ von Verkaufsberatern

Das KI-Startup Rep.ai hat 7,5 Millionen US-Dollar Finanzierung erhalten, um seine „digitale Zwillings“-Technologie für Verkaufsberatern zu starten. Das berichtet Michael Nuñez für VentureBeat. Die Firma, früher als ServiceBell bekannt, entwickelt KI-gesteuerte Avatare, die Websitebesucher in Echtzeit-Video- und Audiogesprächen betreuen sollen. Rep.ai kombiniert dafür visuelle und stimmliche Nachbildung mit natürlicher Sprachverarbeitung, die zudem auf Marketingmaterialien des … Weiterlesen …

EzAudio erzeugt hochwertige Soundeffekte

Forscher der Johns Hopkins University und des Tencent AI Lab haben ein neues Text-zu-Audio-Modell namens EzAudio entwickelt. Wie Michael Nuñez in VentureBeat berichtet, kann EzAudio hochwertige Soundeffekte aus Textbeschreibungen erzeugen. Das Modell nutzt eine innovative Methode zur Verarbeitung von Audiodaten und eine neue Architektur namens EzAudio-DiT. In Tests übertraf EzAudio bestehende Open-Source-Modelle in Qualität und … Weiterlesen …

EVI 2 bietet eine stark verbesserte Sprachschnittstelle

Hume AI hat eine verbesserte Version seiner Sprach-KI EVI 2 vorgestellt. Die neue Version bietet natürlichere Gespräche, schnellere Reaktionszeiten und mehr Anpassungsmöglichkeiten bei der Stimme. Das berichtet Carl Franzen für VentureBeat. Laut Hume-Mitgründer Alan Cowen lässt sich EVI 2 nun direkt in Apps integrieren, um Nutzeranfragen zu bearbeiten. Die Technologie soll Emotionen besser erkennen und … Weiterlesen …

Googles Audio Overview erklärt komplexe Konzepte

Google erweitert seine KI-gestützte Notiz-App NotebookLM um eine Audiofunktion. Die neue „Audio Overview“ ermöglicht es Nutzern, komplexe Themen aus hochgeladenen Dokumenten mündlich erklärt zu bekommen. Das berichtet Aisha Malik für TechCrunch. KI-generierte virtuelle Moderatoren fassen die Inhalte zusammen und erläutern schwierige Konzepte mit Metaphern. Die Funktion richtet sich an Menschen, die Informationen besser durch Zuhören … Weiterlesen …

Musik-KI Suno auf iPhones verfügbar

Die Musik-KI Suno ist jetzt in den USA auch für iPhones verfügbar. Sie bietet eine Vielzahl von Stilen und Genres und kann sowohl komplette Songs mit Text und Gesang als auch Instrumentals generieren. Die App soll bald auch in anderen Ländern und für Android-Geräte verfügbar sein.

ElevenLabs AI Voice Isolator vorgestellt

ElevenLabs hat einen neuen, kostenlosen Dienst namens AI Voice Isolator eingeführt, der unerwünschte Hintergrundgeräusche aus Filmen, Podcasts oder YouTube-Videos entfernt. Im Gegensatz zu anderen Programmen, die nur konstante Geräusche entfernen können, bewältigt der Voice Isolator auch unregelmäßige Geräusche wie etwa das Öffnen einer Tür oder Klatschen.

ElevenLabs Reader liest dir vor

ElevenLabs hat eine neue App namens Reader veröffentlicht, die es Nutzern ermöglicht, beliebige Texte in AI-Stimmen vorlesen zu lassen. Neu sind dabei die „Iconic Voices“, die die Stimmen von verstorbenen Stars wie Judy Garland, James Dean und Laurence Olivier nachbilden. Das Unternehmen hat die Rechte an den Stimmen von CMG Worldwide erworben und betont, dass die … Weiterlesen …