Audio - Page 8 of 10 - ✦ Smart Content Report

Musik-KI Suno auf iPhones verfügbar

26. Mai 202612. Juli 2024

Die Musik-KI Suno ist jetzt in den USA auch für iPhones verfügbar. Sie bietet eine Vielzahl von Stilen und Genres und kann sowohl komplette Songs mit Text und Gesang als auch Instrumentals generieren. Die App soll bald auch in anderen Ländern und für Android-Geräte verfügbar sein.

ElevenLabs AI Voice Isolator vorgestellt

5. Februar 202512. Juli 2024

ElevenLabs hat einen neuen, kostenlosen Dienst namens AI Voice Isolator eingeführt, der unerwünschte Hintergrundgeräusche aus Filmen, Podcasts oder YouTube-Videos entfernt. Im Gegensatz zu anderen Programmen, die nur konstante Geräusche entfernen können, bewältigt der Voice Isolator auch unregelmäßige Geräusche wie etwa das Öffnen einer Tür oder Klatschen.

ElevenLabs Reader liest dir vor

5. Februar 202512. Juli 2024

ElevenLabs hat eine neue App namens Reader veröffentlicht, die es Nutzern ermöglicht, beliebige Texte in AI-Stimmen vorlesen zu lassen. Neu sind dabei die „Iconic Voices“, die die Stimmen von verstorbenen Stars wie Judy Garland, James Dean und Laurence Olivier nachbilden. Das Unternehmen hat die Rechte an den Stimmen von CMG Worldwide erworben und betont, dass die …

Resemble Detect-2B hilft Audio-Deepfakes zu erkennen

5. Februar 202512. Juli 2024

Resemble AI hat mit Detect-2B ein neues Modell zur Erkennung von Audio-Deepfakes vorgestellt, das mit einer Genauigkeit von 94 % aufwarten soll. Das Modell erkennt anhand subtiler Artefakte, ob es sich um echte oder künstlich generierte Sprache handelt.

DeepMind V2A generiert Audio für Videos automatisch

5. Februar 202528. Juni 2024

Googles KI-Forschungslabor DeepMind hat eine neue Technologie namens V2A entwickelt, die automatisch passende Soundtracks, Soundeffekte und sogar Dialoge für Videos generieren kann. Obwohl V2A vielversprechend scheint, räumt DeepMind ein, dass die generierte Audioqualität noch nicht perfekt ist. Es ist vorerst nicht allgemein erhältlich.

Meta veröffentlicht zahlreiche neue KI-Modelle

5. Februar 202528. Juni 2024

Meta veröffentlicht eine Reihe neuer KI-Modelle für Audio, Text und Wasserzeichen. Außerdem stellt Meta zwei Größen seines multimodalenTextmodells Chameleon für Forschungszwecke zur Verfügung. Diese Modelle ermöglichen es, Aufgaben zu erledigen, die visuelles und textuelles Verständnis erfordern, wie z. B. Bildbeschriftung.

KI-generierte Audioversionen von Artikeln, Büchern, Dokumenten

5. Februar 202528. Juni 2024

Eine neue iOS-App von ElevenLabs ermöglicht es Nutzern, Artikel, Bücher oder Dokumente unterwegs in einer KI-generierten Audioversion anzuhören.

Füge Sounds zu deinen Videos hinzu mit diesem Tool

5. Februar 202528. Juni 2024

ElevenLabs veröffentlicht ein neues Tool, mit dem Videomacher schnell und einfach passende Soundeffekte für ihre Clips erstellen können. Die App analysiert hochgeladene Videos und schlägt verschiedene Soundeffekte vor, die sich über eine Schnittstelle direkt in die Videos integriert lassen.

Camb AI Mars5 klont Stimmen in über 140 Sprachen

5. Februar 202514. Juni 2024

Das KI-Modell Mars5 von Camb AI ermöglicht realitätsnahes Klonen von Stimmen in über 140 Sprachen und kombiniert dabei Stimmklonung und Text-to-Speech in einer Plattform. Das Unternehmen behauptet, dass Mars5 besonders gut darin sei, emotionale Nuancen in Sprache zu erfassen, was es ideal für Anwendungen wie Sportkommentare und Filme mache.

Stability AI veröffentlicht Stable Audio Open

26. Mai 202614. Juni 2024

Stability AI veröffentlicht mit „Stable Audio Open“ ein neues KI-Modell zur kostenlosen Erstellung von Sounds und Musikstücken mit bis 47 Sekunden Länge. Allerdings ist es aufgrund des Trainingsmaterials auf englischsprachige Beschreibungen und westliche Musikstile beschränkt.