Resemble Detect-2B hilft Audio-Deepfakes zu erkennen

Resemble AI hat mit Detect-2B ein neues Modell zur Erkennung von Audio-Deepfakes vorgestellt, das mit einer Genauigkeit von 94 % aufwarten soll. Das Modell erkennt anhand subtiler Artefakte, ob es sich um echte oder künstlich generierte Sprache handelt. 

DeepMind V2A generiert Audio für Videos automatisch

Googles KI-Forschungslabor DeepMind hat eine neue Technologie namens V2A entwickelt, die automatisch passende Soundtracks, Soundeffekte und sogar Dialoge für Videos generieren kann. Obwohl V2A vielversprechend scheint, räumt DeepMind ein, dass die generierte Audioqualität noch nicht perfekt ist. Es ist vorerst nicht allgemein erhältlich.

Meta veröffentlicht zahlreiche neue KI-Modelle

Meta veröffentlicht eine Reihe neuer KI-Modelle für Audio, Text und Wasserzeichen. Außerdem stellt Meta zwei Größen seines multimodalenTextmodells Chameleon für Forschungszwecke zur Verfügung. Diese Modelle ermöglichen es, Aufgaben zu erledigen, die visuelles und textuelles Verständnis erfordern, wie z. B. Bildbeschriftung.

Füge Sounds zu deinen Videos hinzu mit diesem Tool

ElevenLabs veröffentlicht ein neues Tool, mit dem Videomacher schnell und einfach passende Soundeffekte für ihre Clips erstellen können. Die App analysiert hochgeladene Videos und schlägt verschiedene Soundeffekte vor, die sich über eine Schnittstelle direkt in die Videos integriert lassen.

Camb AI Mars5 klont Stimmen in über 140 Sprachen

Das KI-Modell Mars5 von Camb AI ermöglicht realitätsnahes Klonen von Stimmen in über 140 Sprachen und kombiniert dabei Stimmklonung und Text-to-Speech in einer Plattform. Das Unternehmen behauptet, dass Mars5 besonders gut darin sei, emotionale Nuancen in Sprache zu erfassen, was es ideal für Anwendungen wie Sportkommentare und Filme mache.

Stability AI veröffentlicht Stable Audio Open

Stability AI veröffentlicht mit „Stable Audio Open“ ein neues KI-Modell zur kostenlosen Erstellung von Sounds und Musikstücken mit bis 47 Sekunden Länge. Allerdings ist es aufgrund des Trainingsmaterials auf englischsprachige Beschreibungen und westliche Musikstile beschränkt.

ElevenLabs Sound Effects generiert Audiosamples

ElevenLabs, ein KI-Startup für Sprachsynthese, hat mit „Sound Effects“ein neues Produkt vorgestellt, mit dem sich durch einfache Texteingabe  Audiosamples erstellen lassen. Das Tool, das in Zusammenarbeit mit Shutterstock entwickelt wurde, soll Kreativschaffenden aus verschiedenen Bereichen wie Film, Fernsehen, Videospielen und Social Media dabei helfen, ihre Inhalte mit interessanten und passenden Klanglandschaften zu verbessern, ohne dafür aufwendig … Weiterlesen …

Truecaller lässt eine KI mit deiner Stimme ans Telefon gehen

Die Anruf-App Truecaller führt eine neue Funktion ein, mit der Nutzer eine KI-Version ihrer eigenen Stimme erstellen können, um Anrufe entgegenzunehmen und beispielsweise nach dem Grund des Anrufs zu fragen. Ob es aber eine gute Idee ist, dafür die eigene Stimme zu nutzen? Ich stelle mir das verwirrend vor …