Musik und Ton per KI generieren – drei Beispiele

KIs können nicht nur Texte, Bilder und Videos generieren, sondern auch Ton und Musik. Die Fortschritte bei der Qualität der Ergebnisse sind dabei erstaunlich.  Schauen wir uns drei prominente Beispiele an: Udio Udio ist vor einer Woche im Rahmen einer Public Beta gestartet und hat bereits für viel Wirbel gesorgt. Auf der Website finden sich zahlreiche …

Weiterlesen …

Soundry AI erstellt zusätzliche Musik

Soundry AI ist ein generatives KI-Tools für Musiker, mit der sch durch Texteingabe oder durch Beispielsamples weitere Musikschnippsel erstellen lassen. Quelle: Hacker News

Assembly AI zeigt Modell für Spracherkennung

Assembly AI stellt sein neues Spracherkennungsmodell Universal-1 vor, das im Vergleich zu OpenAIs Whisper  30% weniger Halluzinationen bei Sprachdaten und 90% weniger bei Umgebungsgeräuschen aufweisen soll. Das Modell bietet verbesserte Genauigkeit für Englisch, Spanisch, Französisch und Deutsch, unterstützt Code-Switching, optimierte Zeitstempelschätzung und schnellere Parallelverarbeitung, was für Anwendungen wie automatisierte Notizen, KI-gestützte Videobearbeitung und Telemedizin von Vorteil sein kann. …

Weiterlesen …

OpenAI Voice Engine vorgestellt

Und OpenAI stellt seine neue KI-Technologie „Voice Engine“ vor, die menschliche Stimmen offenbar täuschend echt nachahmen kann. Das Unternehmen beschränkt den Zugang aber vorerst auf ausgewählte Partner. Quelle: VentureBeat

OpenVoice kann Stimmen in vielen Sprachen klonen

MyShell TTS präsentiert mit OpenVoice einen vielseitigen Ansatz zum Klonen von Stimmen. Das Tool kann anhand kurzer Audioschnipsel die Stimme einer Person in mehreren Sprachen replizieren. OpenVoice ermöglicht dabei eine detaillierte Kontrolle über Stimmstil, Emotionen, Akzent, Rhythmus, Pausen und Intonation. Quelle: Hacker News

Resemble AI zeigt Rapid Voice Cloning

Resemble AI führt mit Rapid Voice Cloning ein Tool ein, mit dem sich innerhalb einer Minute KI-gestützte Stimmklone aus kurzen Audiodaten erstellen lassen. Quelle: VentureBeat

Stable Audio 2.0: Songs per Textbefehl

Stability AI hat mit Stable Audio 2.0 ein Update für seine generative Audio-KI veröffentlicht. Mit der neuen Version lassen sich bis zu dreiminütige Audioclips aus Textbeschreibungen erstellen. Außerdem kann Stable Audio 2.0 hochgeladene Audiodateien anhand von Anweisungen in natürlicher Sprache transformieren. Großen Wert hat das Unternehmen offenbar auf den Urheberrechtsschutz gelegt: Es hat nach eigener Aussage nur …

Weiterlesen …