Audio - ✦ Smart Content Report

GPT-Live: OpenAI ersetzt Advanced Voice Mode durch Full-Duplex-Technik

8. Juli 2026

OpenAI hat mit GPT-Live eine neue Generation von Audio-Sprachmodellen vorgestellt. Sie soll Gespräche mit ChatGPT natürlicher wirken lassen. Das Unternehmen kündigt in einem offiziellen Blogbeitrag an, dass GPT-Live den bisherigen Advanced Voice Mode ablöst. Der Rollout startet weltweit auf iOS, Android und ChatGPT.com. Kern der Neuerung ist eine sogenannte Full-Duplex-Architektur. Frühere Systeme warteten stets, bis …

Apple erweitert Creator Studio mit KI-Funktionen für Video-, Bild- und Audiobearbeitung

1. Juli 2026

Apple hat seine Creator-Studio-Apps mit einer Reihe neuer KI-Funktionen aktualisiert. Sie umfassen Pixelmator Pro, Final Cut Pro, Logic Pro und weitere Programme. Juli Clover berichtet für MacRumors über Updates in den Bereichen Videobearbeitung, Bildgenerierung, Audioproduktion und Dokumentenbearbeitung. Final Cut Pro erhält zwei besonders relevante KI-Neuerungen für die Videoarbeit. Generate Captions erstellt automatisch Untertitel aus dem …

KI-Musikplattform Suno erhält 400 Millionen Dollar bei einer Bewertung von 5,4 Milliarden Dollar

3. Juni 2026

Die KI-Musikplattform Suno hat eine Finanzierungsrunde über 400 Millionen Dollar abgeschlossen. Das Unternehmen wird dabei mit 5,4 Milliarden Dollar bewertet. Corbin Bolies berichtet für Variety, dass die Series-D-Runde von Bond Capital angeführt wurde. Ebenfalls beteiligt sind IVP, Forerunner, Union Square Ventures, Alkeon Capital Management und Quiet. Auch frühere Investoren wie Matrix, Lightspeed, Menlo Ventures und …

Dubbing v2: ElevenLabs bringt KI-Synchronisation auf ein neues Niveau

29. Mai 2026

Das KI-Unternehmen ElevenLabs hat Dubbing v2 veröffentlicht, ein neues Modell zur automatischen Videosynchronisation. Imogen Mulliner und Jakub Lichman schreiben bei ElevenLabs, dass das System direkt auf die originale Sprachaufnahme zugreift, statt sich auf ein Transkript zu stützen. So sollen Tonlage, Tempo und emotionaler Ausdruck des Sprechers in mehr als 90 Sprachen übertragen werden. Bisherige KI-Synchronisationstools …

Genrewechsel, Rap, Soundeffekte: ElevenLabs setzt neue Maßstäbe bei der KI-Musikgenerierung

27. Mai 2026

ElevenLabs hat Music v2 veröffentlicht, eine neue Version seines KI-Modells zur Musikgenerierung. Das Modell kann innerhalb eines einzigen Tracks zwischen verschiedenen Genres wechseln. Ivan Mehta berichtet für TechCrunch, dass das Modell für komplexe Vocals und Kompositionen ausgelegt ist. Es erscheint knapp zehn Monate nach dem ersten Musikmodell des Unternehmens. Laut ElevenLabs kann das Modell nahtlos …

Lizenziert statt unkontrolliert: Spotify und Universal setzen auf legale KI-Musik

26. Mai 2026

Spotify hat eine Vereinbarung mit Universal Music Group geschlossen. Sie erlaubt Abonnenten, KI-generierte Cover und Remixe von Songs teilnehmender Künstler zu erstellen. Anna Nicolaou berichtet für die Financial Times. Spotify ist damit die erste große Streaming-Plattform, die ein kommerzielles KI-Musikprodukt mit Unterstützung eines großen Musiklabels auf den Markt bringt. Spotify-Co-Chef Alex Norström verteidigte den Schritt. …

ElevenLabs greift Spotify und Audible mit eigenem Hörbuch-Dienst an

24. Mai 2026

ElevenLabs, das KI-Sprachunternehmen mit einem Marktwert von 11 Milliarden Dollar, steigt in den Hörbuch-Streamingmarkt ein. Der direkte Wettbewerb richtet sich gegen Spotify und Audible. Laut einem Bericht von Ashley Carman für Bloomberg hat das Unternehmen Lizenzen für 200.000 von Menschen eingesprochene Hörbücher erworben. Zu den Verlagspartnern zählen HarperCollins, Blackstone Publishing und Vinci Books. Die Titel …

Spotify startet KI-Tools für Podcasts und Hörbücher

26. Mai 202623. Mai 2026

Spotify hat zwei neue KI-gestützte Tools für die Audioerstellung angekündigt: eine Desktop-App zum Erstellen persönlicher Podcasts und ein Hörbuch-Tool in Zusammenarbeit mit dem Sprachmodell-Unternehmen ElevenLabs. Die neue Desktop-App trägt den Namen Studio by Spotify Labs. Sie erstellt Podcasts auf Basis persönlicher Daten wie E-Mails, Kalendereinträgen und Reisebuchungen. Ein integrierter Agent durchsucht das Web und greift …

Google aktualisiert Flow und Flow Music mit neuem KI-Modell und mobilen Apps

26. Mai 202620. Mai 2026

Google hat eine Reihe von Neuerungen für seine KI-gestützten Kreativplattformen Google Flow und Google Flow Music angekündigt. Die Änderungen wurden auf der Google I/O, der jährlichen Entwicklerkonferenz des Unternehmens, vorgestellt. Sie umfassen ein neues KI-Modell, einen agentischen Assistenten, benutzerdefinierte Werkzeuge und mobile Anwendungen. Google Flow ist ein KI-Kreativstudio, mit dem Nutzer mithilfe natürlicher Sprache Videos …

KI-Musik: Stability AI veröffentlicht Stable Audio 3.0 mit offenen Modellgewichten

26. Mai 202620. Mai 2026

Stability AI hat Stable Audio 3.0 veröffentlicht, eine neue Familie von KI-Modellen zur Audiogenerierung. Alle Modelle wurden mit lizenzierten Musikdaten trainiert. Drei der vier Modelle sind als Open-Weight-Modelle frei verfügbar, das heißt, sie können heruntergeladen und weiterentwickelt werden. Die vier Modelle im Überblick: Small SFX, Small und Medium stehen auf Hugging Face zum Download bereit. …