Dubbing v2: ElevenLabs bringt KI-Synchronisation auf ein neues Niveau

Das KI-Unternehmen ElevenLabs hat Dubbing v2 veröffentlicht, ein neues Modell zur automatischen Videosynchronisation. Imogen Mulliner und Jakub Lichman schreiben bei ElevenLabs, dass das System direkt auf die originale Sprachaufnahme zugreift, statt sich auf ein Transkript zu stützen. So sollen Tonlage, Tempo und emotionaler Ausdruck des Sprechers in mehr als 90 Sprachen übertragen werden. Bisherige KI-Synchronisationstools …

Weiterlesen …

Command A+: Cohere veröffentlicht leistungsstärkstes Open-Source-Modell für den freien kommerziellen Einsatz

Das kanadische KI-Unternehmen Cohere hat Command A+ vorgestellt, ein großes Sprachmodell für komplexes Reasoning, Dokumentenverarbeitung und autonome Arbeitsabläufe. Carl Franzen berichtet für VentureBeat, dass das Modell kostenlos auf Hugging Face unter einer Apache-2.0-Lizenz verfügbar ist. Damit ist es das erste Cohere-Modell, das jeder ohne Einschränkungen nutzen, verändern und kommerziell einsetzen darf. Cohere-Chef Aidan Gomez bestätigte, …

Weiterlesen …

Claude Opus 4.8: bessere Benchmarks, günstigerer Fast Mode

Anthropic hat Claude Opus 4.8 veröffentlicht, die neue Version seines leistungsstärksten öffentlich zugänglichen KI-Modells. Das Update erscheint nur 41 Tage nach dem Vorgänger Opus 4.7 und bringt Verbesserungen in den Bereichen Coding, agentenbasierte Aufgaben und Ehrlichkeit (!). Das Modell ist sofort zum gleichen Preis wie bisher verfügbar. Der Standardpreis bleibt bei 5 Dollar pro Million …

Weiterlesen …

Genrewechsel, Rap, Soundeffekte: ElevenLabs setzt neue Maßstäbe bei der KI-Musikgenerierung

ElevenLabs hat Music v2 veröffentlicht, eine neue Version seines KI-Modells zur Musikgenerierung. Das Modell kann innerhalb eines einzigen Tracks zwischen verschiedenen Genres wechseln. Ivan Mehta berichtet für TechCrunch, dass das Modell für komplexe Vocals und Kompositionen ausgelegt ist. Es erscheint knapp zehn Monate nach dem ersten Musikmodell des Unternehmens. Laut ElevenLabs kann das Modell nahtlos …

Weiterlesen …

Dieses Startup will KI beibringen, aus echten Nutzerdaten zu lernen

Ein neues Startup namens Trajectory will eine Plattform bauen, mit der KI-Produkte sich durch echte Nutzerinteraktionen kontinuierlich verbessern. Maxwell Zeff berichtet für WIRED, dass das Unternehmen von ehemaligen Forschern bei Google DeepMind, Apple und OpenAI gegründet wurde. Trajectory hat eine Seed-Finanzierungsrunde über 15 Millionen US-Dollar abgeschlossen, bei einer Bewertung von 115 Millionen Dollar. Angeführt wird …

Weiterlesen …

Lizenziert statt unkontrolliert: Spotify und Universal setzen auf legale KI-Musik

Spotify hat eine Vereinbarung mit Universal Music Group geschlossen. Sie erlaubt Abonnenten, KI-generierte Cover und Remixe von Songs teilnehmender Künstler zu erstellen. Anna Nicolaou berichtet für die Financial Times. Spotify ist damit die erste große Streaming-Plattform, die ein kommerzielles KI-Musikprodukt mit Unterstützung eines großen Musiklabels auf den Markt bringt. Spotify-Co-Chef Alex Norström verteidigte den Schritt. …

Weiterlesen …

Dieses winzige Zusatzmodul könnte ein Problem von KI-Agenten lösen: ihr schlechtes Gedächtnis

Forscher haben ein schlankes Speichermodul für KI-Agenten entwickelt, das Informationen über lange Interaktionen hinweg behält. Es kommt ohne größere Kontextfenster und ohne externe Datenbanksysteme aus. Das Modul trägt den Namen Delta-Mem und erweitert ein bestehendes Sprachmodell um lediglich 0,12 Prozent zusätzliche Parameter. Dabei übertrifft es deutlich größere Alternativen bei gedächtnisintensiven Aufgaben, berichtet Ben Dickson für …

Weiterlesen …

Runway will über Videos hinaus: Der nächste Schritt ist KI, die die Welt versteht

Das KI-Videounternehmen Runway, dessen Werkzeuge bereits in Hollywoodproduktionen zum Einsatz kamen, verfolgt ein neues Ziel. Das Unternehmen will sogenannte Weltmodelle entwickeln, also KI-Systeme, die simulieren, wie sich Umgebungen verhalten. Damit tritt Runway in direkten Wettbewerb mit Google und anderen finanzstarken Konkurrenten. Rebecca Bellan berichtet darüber für TechCrunch. Der Ansatz unterscheidet sich grundlegend von dem der …

Weiterlesen …

Alibabas Qwen3.7-Max bringt autonome KI-Agenten in Unternehmensumgebungen

Alibaba hat Qwen3.7-Max veröffentlicht, ein proprietäres KI-Modell für autonome, lang andauernde Aufgaben. Das Modell ist ausschließlich über die kostenpflichtige API von Alibaba Cloud zugänglich und nicht als Open Source verfügbar. Das ist ein klarer Bruch mit dem bisherigen Kurs des Unternehmens. Das Qwen Team, Alibabas KI-Forschungsgruppe, berichtet, dass das Modell eine 35-stündige Ingenieursaufgabe vollständig selbstständig …

Weiterlesen …

Spotify startet KI-Tools für Podcasts und Hörbücher

Spotify hat zwei neue KI-gestützte Tools für die Audioerstellung angekündigt: eine Desktop-App zum Erstellen persönlicher Podcasts und ein Hörbuch-Tool in Zusammenarbeit mit dem Sprachmodell-Unternehmen ElevenLabs. Die neue Desktop-App trägt den Namen Studio by Spotify Labs. Sie erstellt Podcasts auf Basis persönlicher Daten wie E-Mails, Kalendereinträgen und Reisebuchungen. Ein integrierter Agent durchsucht das Web und greift …

Weiterlesen …

×