Resemble AI zeigt Rapid Voice Cloning
Resemble AI führt mit Rapid Voice Cloning ein Tool ein, mit dem sich innerhalb einer Minute KI-gestützte Stimmklone aus kurzen Audiodaten erstellen lassen. Quelle: VentureBeat
Resemble AI führt mit Rapid Voice Cloning ein Tool ein, mit dem sich innerhalb einer Minute KI-gestützte Stimmklone aus kurzen Audiodaten erstellen lassen. Quelle: VentureBeat
Adobe kündigt generative KI-Lösungen an, um die Content-Supply-Chain für Unternehmen zu optimieren. Mit Adobe GenStudio erhalten Marketer ein KI-gestütztes Angebot, um schnell markenkonforme Inhalte zu planen, zu erstellen und zu verwalten. Der Bildgenerator Adobe Firefly wird dabei nahtlos integriert und ermöglicht nach Aussagen des Unternehmens mit neuen Firefly Services und Custom Models eine skalierbare Inhaltsproduktion.
Opera ermöglicht es jetzt, KI-Sprachmodelle lokal auf den eigenen Rechner herunterzuladen und dort auszuführen – also auch ohne Internetverbindung, ohne zusätzliche Kosten und privat. Über 150 Modelle von mehr als 50 Familien stehen zur Auswahl, darunter Llama von Meta, Gemma von Google und Vicuna. Das Feature ist zunächst für Nutzer von Opera One im Developer-Stream … Weiterlesen …
Stability AI hat mit Stable Audio 2.0 ein Update für seine generative Audio-KI veröffentlicht. Mit der neuen Version lassen sich bis zu dreiminütige Audioclips aus Textbeschreibungen erstellen. Außerdem kann Stable Audio 2.0 hochgeladene Audiodateien anhand von Anweisungen in natürlicher Sprache transformieren. Großen Wert hat das Unternehmen offenbar auf den Urheberrechtsschutz gelegt: Es hat nach eigener Aussage nur … Weiterlesen …
Ein kleines, feines Beispiel für eine praktische KI-Anwendung zeigt Amazon: Ein Link zu einem Produkt im eigenen Shop genügt, und der Assistent generiert eine Amazon-Produktseite daraus, berichtet The Verge. Das Angebot ist zunächst in den USA verfügbar.
Stable Video 3D erstellt 3D-Modelle aus einem einzigen Foto. Es lässt sich für nicht-kommerzielle Anwendungen kostenlos nutzen.
Google-Forscher zeigen VLOGGER, das aus einem einzigen Foto lebensechte Videos von Menschen erstellen kann, die sprechen, gestikulieren und sich bewegen. Das eröffnet eine Reihe potenzieller Anwendungen, wirft aber auch Bedenken hinsichtlich Fälschungen und Fehlinformationen auf. Quelle: VentureBeat
Pika bietet bereits eine „Lip Sync“-Funktion, bei der Personen in Videos das Sprechen lernen. Nun kommt eine Option hinzu, um einen generierten Clip zu vertonen, etwa mit Hintergrundgeräuschen und Effekten. Quelle: VentureBeat
Während viele KI-Videos bislang nur einige Sekunden lang sein können, sollen sie bei Story.com bis zu 1 Minute lang sein. Eine Storyboard-Funktion soll dabei helfen, dass die Clips am Ende den Ideen und Bedürfnissen der Nutzer:innen entsprechen.
Microsofts Partner OpenAI bietet bereits eine Funktion, um Chatbot-Varianten für bestimmte Einsatzzwecke zu erstellen („GPTs“). Eine vergleichbare Funktion gibt es nun für alle Nutzer:innen von Copilot Pro, wie VentureBeat hier berichtet.