Microsoft MInference beschleunigt Sprachmodelle

Microsofts neue Technologie „MInference“ verspricht, die Verarbeitungsgeschwindigkeit großer Sprachmodelle deutlich zu erhöhen, indem sie die Vorverarbeitungszeit langer Texte um bis zu 90% reduziert. Eine interaktive Demo auf Hugging Face ermöglicht es Entwicklern, die Technologie selbst zu testen und ihre Möglichkeiten zu erforschen. 

Poe führt interaktive Anwendungen ein

Quoras KI-Chatbot-Plattform Poe führt mit „Previews“ eine neue Funktion ein, mit der sich in Chats interaktive Anwendungen erstellen lassen. Dazu gehören etwa Datenvisualisierungen, Spiele oder sogar Drumcomputer, die auf Informationen aus hochgeladenen Dateien zugreifen. Die erstellten Anwendungen lassen sich über einen Link teilen.

Salesforce xLAM-1B vorgestellt

Salesforce hat mit xLAM-1B ein kleines, aber leistungsstarkes KI-Modell entwickelt, das im Vergleich zu größeren Modellen von OpenAI und Anthropic bei Funktionsaufrufen besser abschneidet. 

ElevenLabs AI Voice Isolator vorgestellt

ElevenLabs hat einen neuen, kostenlosen Dienst namens AI Voice Isolator eingeführt, der unerwünschte Hintergrundgeräusche aus Filmen, Podcasts oder YouTube-Videos entfernt. Im Gegensatz zu anderen Programmen, die nur konstante Geräusche entfernen können, bewältigt der Voice Isolator auch unregelmäßige Geräusche wie etwa das Öffnen einer Tür oder Klatschen.

ElevenLabs Reader liest dir vor

ElevenLabs hat eine neue App namens Reader veröffentlicht, die es Nutzern ermöglicht, beliebige Texte in AI-Stimmen vorlesen zu lassen. Neu sind dabei die „Iconic Voices“, die die Stimmen von verstorbenen Stars wie Judy Garland, James Dean und Laurence Olivier nachbilden. Das Unternehmen hat die Rechte an den Stimmen von CMG Worldwide erworben und betont, dass die …

Weiterlesen …

Apple 4M ist ein multimodaler Tausendsassa

Apple gibt mit dem „4M“-KI-Modell Einblicke in seine Fortschritte im Bereich der Künstlichen Intelligenz. Das Modell wurde in Zusammenarbeit mit der ETH Lausanne entwickelt und kann Texte in Bilder umwandeln, Objekte erkennen und 3D-Szenen anhand von Spracheingaben manipulieren.

Resemble Detect-2B hilft Audio-Deepfakes zu erkennen

Resemble AI hat mit Detect-2B ein neues Modell zur Erkennung von Audio-Deepfakes vorgestellt, das mit einer Genauigkeit von 94 % aufwarten soll. Das Modell erkennt anhand subtiler Artefakte, ob es sich um echte oder künstlich generierte Sprache handelt. 

AWS App Studio vorgestellt

Mit dem neuen AWS App Studio sollen Unternehmen in wenigen Minuten skalierbare, interne Anwendungen erstellen können – ganz ohne Programmierkenntnisse. Mithilfe generativer KI erstellt App Studio anhand von natürlichsprachigen Beschreibungen Anwendungen, die sich in interne Systeme integrieren lassen. Das Tool kümmert sich nach Amazons Darstellung um alle Aspekte der Anwendungsentwicklung, von der Bereitstellung über den Betrieb …

Weiterlesen …

Großes Update für Writer

Writer hat ein großes Update seiner Plattform veröffentlicht, das Unternehmen den Einsatz von KI erleichtern soll. Chatbots können nun etwa bis zu 10 Millionen Wörter an firmenspezifischen Daten verarbeiten und komplexe Aufgaben wie Dokumentenanalyse und Wissensmanagement übernehmen. Ein fortschrittlicher Algorithmus soll für präzisere Suchergebnisse sorgen und es ermöglichne, die Entscheidungsfindung der KI nachzuvollziehen. Neu eingeführte „Modi“ …

Weiterlesen …

Kyutai’s Sprachassistent Moshi ist besonders emotional

Das französische KI-Forschungslabor Kyutai, unterstützt vom Milliardär Xavier Niel, hat einen neuen Sprachassistenten namens Moshi vorgestellt. Dieser Assistent kann 70 verschiedene Emotionen und Stile nutzen, um besonders echt zu wirken. Kyutai gibt den Code der Technologie als Open Source frei.