„Expressive Avatars“ noch lebensechter

Das Londoner Unternehmen Synthesia führt „Expressive Avatars“ ein, eine neue Generation von KI-Avataren, die ihre Mimik, Gestik und ihren Tonfall an den Kontext der gesprochenen Inhalte anpassen. Dies ermögliche es etwa, realistischere und emotionalere KI-Videos für Marketing, Schulungen oder Patientenkommunikation zu erstellen.

Microsofts VASA-1 erstellt Videos aus einem Foto plus Audio

Microsofts VASA-1 kann menschliche Porträts zum Singen und Sprechen bringen. Er benötigt lediglich ein Standbild und eine Audiodatei mit Sprache, um bewegte Lippen, passende Mimik sowie Kopfbewegungen zu generieren. Microsoft betont, dass es sich dabei um eine reine Forschungsdemonstration handelt, ohne Pläne zur Markteinführung. 

AdaKWS bietet offenbar bessere Spracherkennung als OpenAIs Whisper

Das neue KI-Modell AdaKWS der Firma aiOla, einem Spezialisten für Spracherkennung, will durch seine Fähigkeit überzeugen, Sprache auch dann in korrekten Text umzuwandeln, wenn es sich um Fachjargon handelt. Das Modell  erreicht eine Genauigkeit von 94,6% – besser als OpenAIs Whisper.

ChatGPT-Update bringt „Gedächtnis“ und temporäre Chats

ChatGPT hat einige Updates erhalten. Besonders interessant scheint die Memory-Funktion, mit der sich ChatGPT Informationen merken kann, die Nutzer ihm mitteilen. So lassen sich beispielsweise Details über die eigene Person oder das Unternehmen speichern, auf die der Chatbot dann bei Bedarf zurückgreifen kann. Weitere Neuerungen sind die Möglichkeit, temporäre Chats zu führen, die nach 30 …

Weiterlesen …

Metas beeindruckende ChatGPT-Alternative Llama 3

Meta stellt mit Llama 3 die neueste Generation seiner Sprachmodelle vor, die sie frei zum Download zur Verfügung stellen. Die Modelle sollen in puncto Leistung viele Konkurrenten übertreffen und selbst mit einigen der besten proprietären Modelle mithalten können. Llama 3 glänzt offenbar insbesondere bei Multiple-Choice-Fragen, Programmieraufgaben und mathematischen Problemen. Neben den Modellen selbst präsentiert Meta einen eigenständigen …

Weiterlesen …

Ausprobiert: Bilder generieren mit iStock

KI-Bildgeneratoren gibt es jede Menge. Aber oftmals haben sie ein Problem: Urheberrecht. Zum einen ist nicht immer klar, woher das Trainingsmaterial stammt. Zum anderen ist nicht gesichert, inwiefern man sich mit solchen Bildern selbst in rechtliche Schwierigkeiten bringt.  Solche Bildgeneratoren kommen für Unternehmen und andere Organisationen oft nicht in Frage, denn ihre Einführung ist (oder …

Weiterlesen …

Google-Forscher geben KI „unbegrenzte“ Aufmerksamkeitsspanne

Google-Forscher haben mit „Infini-attention“ eine Technik entwickelt, die es Sprachmodellen ermöglicht, Texte von theoretisch unendlicher Länge zu verarbeiten, ohne zusätzlichen Speicher- und Rechenaufwand zu benötigen. Quelle: VentureBeat

Limitless hilft mit Meetingnotizen

Limitless ist ein neues KI-Werkzeug, das Besprechungen aufzeichnet, transkribiert und zusammenfasst sowie Echtzeit-Notizen liefert. Der dazugehörige „Limitless Pendant“ ist ein tragbares Gerät, das Audio automatisch aufnimmt und an die Cloud sendet. Das klingt zwar nützlich, allerdings auch wie ein enormes Datenschutzproblem … Quelle: The Verge

Logitech integriert ChatGPT

Logitech stellt mit dem Logi AI Prompt Builder eine neue Software vor, die ChatGPT in die Logi Options+ App integriert. Sie soll Nutzern ermöglichen, KI-Funktionen einfacher in ihren Arbeitsablauf einzubinden. Passend dazu launcht Logitech auch die Signature AI Edition Mouse, eine Maus mit dedizierter KI-Prompt-Taste, die ab diesem Monat für 49,99 US-Dollar erhältlich ist.

Stable LM 2 nutzt 12 Milliarden Parameter

Stability AI hat sein Sprachmodell Stable LM 2 auf 12 Milliarden Parameter erweitert und damit dessen Leistungsfähigkeit deutlich gesteigert. Das Unternehmen strebt an, mit dem Update eine gute Balance zwischen Leistung, Genauigkeit und Zugänglichkeit zu erreichen. Es positioniert das Modell als Teil umfassenderer Systeme, in denen Sprachmodelle untereinander interagieren und externe Werkzeuge nutzen können.