Microsoft Phi-3 Mini vorgestellt

Microsoft stellt mit Phi-3 Mini sein bisher kleinstes KI-Modell vor, das trotz seiner geringen Größe mit großen Sprachmodellen wie GPT-3.5 mithalten kann und sich besonders für Unternehmen mit kleineren Datensätzen und begrenztem Budget eignet. 

VideoGigaGAN verbessert Video-Skalierung

VideoGigaGAN übertrifft bisherige Verfahren, um Videos hochzuskalieren, und erzeugt Videos mit hoher Detailgenauigkeit und Konsistenz. Der Ansatz basiert auf dem Bild-Hochskalierer GigaGAN und behebt dessen Probleme bei der Videoverarbeitung durch spezielle Techniken, die zu schärferen und gleichzeitig flüssigeren Videos führen. Quelle: Hacker News

„Expressive Avatars“ noch lebensechter

Das Londoner Unternehmen Synthesia führt „Expressive Avatars“ ein, eine neue Generation von KI-Avataren, die ihre Mimik, Gestik und ihren Tonfall an den Kontext der gesprochenen Inhalte anpassen. Dies ermögliche es etwa, realistischere und emotionalere KI-Videos für Marketing, Schulungen oder Patientenkommunikation zu erstellen.

Microsofts VASA-1 erstellt Videos aus einem Foto plus Audio

Microsofts VASA-1 kann menschliche Porträts zum Singen und Sprechen bringen. Er benötigt lediglich ein Standbild und eine Audiodatei mit Sprache, um bewegte Lippen, passende Mimik sowie Kopfbewegungen zu generieren. Microsoft betont, dass es sich dabei um eine reine Forschungsdemonstration handelt, ohne Pläne zur Markteinführung. 

AdaKWS bietet offenbar bessere Spracherkennung als OpenAIs Whisper

Das neue KI-Modell AdaKWS der Firma aiOla, einem Spezialisten für Spracherkennung, will durch seine Fähigkeit überzeugen, Sprache auch dann in korrekten Text umzuwandeln, wenn es sich um Fachjargon handelt. Das Modell  erreicht eine Genauigkeit von 94,6% – besser als OpenAIs Whisper.

ChatGPT-Update bringt „Gedächtnis“ und temporäre Chats

ChatGPT hat einige Updates erhalten. Besonders interessant scheint die Memory-Funktion, mit der sich ChatGPT Informationen merken kann, die Nutzer ihm mitteilen. So lassen sich beispielsweise Details über die eigene Person oder das Unternehmen speichern, auf die der Chatbot dann bei Bedarf zurückgreifen kann. Weitere Neuerungen sind die Möglichkeit, temporäre Chats zu führen, die nach 30 …

Weiterlesen …

Metas beeindruckende ChatGPT-Alternative Llama 3

Meta stellt mit Llama 3 die neueste Generation seiner Sprachmodelle vor, die sie frei zum Download zur Verfügung stellen. Die Modelle sollen in puncto Leistung viele Konkurrenten übertreffen und selbst mit einigen der besten proprietären Modelle mithalten können. Llama 3 glänzt offenbar insbesondere bei Multiple-Choice-Fragen, Programmieraufgaben und mathematischen Problemen. Neben den Modellen selbst präsentiert Meta einen eigenständigen …

Weiterlesen …

Ausprobiert: Bilder generieren mit iStock

KI-Bildgeneratoren gibt es jede Menge. Aber oftmals haben sie ein Problem: Urheberrecht. Zum einen ist nicht immer klar, woher das Trainingsmaterial stammt. Zum anderen ist nicht gesichert, inwiefern man sich mit solchen Bildern selbst in rechtliche Schwierigkeiten bringt.  Solche Bildgeneratoren kommen für Unternehmen und andere Organisationen oft nicht in Frage, denn ihre Einführung ist (oder …

Weiterlesen …

Open Weights

Manche KI-Anwendungen sind frei verfügbar. Man denke hier etwa an Sprachmodelle des französischen Anbieters Mistral oder an die Llama-Familie aus dem Hause Facebook/Meta. Allerdings ist es nicht korrekt, diese als „open source“ zu bezeichnen. Denn was man als Nutzer erhält, ist das Endergebnis des Trainings, der Kern eines Large Language Models, „Weights“ genannt. Nicht automatisch …

Weiterlesen …

KI-Tools sind nicht nutzlos, aber sind sie es wert?

Und wer sich einmal mit einer durchdachten, skeptischen Sicht auf den KI-Hype auseinandersetzen möchte, sollte diesen Beitrag von Molly Whitelesen. Sie stellt in Frage, ob die heutigen KI-Werkzeuge wirklich wert sind, was sie kosten. Und damit meint sie nicht primär monetäre Kosten, sondern etwa Auswirkungen auf die Umwelt durch den enormen Energiebedarf und andere potenziell negative …

Weiterlesen …