Amazon Q Chatbot verfügbar

Der KI-Chatbot Amazon Q ist ab sofort allgemein verfügbar und unterstützt Unternehmen bei Aufgaben wie Wissensabruf, Softwareentwicklung und Datenanalyse. 

Apple veröffentlicht OpenELM KI-Modelle

Apple veröffentlicht OpenELM, eine Reihe kleiner, frei angebotener KI-Modelle, die direkt auf Geräten wie Laptops oder Smartphones laufen können und Aufgaben wie Textgenerierung effizient ausführen. Obwohl OpenELM in seiner Leistung nicht branchenführend ist, bietet es eine solide Basis für zukünftige Forschung und Entwicklung im Bereich der On-Device-KI.

Adobe integriert KI-Bildgenerator Firefly in Photoshop

Adobe integriert seine KI-Bildgenerierung Firefly direkt in Photoshop, sodass Nutzer Bilder per Texteingabe erstellen und diese anschließend mit den gewohnten Photoshop-Werkzeugen bearbeiten können.

Microsoft Phi-3 Mini vorgestellt

Microsoft stellt mit Phi-3 Mini sein bisher kleinstes KI-Modell vor, das trotz seiner geringen Größe mit großen Sprachmodellen wie GPT-3.5 mithalten kann und sich besonders für Unternehmen mit kleineren Datensätzen und begrenztem Budget eignet. 

VideoGigaGAN verbessert Video-Skalierung

VideoGigaGAN übertrifft bisherige Verfahren, um Videos hochzuskalieren, und erzeugt Videos mit hoher Detailgenauigkeit und Konsistenz. Der Ansatz basiert auf dem Bild-Hochskalierer GigaGAN und behebt dessen Probleme bei der Videoverarbeitung durch spezielle Techniken, die zu schärferen und gleichzeitig flüssigeren Videos führen. Quelle: Hacker News

„Expressive Avatars“ noch lebensechter

Das Londoner Unternehmen Synthesia führt „Expressive Avatars“ ein, eine neue Generation von KI-Avataren, die ihre Mimik, Gestik und ihren Tonfall an den Kontext der gesprochenen Inhalte anpassen. Dies ermögliche es etwa, realistischere und emotionalere KI-Videos für Marketing, Schulungen oder Patientenkommunikation zu erstellen.

Microsofts VASA-1 erstellt Videos aus einem Foto plus Audio

Microsofts VASA-1 kann menschliche Porträts zum Singen und Sprechen bringen. Er benötigt lediglich ein Standbild und eine Audiodatei mit Sprache, um bewegte Lippen, passende Mimik sowie Kopfbewegungen zu generieren. Microsoft betont, dass es sich dabei um eine reine Forschungsdemonstration handelt, ohne Pläne zur Markteinführung. 

AdaKWS bietet offenbar bessere Spracherkennung als OpenAIs Whisper

Das neue KI-Modell AdaKWS der Firma aiOla, einem Spezialisten für Spracherkennung, will durch seine Fähigkeit überzeugen, Sprache auch dann in korrekten Text umzuwandeln, wenn es sich um Fachjargon handelt. Das Modell  erreicht eine Genauigkeit von 94,6% – besser als OpenAIs Whisper.

ChatGPT-Update bringt „Gedächtnis“ und temporäre Chats

ChatGPT hat einige Updates erhalten. Besonders interessant scheint die Memory-Funktion, mit der sich ChatGPT Informationen merken kann, die Nutzer ihm mitteilen. So lassen sich beispielsweise Details über die eigene Person oder das Unternehmen speichern, auf die der Chatbot dann bei Bedarf zurückgreifen kann. Weitere Neuerungen sind die Möglichkeit, temporäre Chats zu führen, die nach 30 …

Weiterlesen …

Metas beeindruckende ChatGPT-Alternative Llama 3

Meta stellt mit Llama 3 die neueste Generation seiner Sprachmodelle vor, die sie frei zum Download zur Verfügung stellen. Die Modelle sollen in puncto Leistung viele Konkurrenten übertreffen und selbst mit einigen der besten proprietären Modelle mithalten können. Llama 3 glänzt offenbar insbesondere bei Multiple-Choice-Fragen, Programmieraufgaben und mathematischen Problemen. Neben den Modellen selbst präsentiert Meta einen eigenständigen …

Weiterlesen …