Hugging Face veröffentlicht effiziente KI-Sprachmodelle für Mobilgeräte

Hugging Face hat mit SmolLM2 eine neue Familie kompakter Sprachmodelle vorgestellt, die speziell für den Einsatz auf Smartphones und Edge-Geräten mit begrenzter Rechenleistung und Speicherkapazität entwickelt wurden. Die unter der Apache 2.0-Lizenz veröffentlichten Modelle sind in drei Größen bis zu 1,7 Milliarden Parametern erhältlich. Trotz ihrer kompakten Größe erzielen sie beeindruckende Ergebnisse bei wichtigen Benchmarks …

Weiterlesen …

Meta stellt Llama-KI-Modelle für US-Verteidigungsanwendungen bereit

Meta macht seine Llama-KI-Modelle für US-Regierungsbehörden und Auftragnehmer verfügbar, die an Verteidigungs- und nationalen Sicherheitsanwendungen arbeiten. Das Unternehmen kooperiert dazu mit Firmen wie Accenture, Amazon Web Services und Lockheed Martin, berichtet TechCrunch. Der Schritt erfolgt, nachdem chinesische Forscher mit Verbindungen zur Volksbefreiungsarmee ein älteres Llama-Modell für militärische Zwecke verwendet haben sollen, was laut Meta unerlaubt …

Weiterlesen …

ElevenLabs übernimmt Omnivore zur Weiterentwicklung der ElevenReader App

Das KI-Audiounternehmen ElevenLabs hat die Lese-App Omnivore übernommen. Ziel ist es, die neue ElevenReader App des Unternehmens weiterzuentwickeln. Laut einer Mitteilung der Omnivore-Gründer Jackson und Hongbo ermöglicht die Übernahme die Entwicklung zugänglicherer Lese- und Hörerlebnisse auf einer größeren Plattform. Omnivore-Nutzer können ein kostenloses ElevenReader-Konto erstellen. Bis zum 15. November 2024 haben sie die Möglichkeit, ihre …

Weiterlesen …

Open-Source-Toolkit Amphion unterstützt Forschung zu Audio-, Musik- und Sprachgenerierung

Das quelloffene Toolkit Amphion dient der Unterstützung von Forschung und Entwicklung im Bereich der Audio-, Musik- und Sprachgenerierung. Laut Projekt-Website bietet es einzigartige Visualisierungen klassischer Modelle und Architekturen, um Nachwuchsforscher*innen und Ingenieur*innen das Verständnis zu erleichtern. Amphion unterstützt verschiedene Generierungsaufgaben wie Text-to-Speech (TTS), Gesangsstimmensynthese (SVS), Stimmkonvertierung (VC), Gesangsstimmenkonvertierung (SVC), Text-to-Audio (TTA) und Text-to-Music (TTM). Zudem …

Weiterlesen …

Nützliches KI-Modell beschleunigt Spracherkennung bei hoher Genauigkeit

Das auf die Verbesserung der Mensch-Maschine-Kommunikation spezialisierte KI-Unternehmen Useful hat Moonshine als Open-Source-Modell veröffentlicht. Es soll die Latenzzeit von Sprachschnittstellen erheblich reduzieren und gleichzeitig die Genauigkeit von OpenAIs Whisper-Modell erreichen oder übertreffen. Laut Useful-Gründer Pete Warden liefert Moonshine Ergebnisse 1,7-mal schneller als Whisper. Dank des variablen Eingabefensters verarbeitet es kurze Audioclips fünfmal schneller. Der geringe …

Weiterlesen …

Open Washing: KI-Unternehmen täuschen mit „Open Source“-Label

Eine Studie von Andreas Liesenfeld und Mark Dingemanse vom Center for Language Studies der Radboud-Universität zeigt, dass viele KI-Unternehmen, darunter Google, Meta und Microsoft, Open Washing betreiben, indem sie ihre Produkte fälschlicherweise als Open Source deklarieren. Die Forscher untersuchten 45 Text- und Text-to-Image-Modelle und stellten fest, dass nur einige weniger bekannte Modelle die tatsächlichen Open-Source-Kriterien …

Weiterlesen …

Open Source Initiative veröffentlicht erste Open Source AI Definition

Die Open Source Initiative (OSI) hat Version 1.0 ihrer Open Source AI Definition (OSAID) veröffentlicht und damit den ersten Industriestandard zu der Frage festgelegt, ob ein KI-System als wirklich quelloffen gelten kann. Die OSAID wurde über Jahre in Zusammenarbeit mit Wissenschaft und Industrie entwickelt und erfordert von Open-Source-KI ausreichende Informationen, um das Modell im Wesentlichen …

Weiterlesen …

Meta veröffentlicht KI-Modelle für Mobilgeräte

Meta Platforms hat quantisierte Versionen seiner Llama 3.2 1B und 3B Modelle veröffentlicht, die laut Unternehmensangaben einen reduzierten Speicherbedarf, schnellere On-Device-Inferenz, Genauigkeit und Portabilität bieten sollen. Die Modelle wurden in enger Zusammenarbeit mit Qualcomm und MediaTek entwickelt und sind auf SoCs mit Arm-CPUs verfügbar. Meta gibt an, dass die durchschnittliche Modellgröße um 56% und der …

Weiterlesen …

Open Source bei Enterprise-KI vorn

Open-Source-KI-Modelle setzen sich in Unternehmen zunehmend gegen geschlossene Systeme wie GPT-4 durch. Das berichtet Matt Marshall für VentureBeat nach zahlreichen Gesprächen mit Führungskräften. Die offenen Modelle wie Metas Llama haben demnach inzwischen eine vergleichbare Qualität erreicht und bieten Unternehmen mehr Kontrolle, Anpassungsmöglichkeiten sowie bessere Kosteneffizienz. Große Technologieanbieter wie Salesforce, Oracle und SAP haben mittlerweile Open-Source-Modelle …

Weiterlesen …

Genmo Mochi 1 ist eine neue Open-Source-Video-KI

Genmo hat Mochi 1 veröffentlicht, ein Open-Source-KI-Modell, das aus Textbefehlen qualitativ hochwertige Videos generiert. Du kannst es auf dieser Seite kostenlos ausprobieren. Laut VentureBeat kann Genmo mit führenden proprietären Modellen wie Gen-3 Alpha von Runway und Dream Machine von Luma AI mithalten. Mochi 1 ist unter der Apache 2.0-Lizenz verfügbar und bietet den Nutzern im …

Weiterlesen …