Open-Source-Toolkit Amphion unterstützt Forschung zu Audio-, Musik- und Sprachgenerierung

Das quelloffene Toolkit Amphion dient der Unterstützung von Forschung und Entwicklung im Bereich der Audio-, Musik- und Sprachgenerierung. Laut Projekt-Website bietet es einzigartige Visualisierungen klassischer Modelle und Architekturen, um Nachwuchsforscher*innen und Ingenieur*innen das Verständnis zu erleichtern. Amphion unterstützt verschiedene Generierungsaufgaben wie Text-to-Speech (TTS), Gesangsstimmensynthese (SVS), Stimmkonvertierung (VC), Gesangsstimmenkonvertierung (SVC), Text-to-Audio (TTA) und Text-to-Music (TTM). Zudem …

Weiterlesen …

Nützliches KI-Modell beschleunigt Spracherkennung bei hoher Genauigkeit

Das auf die Verbesserung der Mensch-Maschine-Kommunikation spezialisierte KI-Unternehmen Useful hat Moonshine als Open-Source-Modell veröffentlicht. Es soll die Latenzzeit von Sprachschnittstellen erheblich reduzieren und gleichzeitig die Genauigkeit von OpenAIs Whisper-Modell erreichen oder übertreffen. Laut Useful-Gründer Pete Warden liefert Moonshine Ergebnisse 1,7-mal schneller als Whisper. Dank des variablen Eingabefensters verarbeitet es kurze Audioclips fünfmal schneller. Der geringe …

Weiterlesen …

Open Washing: KI-Unternehmen täuschen mit „Open Source“-Label

Eine Studie von Andreas Liesenfeld und Mark Dingemanse vom Center for Language Studies der Radboud-Universität zeigt, dass viele KI-Unternehmen, darunter Google, Meta und Microsoft, Open Washing betreiben, indem sie ihre Produkte fälschlicherweise als Open Source deklarieren. Die Forscher untersuchten 45 Text- und Text-to-Image-Modelle und stellten fest, dass nur einige weniger bekannte Modelle die tatsächlichen Open-Source-Kriterien …

Weiterlesen …

Open Source Initiative veröffentlicht erste Open Source AI Definition

Die Open Source Initiative (OSI) hat Version 1.0 ihrer Open Source AI Definition (OSAID) veröffentlicht und damit den ersten Industriestandard zu der Frage festgelegt, ob ein KI-System als wirklich quelloffen gelten kann. Die OSAID wurde über Jahre in Zusammenarbeit mit Wissenschaft und Industrie entwickelt und erfordert von Open-Source-KI ausreichende Informationen, um das Modell im Wesentlichen …

Weiterlesen …

Meta veröffentlicht KI-Modelle für Mobilgeräte

Meta Platforms hat quantisierte Versionen seiner Llama 3.2 1B und 3B Modelle veröffentlicht, die laut Unternehmensangaben einen reduzierten Speicherbedarf, schnellere On-Device-Inferenz, Genauigkeit und Portabilität bieten sollen. Die Modelle wurden in enger Zusammenarbeit mit Qualcomm und MediaTek entwickelt und sind auf SoCs mit Arm-CPUs verfügbar. Meta gibt an, dass die durchschnittliche Modellgröße um 56% und der …

Weiterlesen …

Open Source bei Enterprise-KI vorn

Open-Source-KI-Modelle setzen sich in Unternehmen zunehmend gegen geschlossene Systeme wie GPT-4 durch. Das berichtet Matt Marshall für VentureBeat nach zahlreichen Gesprächen mit Führungskräften. Die offenen Modelle wie Metas Llama haben demnach inzwischen eine vergleichbare Qualität erreicht und bieten Unternehmen mehr Kontrolle, Anpassungsmöglichkeiten sowie bessere Kosteneffizienz. Große Technologieanbieter wie Salesforce, Oracle und SAP haben mittlerweile Open-Source-Modelle …

Weiterlesen …

Genmo Mochi 1 ist eine neue Open-Source-Video-KI

Genmo hat Mochi 1 veröffentlicht, ein Open-Source-KI-Modell, das aus Textbefehlen qualitativ hochwertige Videos generiert. Du kannst es auf dieser Seite kostenlos ausprobieren. Laut VentureBeat kann Genmo mit führenden proprietären Modellen wie Gen-3 Alpha von Runway und Dream Machine von Luma AI mithalten. Mochi 1 ist unter der Apache 2.0-Lizenz verfügbar und bietet den Nutzern im …

Weiterlesen …

ComfyUI V1: KI-Bilder direkt auf dem eigenen Rechner generieren

Die KI-Bildgenerierungssoftware ComfyUI ist in der Version 1.0 erschienen und bietet nun eine Desktop-Version für Windows, macOS und Linux. Zum Hintergrund: ComfyUI ermöglicht es dir, komplexe Bildgenerierungspipelines direkt auf dem eigenen Rechner umzusetzen. Im Gegensatz zu Cloud-basierten Lösungen bietet die Software volle Kontrolle über den Prozess und die eigenen Daten. Die brandneue Desktop-Version befindet sich …

Weiterlesen …

IBM veröffentlicht Granite 3.0 Modelle für Unternehmen

IBM erweitert sein KI-Angebot für Unternehmen mit der Einführung der Granite 3.0 Large Language Models (LLMs), berichtet Sean Michael Kerner für VentureBeat. Die neuen Modelle sind als Open Source unter der Apache 2.0 Lizenz verfügbar und sollen verschiedene Anwendungsfälle wie Kundenservice, IT-Automatisierung und Cybersicherheit unterstützen. IBM betont die hohe Leistung der Modelle, die laut eigenen …

Weiterlesen …

Nvidia veröffentlicht leistungsstarkes und offenes KI-Modell

Nvidia hat ein neues KI-Modell, Llama-3.1-Nemotron-70B-Instruct, vorgestellt, das bestehende Modelle von OpenAI und anderen Anbietern übertrifft und einen fortgesetzten Wandel in der KI-Strategie des Unternehmens zeigt. Das Modell, das auf Hugging Face verfügbar ist, erzielte beeindruckende Benchmark-Ergebnisse und positioniert Nvidia als wettbewerbsfähigen Akteur im Bereich Sprachverständnis und -generierung. Diese Entwicklung zeigt Nvidias Wandel von einem …

Weiterlesen …