Meta setzt auf Open-Source-KI-Modell Llama als neue Unternehmensstrategie

Meta hat unter der Führung von Mark Zuckerberg eine grundlegende strategische Neuausrichtung vollzogen, die das Open-Source-KI-Modell Llama in den Mittelpunkt stellt. Wie Sharon Goldman in Fortune berichtet, erfolgte im Juli 2023 die Entscheidung, Llama 2 als Open-Source-Projekt zu veröffentlichen, trotz interner Bedenken bezüglich Monetarisierung und Sicherheit. Das KI-Modell wurde inzwischen über 600 Millionen Mal heruntergeladen … Weiterlesen …

Neue Entwicklerplattform AnyChat vereint führende KI-Sprachmodelle

Eine innovative Plattform namens AnyChat ermöglicht Entwicklern erstmals den gleichzeitigen Zugriff auf verschiedene KI-Sprachmodelle über eine einzige Schnittstelle. Der Entwickler Ahsen Khaliq hat das System so konzipiert, dass Nutzer problemlos zwischen Modellen wie ChatGPT, Google Gemini und Meta’s LLaMA wechseln können. Das berichtet Michael Nuñez für VentureBeat. Die Plattform unterstützt sowohl proprietäre als auch Open-Source-Modelle … Weiterlesen …

Microsoft stellt Magentic-One vor, ein Open-Source-Framework zur Verwaltung von Multi-Agenten-KI-Systemen

Microsoft hat mit Magentic-One eine neue Open-Source-Infrastruktur veröffentlicht. Das System ermöglicht es einem einzigen KI-Modell, mehrere Hilfsagenten zu steuern, die zusammenarbeiten, um komplexe, mehrstufige Aufgaben in verschiedenen Szenarien zu erledigen. Magentic-One basiert auf einem Orchestrator-Agenten, der vier weitere Agenten leitet: Websurfer, FileSurfer, Coder und ComputerTerminal. Laut Microsoft-Forschern ist Magentic-One ein generalistisches Agentensystem, das die lang … Weiterlesen …

OmniGen: Erstes einheitliches Modell für Bildgenerierung

Forscher haben OmniGen vorgestellt, das erste Diffusionsmodell, das verschiedene Bildgenerierungsaufgaben in einem einzigen Framework vereinen kann. Im Gegensatz zu bestehenden Modellen wie Stable Diffusion benötigt OmniGen keine zusätzlichen Module, um unterschiedliche Steuerbedingungen zu verarbeiten, so die Autoren Shitao Xiao, Yueze Wang, Junjie Zhou, Huaying Yuan et al. Das Modell kann Text-zu-Bild-Generierung, Bildbearbeitung, subjektgesteuerte Generierung, visuell-bedingte … Weiterlesen …

Hugging Face veröffentlicht effiziente KI-Sprachmodelle für Mobilgeräte

Hugging Face hat mit SmolLM2 eine neue Familie kompakter Sprachmodelle vorgestellt, die speziell für den Einsatz auf Smartphones und Edge-Geräten mit begrenzter Rechenleistung und Speicherkapazität entwickelt wurden. Die unter der Apache 2.0-Lizenz veröffentlichten Modelle sind in drei Größen bis zu 1,7 Milliarden Parametern erhältlich. Trotz ihrer kompakten Größe erzielen sie beeindruckende Ergebnisse bei wichtigen Benchmarks … Weiterlesen …

Meta stellt Llama-KI-Modelle für US-Verteidigungsanwendungen bereit

Meta macht seine Llama-KI-Modelle für US-Regierungsbehörden und Auftragnehmer verfügbar, die an Verteidigungs- und nationalen Sicherheitsanwendungen arbeiten. Das Unternehmen kooperiert dazu mit Firmen wie Accenture, Amazon Web Services und Lockheed Martin, berichtet TechCrunch. Der Schritt erfolgt, nachdem chinesische Forscher mit Verbindungen zur Volksbefreiungsarmee ein älteres Llama-Modell für militärische Zwecke verwendet haben sollen, was laut Meta unerlaubt … Weiterlesen …

ElevenLabs übernimmt Omnivore zur Weiterentwicklung der ElevenReader App

Das KI-Audiounternehmen ElevenLabs hat die Lese-App Omnivore übernommen. Ziel ist es, die neue ElevenReader App des Unternehmens weiterzuentwickeln. Laut einer Mitteilung der Omnivore-Gründer Jackson und Hongbo ermöglicht die Übernahme die Entwicklung zugänglicherer Lese- und Hörerlebnisse auf einer größeren Plattform. Omnivore-Nutzer können ein kostenloses ElevenReader-Konto erstellen. Bis zum 15. November 2024 haben sie die Möglichkeit, ihre … Weiterlesen …

Open-Source-Toolkit Amphion unterstützt Forschung zu Audio-, Musik- und Sprachgenerierung

Das quelloffene Toolkit Amphion dient der Unterstützung von Forschung und Entwicklung im Bereich der Audio-, Musik- und Sprachgenerierung. Laut Projekt-Website bietet es einzigartige Visualisierungen klassischer Modelle und Architekturen, um Nachwuchsforscher*innen und Ingenieur*innen das Verständnis zu erleichtern. Amphion unterstützt verschiedene Generierungsaufgaben wie Text-to-Speech (TTS), Gesangsstimmensynthese (SVS), Stimmkonvertierung (VC), Gesangsstimmenkonvertierung (SVC), Text-to-Audio (TTA) und Text-to-Music (TTM). Zudem … Weiterlesen …

Nützliches KI-Modell beschleunigt Spracherkennung bei hoher Genauigkeit

Das auf die Verbesserung der Mensch-Maschine-Kommunikation spezialisierte KI-Unternehmen Useful hat Moonshine als Open-Source-Modell veröffentlicht. Es soll die Latenzzeit von Sprachschnittstellen erheblich reduzieren und gleichzeitig die Genauigkeit von OpenAIs Whisper-Modell erreichen oder übertreffen. Laut Useful-Gründer Pete Warden liefert Moonshine Ergebnisse 1,7-mal schneller als Whisper. Dank des variablen Eingabefensters verarbeitet es kurze Audioclips fünfmal schneller. Der geringe … Weiterlesen …

Open Washing: KI-Unternehmen täuschen mit „Open Source“-Label

Eine Studie von Andreas Liesenfeld und Mark Dingemanse vom Center for Language Studies der Radboud-Universität zeigt, dass viele KI-Unternehmen, darunter Google, Meta und Microsoft, Open Washing betreiben, indem sie ihre Produkte fälschlicherweise als Open Source deklarieren. Die Forscher untersuchten 45 Text- und Text-to-Image-Modelle und stellten fest, dass nur einige weniger bekannte Modelle die tatsächlichen Open-Source-Kriterien … Weiterlesen …