Lightricks stellt kostenloses KI-Videomodell vor

Das israelische Technologieunternehmen Lightricks hat ein neues KI-Modell namens LTX Video (LTXV) eingeführt. Michael Nuñez berichtet für VentureBeat über diese Open-Source-Software, die fünfsekündige Videos in nur vier Sekunden erstellen kann. Das Modell läuft effizient auf handelsüblicher Hardware wie Nvidia RTX 4090 Grafikkarten. LTXV verfügt über zwei Milliarden Parameter und wird auf GitHub und Hugging Face …

Weiterlesen …

KI-System OpenScholar für wissenschaftliche Literaturanalyse

Ein neues Open-Source-KI-System namens OpenScholar könnte die wissenschaftliche Forschungsarbeit grundlegend verändern. Das vom Allen Institute for AI und der University of Washington entwickelte System, über das Michael Nuñez für VentureBeat berichtet, verarbeitet mehr als 45 Millionen frei zugängliche wissenschaftliche Publikationen. OpenScholar übertrifft dabei größere proprietäre Systeme wie GPT-4o in Genauigkeit und Zitierqualität. Das System zeichnet …

Weiterlesen …

KI-Modell vereint Spracherkennung mit Datenschutz

Das israelische Startup aiOla hat ein neues KI-Modell namens Whisper-NER entwickelt. Carl Franzen berichtet für VentureBeat über diese Innovation, die auf OpenAIs Whisper-Framework basiert. Das Open-Source-Modell kombiniert Spracherkennung mit der automatischen Erkennung sensibler Informationen. Es kann vertrauliche Daten wie Namen, Telefonnummern und Adressen während der Transkription in Echtzeit unkenntlich machen. Das Tool ist auf Hugging …

Weiterlesen …

Meta setzt auf Open-Source-KI-Modell Llama als neue Unternehmensstrategie

Meta hat unter der Führung von Mark Zuckerberg eine grundlegende strategische Neuausrichtung vollzogen, die das Open-Source-KI-Modell Llama in den Mittelpunkt stellt. Wie Sharon Goldman in Fortune berichtet, erfolgte im Juli 2023 die Entscheidung, Llama 2 als Open-Source-Projekt zu veröffentlichen, trotz interner Bedenken bezüglich Monetarisierung und Sicherheit. Das KI-Modell wurde inzwischen über 600 Millionen Mal heruntergeladen …

Weiterlesen …

Neue Entwicklerplattform AnyChat vereint führende KI-Sprachmodelle

Eine innovative Plattform namens AnyChat ermöglicht Entwicklern erstmals den gleichzeitigen Zugriff auf verschiedene KI-Sprachmodelle über eine einzige Schnittstelle. Der Entwickler Ahsen Khaliq hat das System so konzipiert, dass Nutzer problemlos zwischen Modellen wie ChatGPT, Google Gemini und Meta’s LLaMA wechseln können. Das berichtet Michael Nuñez für VentureBeat. Die Plattform unterstützt sowohl proprietäre als auch Open-Source-Modelle …

Weiterlesen …

Microsoft stellt Magentic-One vor, ein Open-Source-Framework zur Verwaltung von Multi-Agenten-KI-Systemen

Microsoft hat mit Magentic-One eine neue Open-Source-Infrastruktur veröffentlicht. Das System ermöglicht es einem einzigen KI-Modell, mehrere Hilfsagenten zu steuern, die zusammenarbeiten, um komplexe, mehrstufige Aufgaben in verschiedenen Szenarien zu erledigen. Magentic-One basiert auf einem Orchestrator-Agenten, der vier weitere Agenten leitet: Websurfer, FileSurfer, Coder und ComputerTerminal. Laut Microsoft-Forschern ist Magentic-One ein generalistisches Agentensystem, das die lang …

Weiterlesen …

OmniGen: Erstes einheitliches Modell für Bildgenerierung

Forscher haben OmniGen vorgestellt, das erste Diffusionsmodell, das verschiedene Bildgenerierungsaufgaben in einem einzigen Framework vereinen kann. Im Gegensatz zu bestehenden Modellen wie Stable Diffusion benötigt OmniGen keine zusätzlichen Module, um unterschiedliche Steuerbedingungen zu verarbeiten, so die Autoren Shitao Xiao, Yueze Wang, Junjie Zhou, Huaying Yuan et al. Das Modell kann Text-zu-Bild-Generierung, Bildbearbeitung, subjektgesteuerte Generierung, visuell-bedingte …

Weiterlesen …

Hugging Face veröffentlicht effiziente KI-Sprachmodelle für Mobilgeräte

Hugging Face hat mit SmolLM2 eine neue Familie kompakter Sprachmodelle vorgestellt, die speziell für den Einsatz auf Smartphones und Edge-Geräten mit begrenzter Rechenleistung und Speicherkapazität entwickelt wurden. Die unter der Apache 2.0-Lizenz veröffentlichten Modelle sind in drei Größen bis zu 1,7 Milliarden Parametern erhältlich. Trotz ihrer kompakten Größe erzielen sie beeindruckende Ergebnisse bei wichtigen Benchmarks …

Weiterlesen …

Meta stellt Llama-KI-Modelle für US-Verteidigungsanwendungen bereit

Meta macht seine Llama-KI-Modelle für US-Regierungsbehörden und Auftragnehmer verfügbar, die an Verteidigungs- und nationalen Sicherheitsanwendungen arbeiten. Das Unternehmen kooperiert dazu mit Firmen wie Accenture, Amazon Web Services und Lockheed Martin, berichtet TechCrunch. Der Schritt erfolgt, nachdem chinesische Forscher mit Verbindungen zur Volksbefreiungsarmee ein älteres Llama-Modell für militärische Zwecke verwendet haben sollen, was laut Meta unerlaubt …

Weiterlesen …

ElevenLabs übernimmt Omnivore zur Weiterentwicklung der ElevenReader App

Das KI-Audiounternehmen ElevenLabs hat die Lese-App Omnivore übernommen. Ziel ist es, die neue ElevenReader App des Unternehmens weiterzuentwickeln. Laut einer Mitteilung der Omnivore-Gründer Jackson und Hongbo ermöglicht die Übernahme die Entwicklung zugänglicherer Lese- und Hörerlebnisse auf einer größeren Plattform. Omnivore-Nutzer können ein kostenloses ElevenReader-Konto erstellen. Bis zum 15. November 2024 haben sie die Möglichkeit, ihre …

Weiterlesen …