Metas KI-Modell mit GPT-4-Leistung läuft auf High-End Notebooks

Meta hat mit Llama 3.3 70B ein neues KI-Sprachmodell vorgestellt, das auf leistungsstarken Notebooks läuft und dabei eine Leistung auf GPT-4-Niveau erreicht. Das berichtet Simon Willison. Er testete das Modell erfolgreich auf einem MacBook Pro M2 mit 64 GB RAM und benötigt etwa 42 GB Speicherplatz für die Installation. In unabhängigen Tests durch LiveBench erreichte …

Weiterlesen …

Hugging Face stellt ressourcensparendes KI-Modell vor

Hugging Face hat ein neues KI-Modell namens SmolVLM entwickelt, das Bild- und Textverarbeitung kombiniert. Wie Michael Nuñez berichtet, benötigt das Modell nur 5,02 GB GPU-Arbeitsspeicher. Vergleichbare Systeme brauchen bis zu 13,70 GB. SmolVLM nutzt eine fortschrittliche Kompressionstechnologie für die Bildverarbeitung. Das System verarbeitet Bilder mit 384×384 Pixeln durch nur 81 visuelle Token. Es ist in …

Weiterlesen …

LLaVA-o1 verbessert Bildverarbeitung durch strukturiertes Denken

Chinesische Forscher haben ein neuartiges KI-System namens LLaVA-o1 entwickelt. Ben Dickson berichtet für VentureBeat über dieses offene Sprachmodell für visuelle Verarbeitung. Das System nutzt einen vierstufigen Denkprozess: Zusammenfassung, Bildbeschreibung, Analyse und Schlussfolgerung. LLaVA-o1 basiert auf Llama-3.2-11B-Vision-Instruct und wurde mit 100.000 Bild-Text-Paaren trainiert. Eine besondere Innovation ist die „Stage-Level-Beam-Search“-Technik zur Verbesserung der Genauigkeit. In Tests übertraf …

Weiterlesen …

Lightricks stellt kostenloses KI-Videomodell vor

Das israelische Technologieunternehmen Lightricks hat ein neues KI-Modell namens LTX Video (LTXV) eingeführt. Michael Nuñez berichtet für VentureBeat über diese Open-Source-Software, die fünfsekündige Videos in nur vier Sekunden erstellen kann. Das Modell läuft effizient auf handelsüblicher Hardware wie Nvidia RTX 4090 Grafikkarten. LTXV verfügt über zwei Milliarden Parameter und wird auf GitHub und Hugging Face …

Weiterlesen …

KI-System OpenScholar für wissenschaftliche Literaturanalyse

Ein neues Open-Source-KI-System namens OpenScholar könnte die wissenschaftliche Forschungsarbeit grundlegend verändern. Das vom Allen Institute for AI und der University of Washington entwickelte System, über das Michael Nuñez für VentureBeat berichtet, verarbeitet mehr als 45 Millionen frei zugängliche wissenschaftliche Publikationen. OpenScholar übertrifft dabei größere proprietäre Systeme wie GPT-4o in Genauigkeit und Zitierqualität. Das System zeichnet …

Weiterlesen …

KI-Modell vereint Spracherkennung mit Datenschutz

Das israelische Startup aiOla hat ein neues KI-Modell namens Whisper-NER entwickelt. Carl Franzen berichtet für VentureBeat über diese Innovation, die auf OpenAIs Whisper-Framework basiert. Das Open-Source-Modell kombiniert Spracherkennung mit der automatischen Erkennung sensibler Informationen. Es kann vertrauliche Daten wie Namen, Telefonnummern und Adressen während der Transkription in Echtzeit unkenntlich machen. Das Tool ist auf Hugging …

Weiterlesen …

Meta setzt auf Open-Source-KI-Modell Llama als neue Unternehmensstrategie

Meta hat unter der Führung von Mark Zuckerberg eine grundlegende strategische Neuausrichtung vollzogen, die das Open-Source-KI-Modell Llama in den Mittelpunkt stellt. Wie Sharon Goldman in Fortune berichtet, erfolgte im Juli 2023 die Entscheidung, Llama 2 als Open-Source-Projekt zu veröffentlichen, trotz interner Bedenken bezüglich Monetarisierung und Sicherheit. Das KI-Modell wurde inzwischen über 600 Millionen Mal heruntergeladen …

Weiterlesen …

Neue Entwicklerplattform AnyChat vereint führende KI-Sprachmodelle

Eine innovative Plattform namens AnyChat ermöglicht Entwicklern erstmals den gleichzeitigen Zugriff auf verschiedene KI-Sprachmodelle über eine einzige Schnittstelle. Der Entwickler Ahsen Khaliq hat das System so konzipiert, dass Nutzer problemlos zwischen Modellen wie ChatGPT, Google Gemini und Meta’s LLaMA wechseln können. Das berichtet Michael Nuñez für VentureBeat. Die Plattform unterstützt sowohl proprietäre als auch Open-Source-Modelle …

Weiterlesen …

Microsoft stellt Magentic-One vor, ein Open-Source-Framework zur Verwaltung von Multi-Agenten-KI-Systemen

Microsoft hat mit Magentic-One eine neue Open-Source-Infrastruktur veröffentlicht. Das System ermöglicht es einem einzigen KI-Modell, mehrere Hilfsagenten zu steuern, die zusammenarbeiten, um komplexe, mehrstufige Aufgaben in verschiedenen Szenarien zu erledigen. Magentic-One basiert auf einem Orchestrator-Agenten, der vier weitere Agenten leitet: Websurfer, FileSurfer, Coder und ComputerTerminal. Laut Microsoft-Forschern ist Magentic-One ein generalistisches Agentensystem, das die lang …

Weiterlesen …

OmniGen: Erstes einheitliches Modell für Bildgenerierung

Forscher haben OmniGen vorgestellt, das erste Diffusionsmodell, das verschiedene Bildgenerierungsaufgaben in einem einzigen Framework vereinen kann. Im Gegensatz zu bestehenden Modellen wie Stable Diffusion benötigt OmniGen keine zusätzlichen Module, um unterschiedliche Steuerbedingungen zu verarbeiten, so die Autoren Shitao Xiao, Yueze Wang, Junjie Zhou, Huaying Yuan et al. Das Modell kann Text-zu-Bild-Generierung, Bildbearbeitung, subjektgesteuerte Generierung, visuell-bedingte …

Weiterlesen …