IBM stellt verbesserte Granite 3.1 Sprachmodelle vor

IBM hat eine neue Version seiner Open-Source-Sprachmodelle, Granite 3.1, veröffentlicht. Wie Sean Michael Kerner für VentureBeat berichtet, bieten die neuen Modelle deutliche Verbesserungen in Leistung und Funktionalität. Das Granite 8B Instruct Modell übertrifft laut IBM vergleichbare Konkurrenzprodukte wie Meta Llama 3.1 und Google Gemma 2 in akademischen Benchmarks. Die Kontextlänge wurde von 4.000 auf 128.000 … Weiterlesen …

Microsoft entwickelt kompaktes KI-Modell mit hoher Leistung

Microsoft hat ein neues KI-Modell namens Phi-4 vorgestellt, das trotz geringerer Größe bessere Leistungen als konkurrierende Systeme erzielt. Wie Michael Nuñez für VentureBeat berichtet, übertrifft das Modell mit nur 14 Milliarden Parametern größere Systeme wie Google’s Gemini Pro 1.5. Phi-4 zeigt besondere Stärken im mathematischen Denken und erreichte Bestwerte bei standardisierten Mathematik-Wettbewerben. Microsoft stellt das … Weiterlesen …

NitroFusion erstellt Bilder blitzschnell auf Standardhardware

Die Universität Surrey hat ein bahnbrechendes KI-Modell namens NitroFusion vorgestellt. Das System erzeugt Bilder in Echtzeit, während Benutzer tippen. Die Entwicklung stammt aus dem SketchX-Labor des universitären Instituts für Menschen-zentrierte Künstliche Intelligenz (PAI). Das Besondere: NitroFusion läuft auf handelsüblichen Grafikkarten. Im Gegensatz zu bestehenden Bildgenerierungssystemen benötigt das Modell keine aufwendige Computerinfrastruktur. Es nutzt ein dynamisches … Weiterlesen …

ServiceNow stellt KI-Trainings-Beschleuniger als Open Source vor

ServiceNow hat Fast-LLM veröffentlicht, ein Open-Source-Framework zur Beschleunigung von KI-Modelltraining um 20%. Dies berichtet Sean Michael Kerner für VentureBeat. Das System wurde bereits erfolgreich beim Training von ServiceNows StarCoder 2 Sprachmodell eingesetzt. Fast-LLM führt zwei wichtige Neuerungen ein: „Breadth-First Pipeline Parallelism“ für optimierte Berechnungsabläufe und ein verbessertes Speichermanagement. Das Framework lässt sich als direkter Ersatz … Weiterlesen …

Metas KI-Modell mit GPT-4-Leistung läuft auf High-End Notebooks

Meta hat mit Llama 3.3 70B ein neues KI-Sprachmodell vorgestellt, das auf leistungsstarken Notebooks läuft und dabei eine Leistung auf GPT-4-Niveau erreicht. Das berichtet Simon Willison. Er testete das Modell erfolgreich auf einem MacBook Pro M2 mit 64 GB RAM und benötigt etwa 42 GB Speicherplatz für die Installation. In unabhängigen Tests durch LiveBench erreichte … Weiterlesen …

Hugging Face stellt ressourcensparendes KI-Modell vor

Hugging Face hat ein neues KI-Modell namens SmolVLM entwickelt, das Bild- und Textverarbeitung kombiniert. Wie Michael Nuñez berichtet, benötigt das Modell nur 5,02 GB GPU-Arbeitsspeicher. Vergleichbare Systeme brauchen bis zu 13,70 GB. SmolVLM nutzt eine fortschrittliche Kompressionstechnologie für die Bildverarbeitung. Das System verarbeitet Bilder mit 384×384 Pixeln durch nur 81 visuelle Token. Es ist in … Weiterlesen …

LLaVA-o1 verbessert Bildverarbeitung durch strukturiertes Denken

Chinesische Forscher haben ein neuartiges KI-System namens LLaVA-o1 entwickelt. Ben Dickson berichtet für VentureBeat über dieses offene Sprachmodell für visuelle Verarbeitung. Das System nutzt einen vierstufigen Denkprozess: Zusammenfassung, Bildbeschreibung, Analyse und Schlussfolgerung. LLaVA-o1 basiert auf Llama-3.2-11B-Vision-Instruct und wurde mit 100.000 Bild-Text-Paaren trainiert. Eine besondere Innovation ist die „Stage-Level-Beam-Search“-Technik zur Verbesserung der Genauigkeit. In Tests übertraf … Weiterlesen …

Lightricks stellt kostenloses KI-Videomodell vor

Das israelische Technologieunternehmen Lightricks hat ein neues KI-Modell namens LTX Video (LTXV) eingeführt. Michael Nuñez berichtet für VentureBeat über diese Open-Source-Software, die fünfsekündige Videos in nur vier Sekunden erstellen kann. Das Modell läuft effizient auf handelsüblicher Hardware wie Nvidia RTX 4090 Grafikkarten. LTXV verfügt über zwei Milliarden Parameter und wird auf GitHub und Hugging Face … Weiterlesen …

KI-System OpenScholar für wissenschaftliche Literaturanalyse

Ein neues Open-Source-KI-System namens OpenScholar könnte die wissenschaftliche Forschungsarbeit grundlegend verändern. Das vom Allen Institute for AI und der University of Washington entwickelte System, über das Michael Nuñez für VentureBeat berichtet, verarbeitet mehr als 45 Millionen frei zugängliche wissenschaftliche Publikationen. OpenScholar übertrifft dabei größere proprietäre Systeme wie GPT-4o in Genauigkeit und Zitierqualität. Das System zeichnet … Weiterlesen …

KI-Modell vereint Spracherkennung mit Datenschutz

Das israelische Startup aiOla hat ein neues KI-Modell namens Whisper-NER entwickelt. Carl Franzen berichtet für VentureBeat über diese Innovation, die auf OpenAIs Whisper-Framework basiert. Das Open-Source-Modell kombiniert Spracherkennung mit der automatischen Erkennung sensibler Informationen. Es kann vertrauliche Daten wie Namen, Telefonnummern und Adressen während der Transkription in Echtzeit unkenntlich machen. Das Tool ist auf Hugging … Weiterlesen …