Hugging Face veröffentlicht kleines Sprachmodell mit vollständiger Bauanleitung

Hugging Face hat mit SmolLM3 ein neues kleines Sprachmodell veröffentlicht. Laut der offiziellen Ankündigung des Unternehmens ist das 3-Milliarden-Parameter-Modell besonders leistungsstark und effizient. Eine Besonderheit ist der duale Modus: Das Modell kann entweder direkt antworten oder seinen Denkprozess transparent aufzeigen. Es verarbeitet zudem lange Texte mit bis zu 128.000 Tokens und unterstützt sechs europäische Sprachen. …

Weiterlesen …

MiniMax veröffentlicht leistungsstarkes Open-Source-KI-Modell

Das chinesische Unternehmen MiniMax hat MiniMax-M1 veröffentlicht, ein neues Open-Source-Sprachmodell mit einem Kontextfenster von einer Million Token. Damit kann es ganze Buchsammlungen in einem Gespräch verarbeiten, berichtet Carl Franzen für VentureBeat. Das Modell steht unter Apache 2.0 Lizenz kostenlos für kommerzielle Nutzung auf Plattformen wie Hugging Face zur Verfügung. MiniMax-M1 gibt es in zwei Varianten …

Weiterlesen …

Mistral: erste Reasoning-KI-Modelle und europäische Cloud-Infrastruktur

Das französische KI-Unternehmen Mistral hat seine ersten Reasoning-Modelle veröffentlicht und den Aufbau einer europäischen Cloud-Infrastruktur angekündigt. Das Unternehmen positioniert sich damit als Alternative zu amerikanischen Tech-Giganten. Mistral stellte zwei KI-Modelle namens Magistral vor und kündigte ein neues Rechenzentrum-Projekt bei Paris an. Magistral Small mit 24 Milliarden Parametern ist als Open-Source-Software unter der Apache 2.0-Lizenz verfügbar. …

Weiterlesen …

Google veröffentlicht App für lokale AI-Modelle auf Android

Google hat eine experimentelle Android-App namens AI Edge Gallery veröffentlicht, mit der Nutzer KI-Modelle direkt auf ihren Smartphones ohne Internetverbindung ausführen können. Die App ist über GitHub verfügbar und kommt später auch für iOS-Geräte. Nutzer können AI-Modelle von der Hugging Face-Plattform herunterladen und ausführen, um Aufgaben wie Bildanalyse, Textgenerierung und Programmier-Unterstützung zu erledigen. Die gesamte …

Weiterlesen …

DeepSeek veröffentlicht großes Update

Das chinesische KI-Startup DeepSeek hat ein bedeutendes Update für sein Open-Source-Reasoning-Modell veröffentlicht. Die neue Version DeepSeek-R1-0528 kommt kostenpflichtigen Diensten von OpenAI und Google deutlich näher. Das Modell zeigt erhebliche Verbesserungen bei komplexen Denkaufgaben in Mathematik, Wissenschaft und Programmierung. Carl Franzen von VentureBeat berichtet, dass das aktualisierte Modell 87,5 Prozent Genauigkeit im AIME 2025 Test erreichte. …

Weiterlesen …

Prime Intellects neue KI wurde dezentral trainiert

Prime Intellect hat mit INTELLECT-2 ein KI-Modell mit 32 Milliarden Parametern veröffentlicht, das erstmals durch global verteiltes Reinforcement Learning trainiert wurde. Das Modell nutzt einen dezentralen Ansatz mit Rechenressourcen von Mitwirkenden weltweit anstatt zentralisierter GPU-Cluster. Die speziell entwickelte Infrastruktur umfasst Komponenten wie PRIME-RL, TOPLOC und SHARDCAST, die asynchrones Training über heterogene Netzwerke ermöglichen. Laut Prime …

Weiterlesen …

Microsoft erweitert Phi-Sprachmodellfamilie mit neuen Reasoning-Fähigkeiten

Microsoft hat drei neue kleine Sprachmodelle (SLMs) vorgestellt, die sich auf komplexe Reasoning-Aufgaben konzentrieren: Phi-4-reasoning, Phi-4-reasoning-plus und Phi-4-mini-reasoning. Diese Modelle sind für angesichts ihrer kompakten Größe erstaunlich leistungsfähig, besonders bei mathematischem Reasoning und mehrstufiger Problemlösung. Das Flaggschiff Phi-4-reasoning-plus, ein Modell mit 14 Milliarden Parametern, zeigt eine Leistung, die offenbar mit viel größeren KI-Systemen mithalten kann. …

Weiterlesen …

Alibaba veröffentlicht Qwen3-Modelle mit KI-Reasoning-Fähigkeiten

Alibaba hat mit Qwen3 eine neue Familie von großen Sprachmodellen vorgestellt, die mit führenden KI-Systemen von OpenAI und Google konkurrieren. Die Produktreihe umfasst zwei Mixture-of-Experts (MoE)-Modelle und sechs Dense-Modelle mit Parametern zwischen 0,6 und 235 Milliarden. Laut den von Alibaba veröffentlichten Benchmarks übertrifft das Flaggschiffmodell Qwen3-235B-A22B DeepSeek R1 und OpenAIs o1 in mehreren wichtigen Metriken …

Weiterlesen …

Pleias veröffentlicht kleine KI-Modelle für RAG mit integrierter Quellenangabe

Das französische KI-Startup Pleias hat zwei quelloffene Reasoning-Modelle für Retrieval-Augmented Generation (RAG) mit nativer Zitierunterstützung vorgestellt. Laut Carl Franzen von VentureBeat sind die neuen Modelle – Pleias-RAG-350M und Pleias-RAG-1B – unter der Apache 2.0-Lizenz verfügbar und erlauben kommerzielle Nutzung. Trotz ihrer geringen Größe übertreffen die Modelle viele größere Alternativen bei komplexen Reasoning-Aufgaben und bieten starke …

Weiterlesen …

Neues KI-Sprachmodell Dia bietet natürliche Dialogfähigkeiten

Das Startup Nari Labs hat mit Dia ein Open-Source-Sprachmodell veröffentlicht, das natürlich klingende Dialoge erzeugen kann. Wie VentureBeat-Journalist Carl Franzen berichtet, soll das 1,6 Milliarden Parameter umfassende Modell mit Angeboten von ElevenLabs, OpenAI und Googles NotebookLM konkurrieren können. Mitgründer Toby Kim entwickelte Dia „ohne Finanzierung“ mit Unterstützung von Google, das Zugang zu TPU-Chips gewährte. Das …

Weiterlesen …