DeepSeek veröffentlicht großes Update

Das chinesische KI-Startup DeepSeek hat ein bedeutendes Update für sein Open-Source-Reasoning-Modell veröffentlicht. Die neue Version DeepSeek-R1-0528 kommt kostenpflichtigen Diensten von OpenAI und Google deutlich näher. Das Modell zeigt erhebliche Verbesserungen bei komplexen Denkaufgaben in Mathematik, Wissenschaft und Programmierung. Carl Franzen von VentureBeat berichtet, dass das aktualisierte Modell 87,5 Prozent Genauigkeit im AIME 2025 Test erreichte. …

Weiterlesen …

Prime Intellects neue KI wurde dezentral trainiert

Prime Intellect hat mit INTELLECT-2 ein KI-Modell mit 32 Milliarden Parametern veröffentlicht, das erstmals durch global verteiltes Reinforcement Learning trainiert wurde. Das Modell nutzt einen dezentralen Ansatz mit Rechenressourcen von Mitwirkenden weltweit anstatt zentralisierter GPU-Cluster. Die speziell entwickelte Infrastruktur umfasst Komponenten wie PRIME-RL, TOPLOC und SHARDCAST, die asynchrones Training über heterogene Netzwerke ermöglichen. Laut Prime …

Weiterlesen …

Microsoft erweitert Phi-Sprachmodellfamilie mit neuen Reasoning-Fähigkeiten

Microsoft hat drei neue kleine Sprachmodelle (SLMs) vorgestellt, die sich auf komplexe Reasoning-Aufgaben konzentrieren: Phi-4-reasoning, Phi-4-reasoning-plus und Phi-4-mini-reasoning. Diese Modelle sind für angesichts ihrer kompakten Größe erstaunlich leistungsfähig, besonders bei mathematischem Reasoning und mehrstufiger Problemlösung. Das Flaggschiff Phi-4-reasoning-plus, ein Modell mit 14 Milliarden Parametern, zeigt eine Leistung, die offenbar mit viel größeren KI-Systemen mithalten kann. …

Weiterlesen …

Alibaba veröffentlicht Qwen3-Modelle mit KI-Reasoning-Fähigkeiten

Alibaba hat mit Qwen3 eine neue Familie von großen Sprachmodellen vorgestellt, die mit führenden KI-Systemen von OpenAI und Google konkurrieren. Die Produktreihe umfasst zwei Mixture-of-Experts (MoE)-Modelle und sechs Dense-Modelle mit Parametern zwischen 0,6 und 235 Milliarden. Laut den von Alibaba veröffentlichten Benchmarks übertrifft das Flaggschiffmodell Qwen3-235B-A22B DeepSeek R1 und OpenAIs o1 in mehreren wichtigen Metriken …

Weiterlesen …

Pleias veröffentlicht kleine KI-Modelle für RAG mit integrierter Quellenangabe

Das französische KI-Startup Pleias hat zwei quelloffene Reasoning-Modelle für Retrieval-Augmented Generation (RAG) mit nativer Zitierunterstützung vorgestellt. Laut Carl Franzen von VentureBeat sind die neuen Modelle – Pleias-RAG-350M und Pleias-RAG-1B – unter der Apache 2.0-Lizenz verfügbar und erlauben kommerzielle Nutzung. Trotz ihrer geringen Größe übertreffen die Modelle viele größere Alternativen bei komplexen Reasoning-Aufgaben und bieten starke …

Weiterlesen …

Neues KI-Sprachmodell Dia bietet natürliche Dialogfähigkeiten

Das Startup Nari Labs hat mit Dia ein Open-Source-Sprachmodell veröffentlicht, das natürlich klingende Dialoge erzeugen kann. Wie VentureBeat-Journalist Carl Franzen berichtet, soll das 1,6 Milliarden Parameter umfassende Modell mit Angeboten von ElevenLabs, OpenAI und Googles NotebookLM konkurrieren können. Mitgründer Toby Kim entwickelte Dia „ohne Finanzierung“ mit Unterstützung von Google, das Zugang zu TPU-Chips gewährte. Das …

Weiterlesen …

Google macht KI-Modelle Gemma 3 auf üblichen Grafikkarten lauffähig

Google hat neue Versionen seiner Gemma 3 KI-Modelle veröffentlicht, die dank einer speziellen Technik namens Quantization-Aware Training (QAT) auf handelsüblichen Grafikkarten laufen können. Diese Entwicklung macht leistungsstarke KI-Modelle für Nutzer ohne High-End-Hardware zugänglich. Der Speicherbedarf wurde durch QAT erheblich reduziert, während die Qualität der Modelle erhalten bleibt. Das größte Gemma 3 Modell mit 27 Milliarden …

Weiterlesen …

KI-Startup Deep Cogito zeigt seine ersten Open-Source-Sprachmodelle

Das KI-Startup Deep Cogito aus San Francisco hat seine ersten Sprachmodelle namens Cogito v1 veröffentlicht. Diese Open-Source-Modelle basieren auf Metas Llama 3.2 und verfügen über hybride Fähigkeiten zur Selbstreflexion, wie Carl Franzen von VentureBeat berichtet. Die Modelle sind in fünf verschiedenen Größen von 3 bis 70 Milliarden Parametern verfügbar und können über Hugging Face, Ollama …

Weiterlesen …

Nvidias neues Sprachmodell hat zuschaltbares Reasoning

Nvidia hat ein neues Sprachmodell namens Llama-3.1-Nemotron-Ultra-253B veröffentlicht, das trotz seiner geringeren Größe den Konkurrenten DeepSeek R1 in mehreren Benchmarks übertrifft. Wie VentureBeat-Autor Carl Franzen berichtet, wurde das vollständig quelloffene Modell auf Hugging Face bereitgestellt. Eine Besonderheit ist der Wechsel zwischen „Reasoning On“ und „Reasoning Off“-Modi, wodurch die Leistung bei komplexen Aufgaben deutlich steigt, beim …

Weiterlesen …

Metas Llama 4-Modelle stoßen auf gemischte Resonanz

Meta hat seine neueste Generation von Künstliche-Intelligenz-Modellen, Llama 4, mit drei Varianten und verbesserten Fähigkeiten veröffentlicht. Es umfasst zwei sofort verfügbare Angebote – Llama 4 Scout und Llama 4 Maverick – während ein drittes Modell, Llama 4 Behemoth, noch in Entwicklung ist. Laut Meta markieren die Llama 4-Modelle „den Beginn einer neuen Ära“ für ihr …

Weiterlesen …