Alibaba veröffentlicht Qwen3-Modelle mit KI-Reasoning-Fähigkeiten

Alibaba hat mit Qwen3 eine neue Familie von großen Sprachmodellen vorgestellt, die mit führenden KI-Systemen von OpenAI und Google konkurrieren. Die Produktreihe umfasst zwei Mixture-of-Experts (MoE)-Modelle und sechs Dense-Modelle mit Parametern zwischen 0,6 und 235 Milliarden. Laut den von Alibaba veröffentlichten Benchmarks übertrifft das Flaggschiffmodell Qwen3-235B-A22B DeepSeek R1 und OpenAIs o1 in mehreren wichtigen Metriken …

Weiterlesen …

Pleias veröffentlicht kleine KI-Modelle für RAG mit integrierter Quellenangabe

Das französische KI-Startup Pleias hat zwei quelloffene Reasoning-Modelle für Retrieval-Augmented Generation (RAG) mit nativer Zitierunterstützung vorgestellt. Laut Carl Franzen von VentureBeat sind die neuen Modelle – Pleias-RAG-350M und Pleias-RAG-1B – unter der Apache 2.0-Lizenz verfügbar und erlauben kommerzielle Nutzung. Trotz ihrer geringen Größe übertreffen die Modelle viele größere Alternativen bei komplexen Reasoning-Aufgaben und bieten starke …

Weiterlesen …

Google macht KI-Modelle Gemma 3 auf üblichen Grafikkarten lauffähig

Google hat neue Versionen seiner Gemma 3 KI-Modelle veröffentlicht, die dank einer speziellen Technik namens Quantization-Aware Training (QAT) auf handelsüblichen Grafikkarten laufen können. Diese Entwicklung macht leistungsstarke KI-Modelle für Nutzer ohne High-End-Hardware zugänglich. Der Speicherbedarf wurde durch QAT erheblich reduziert, während die Qualität der Modelle erhalten bleibt. Das größte Gemma 3 Modell mit 27 Milliarden …

Weiterlesen …

Nous Research stellt KI-Modell mit zuschaltbarem Denkmodus vor

Nous Research hat ein neues KI-Sprachmodell namens DeepHermes-3 entwickelt, das zwischen ausführlichem Reasoning und schnellen Antworten wechseln kann. Das Modell basiert auf Metas Llama-Technologie und verfügt über 8 Milliarden Parameter, berichtet VentureBeat. Benutzer können einen speziellen Denkmodus aktivieren, der die Gedankenprozesse der KI vor der endgültigen Antwort offenlegt. Das System nutzt dabei „Chain of Thought“, …

Weiterlesen …

Mistral Small 3 kann mit größeren Konkurrenten mithalten

Das französische KI-Startup Mistral AI hat Mistral Small 3 veröffentlicht, ein Sprachmodell mit 24 Milliarden Parametern, das laut Unternehmensangaben die Leistung von dreimal größeren Modellen erreicht. Dem Unternehmen zufolge erzielt das neue Modell eine Genauigkeit von 81% bei Standardtests und verarbeitet 150 Token pro Sekunde, was es mit Metas Llama 3.3 70B Modell vergleichbar macht, …

Weiterlesen …

DeepSeek-R1 senkt Entwicklungskosten für Enterprise KI

DeepSeeks neues KI-Reasoning-Modell R1 reduziert die Kosten für KI-Entwicklung erheblich. Wie Ben Dickson in VentureBeat berichtet, bietet DeepSeek-R1 vergleichbare Fähigkeiten wie führende Modelle zu einem Bruchteil des Preises. Das Modell kostet 2,19 Dollar pro Million Output-Token, während OpenAIs o1 mit 60 Dollar pro Million Token zu Buche schlägt. Auch über US-amerikanische Anbieter wie Together.ai und …

Weiterlesen …

Hugging Face stellt kompakte KI-Modelle für Bild- und Textanalyse vor

Hugging Face präsentiert zwei neue KI-Modelle für die Verarbeitung von Bildern, Videos und Texten auf ressourcenbeschränkten Geräten. Die als SmolVLM-256M und SmolVLM-500M bezeichneten Systeme benötigen weniger als 1GB Arbeitsspeicher. Wie der TechCrunch-Autor Kyle Wiggers berichtet, können die Modelle Bilder beschreiben, Videoclips analysieren und PDF-Dokumente auswerten. Die Entwicklung basiert auf den firmeneigenen Datensätzen „The Cauldron“ und …

Weiterlesen …

DeepSeek veröffentlicht neue Reasoning-Modelle

Das chinesische KI-Unternehmen DeepSeek hat seine neuen Sprachmodelle DeepSeek-R1-Zero und DeepSeek-R1 sowie sechs kleinere destillierte Versionen vorgestellt. Die Hauptmodelle, die auf DeepSeeks V3-Architektur basieren, verfügen über insgesamt 671 Milliarden Parameter, von denen 37 Milliarden aktiv sind, und eine Kontextlänge von 128.000 Token. Laut Unternehmensangaben erreicht DeepSeek-R1 eine mit OpenAI-Modellen vergleichbare Leistung in den Bereichen Mathematik, …

Weiterlesen …

Diffbot stellt KI-Modell mit Echtzeit-Faktenprüfung vor

Das Silicon-Valley-Unternehmen Diffbot hat ein neues KI-Modell entwickelt, das KI mit Echtzeit-Faktenüberprüfung verbindet. Wie Michael Nuñez für VentureBeat berichtet, basiert das System auf der GraphRAG-Technologie und nutzt Meta’s Llama 3.3. Das Modell greift auf Diffbots Knowledge Graph zu, eine Datenbank mit über einer Billion Fakten, die alle vier bis fünf Tage aktualisiert wird. In Benchmark-Tests …

Weiterlesen …

Nvidia stellt neue KI-Modelle und Technologien auf der CES 2025 vor

Nvidia hat auf der CES 2025 mehrere neue KI-Initiativen vorgestellt, die sich um die Nemotron-Modellfamilien und Cosmos World Foundation Models drehen. CEO Jensen Huang präsentierte diese Entwicklungen während seiner Eröffnungskeynote und stellte KI-Modelle vor, die sowohl für Unternehmens- als auch für Verbraucheranwendungen konzipiert sind. Die Nemotron-Familie umfasst Sprach- und Visionsmodelle, die als NIM-Mikroservices verfügbar sind …

Weiterlesen …