Google veröffentlicht App für lokale AI-Modelle auf Android

Google hat eine experimentelle Android-App namens AI Edge Gallery veröffentlicht, mit der Nutzer KI-Modelle direkt auf ihren Smartphones ohne Internetverbindung ausführen können. Die App ist über GitHub verfügbar und kommt später auch für iOS-Geräte. Nutzer können AI-Modelle von der Hugging Face-Plattform herunterladen und ausführen, um Aufgaben wie Bildanalyse, Textgenerierung und Programmier-Unterstützung zu erledigen. Die gesamte …

Weiterlesen …

Microsoft erweitert Phi-Sprachmodellfamilie mit neuen Reasoning-Fähigkeiten

Microsoft hat drei neue kleine Sprachmodelle (SLMs) vorgestellt, die sich auf komplexe Reasoning-Aufgaben konzentrieren: Phi-4-reasoning, Phi-4-reasoning-plus und Phi-4-mini-reasoning. Diese Modelle sind für angesichts ihrer kompakten Größe erstaunlich leistungsfähig, besonders bei mathematischem Reasoning und mehrstufiger Problemlösung. Das Flaggschiff Phi-4-reasoning-plus, ein Modell mit 14 Milliarden Parametern, zeigt eine Leistung, die offenbar mit viel größeren KI-Systemen mithalten kann. …

Weiterlesen …

Alibaba veröffentlicht Qwen3-Modelle mit KI-Reasoning-Fähigkeiten

Alibaba hat mit Qwen3 eine neue Familie von großen Sprachmodellen vorgestellt, die mit führenden KI-Systemen von OpenAI und Google konkurrieren. Die Produktreihe umfasst zwei Mixture-of-Experts (MoE)-Modelle und sechs Dense-Modelle mit Parametern zwischen 0,6 und 235 Milliarden. Laut den von Alibaba veröffentlichten Benchmarks übertrifft das Flaggschiffmodell Qwen3-235B-A22B DeepSeek R1 und OpenAIs o1 in mehreren wichtigen Metriken …

Weiterlesen …

Pleias veröffentlicht kleine KI-Modelle für RAG mit integrierter Quellenangabe

Das französische KI-Startup Pleias hat zwei quelloffene Reasoning-Modelle für Retrieval-Augmented Generation (RAG) mit nativer Zitierunterstützung vorgestellt. Laut Carl Franzen von VentureBeat sind die neuen Modelle – Pleias-RAG-350M und Pleias-RAG-1B – unter der Apache 2.0-Lizenz verfügbar und erlauben kommerzielle Nutzung. Trotz ihrer geringen Größe übertreffen die Modelle viele größere Alternativen bei komplexen Reasoning-Aufgaben und bieten starke …

Weiterlesen …

Google macht KI-Modelle Gemma 3 auf üblichen Grafikkarten lauffähig

Google hat neue Versionen seiner Gemma 3 KI-Modelle veröffentlicht, die dank einer speziellen Technik namens Quantization-Aware Training (QAT) auf handelsüblichen Grafikkarten laufen können. Diese Entwicklung macht leistungsstarke KI-Modelle für Nutzer ohne High-End-Hardware zugänglich. Der Speicherbedarf wurde durch QAT erheblich reduziert, während die Qualität der Modelle erhalten bleibt. Das größte Gemma 3 Modell mit 27 Milliarden …

Weiterlesen …

Nous Research stellt KI-Modell mit zuschaltbarem Denkmodus vor

Nous Research hat ein neues KI-Sprachmodell namens DeepHermes-3 entwickelt, das zwischen ausführlichem Reasoning und schnellen Antworten wechseln kann. Das Modell basiert auf Metas Llama-Technologie und verfügt über 8 Milliarden Parameter, berichtet VentureBeat. Benutzer können einen speziellen Denkmodus aktivieren, der die Gedankenprozesse der KI vor der endgültigen Antwort offenlegt. Das System nutzt dabei „Chain of Thought“, …

Weiterlesen …

Mistral Small 3 kann mit größeren Konkurrenten mithalten

Das französische KI-Startup Mistral AI hat Mistral Small 3 veröffentlicht, ein Sprachmodell mit 24 Milliarden Parametern, das laut Unternehmensangaben die Leistung von dreimal größeren Modellen erreicht. Dem Unternehmen zufolge erzielt das neue Modell eine Genauigkeit von 81% bei Standardtests und verarbeitet 150 Token pro Sekunde, was es mit Metas Llama 3.3 70B Modell vergleichbar macht, …

Weiterlesen …

DeepSeek-R1 senkt Entwicklungskosten für Enterprise KI

DeepSeeks neues KI-Reasoning-Modell R1 reduziert die Kosten für KI-Entwicklung erheblich. Wie Ben Dickson in VentureBeat berichtet, bietet DeepSeek-R1 vergleichbare Fähigkeiten wie führende Modelle zu einem Bruchteil des Preises. Das Modell kostet 2,19 Dollar pro Million Output-Token, während OpenAIs o1 mit 60 Dollar pro Million Token zu Buche schlägt. Auch über US-amerikanische Anbieter wie Together.ai und …

Weiterlesen …

Hugging Face stellt kompakte KI-Modelle für Bild- und Textanalyse vor

Hugging Face präsentiert zwei neue KI-Modelle für die Verarbeitung von Bildern, Videos und Texten auf ressourcenbeschränkten Geräten. Die als SmolVLM-256M und SmolVLM-500M bezeichneten Systeme benötigen weniger als 1GB Arbeitsspeicher. Wie der TechCrunch-Autor Kyle Wiggers berichtet, können die Modelle Bilder beschreiben, Videoclips analysieren und PDF-Dokumente auswerten. Die Entwicklung basiert auf den firmeneigenen Datensätzen „The Cauldron“ und …

Weiterlesen …

DeepSeek veröffentlicht neue Reasoning-Modelle

Das chinesische KI-Unternehmen DeepSeek hat seine neuen Sprachmodelle DeepSeek-R1-Zero und DeepSeek-R1 sowie sechs kleinere destillierte Versionen vorgestellt. Die Hauptmodelle, die auf DeepSeeks V3-Architektur basieren, verfügen über insgesamt 671 Milliarden Parameter, von denen 37 Milliarden aktiv sind, und eine Kontextlänge von 128.000 Token. Laut Unternehmensangaben erreicht DeepSeek-R1 eine mit OpenAI-Modellen vergleichbare Leistung in den Bereichen Mathematik, …

Weiterlesen …

×