Microsoft zeigt effizientes Phi-4 für Text-, Bild- und Sprachverarbeitung

Microsoft hat zwei neue KI-Modelle in seiner Phi-Serie vorgestellt: Phi-4-multimodal mit 5,6 Milliarden Parametern und Phi-4-mini mit 3,8 Milliarden Parametern. Diese kleinen Sprachmodelle (SLMs) liefern außergewöhnliche Leistung bei deutlich geringerem Rechenaufwand als größere Systeme und stellen damit die Vorstellung in Frage, dass größere KI-Modelle immer besser sind. Das Phi-4-multimodal-Modell zeichnet sich durch seine Fähigkeit aus, …

Weiterlesen …

Nous Research stellt KI-Modell mit zuschaltbarem Denkmodus vor

Nous Research hat ein neues KI-Sprachmodell namens DeepHermes-3 entwickelt, das zwischen ausführlichem Reasoning und schnellen Antworten wechseln kann. Das Modell basiert auf Metas Llama-Technologie und verfügt über 8 Milliarden Parameter, berichtet VentureBeat. Benutzer können einen speziellen Denkmodus aktivieren, der die Gedankenprozesse der KI vor der endgültigen Antwort offenlegt. Das System nutzt dabei „Chain of Thought“, …

Weiterlesen …

Hugging Face entwickelt KI-Forschungsassistenten als Open Source in 24 Stunden

Hugging Face hat eine quelloffene Alternative zu OpenAIs Deep Research entwickelt, die automatisch im Web recherchieren und Berichte erstellen kann. Wie Benj Edwards für Ars Technica berichtet, wurde das Projekt „Open Deep Research“ innerhalb eines Tages nach OpenAIs Ankündigung fertiggestellt. Das System erreichte 55,15 Prozent Genauigkeit im General AI Assistants Benchmark, während OpenAIs Lösung 67,36 …

Weiterlesen …

OpenEuroLLM: Europäisches Konsortium startet Initiative für Open-Source-KI

Ein europäisches Konsortium aus 20 Forschungseinrichtungen und Unternehmen hat das Projekt OpenEuroLLM angekündigt. Unter der Leitung von Jan Hajič von der Karls-Universität und Peter Sarlin von AMD Silo AI sollen mehrsprachige KI-Sprachmodelle als Open-Source entwickelt werden. Das Projekt startet im Februar 2025 und wird von der Europäischen Kommission im Rahmen des Digital Europe Programme gefördert. …

Weiterlesen …

Forscher entwickeln Reasoning KI für unter 50 Dollar

Wissenschaftler der Stanford University und der University of Washington haben ein KI-Modell namens s1 entwickelt, das mit den Fähigkeiten teurer kommerzieller KI-Systeme konkurriert und weniger als 50 Dollar an Rechenressourcen für das Training benötigte. Das Modell, das durch einen als Destillation bezeichneten Prozess unter Verwendung von Googles Gemini 2.0 Flash Thinking Experimental erstellt wurde, zeigt …

Weiterlesen …

Ai2 Tulu 3 ist eine Open-Source-KI auf Augenhöhe mit führenden Systemen

Das Allen Institute for Artificial Intelligence (Ai2) hat Tulu 3 405B vorgestellt, ein neues KI-Sprachmodell, das laut institutseigenen Tests mehrere führende Systeme wie DeepSeek V3 übertrifft und in bestimmten Benchmarks mit OpenAI’s GPT-4o gleichauf liegt. Das Modell verfügt über 405 Milliarden Parameter und benötigte für das Training 256 parallel laufende GPUs. Die zentrale Innovation von …

Weiterlesen …

Mistral Small 3 kann mit größeren Konkurrenten mithalten

Das französische KI-Startup Mistral AI hat Mistral Small 3 veröffentlicht, ein Sprachmodell mit 24 Milliarden Parametern, das laut Unternehmensangaben die Leistung von dreimal größeren Modellen erreicht. Dem Unternehmen zufolge erzielt das neue Modell eine Genauigkeit von 81% bei Standardtests und verarbeitet 150 Token pro Sekunde, was es mit Metas Llama 3.3 70B Modell vergleichbar macht, …

Weiterlesen …

DeepSeek-R1 senkt Entwicklungskosten für Enterprise KI

DeepSeeks neues KI-Reasoning-Modell R1 reduziert die Kosten für KI-Entwicklung erheblich. Wie Ben Dickson in VentureBeat berichtet, bietet DeepSeek-R1 vergleichbare Fähigkeiten wie führende Modelle zu einem Bruchteil des Preises. Das Modell kostet 2,19 Dollar pro Million Output-Token, während OpenAIs o1 mit 60 Dollar pro Million Token zu Buche schlägt. Auch über US-amerikanische Anbieter wie Together.ai und …

Weiterlesen …

Hugging Face arbeitet an Open-Source-Version von DeepSeeks R1

Hugging Face hat ein Projekt gestartet, um eine vollständig offene Version des KI-Reasoning-Modells R1 von DeepSeek zu entwickeln. Wie Kyle Wiggers für TechCrunch berichtet, zielt das Open-R1-Projekt darauf ab, sämtliche Komponenten des Originalmodells nachzubauen. Das Forschungsteam unter der Leitung von Leandro von Werra nutzt dafür den firmeneigenen Science Cluster mit 768 Nvidia H100 GPUs. Das …

Weiterlesen …

DeepSeek Janus Pro Bild-KI fordert etablierte Wettbewerber heraus

Das chinesische KI-Unternehmen DeepSeek hat eine neue Familie von KI-Modellen namens Janus-Pro eingeführt, die sowohl Bildanalyse als auch Bilderstellung ermöglichen. Die Modelle, die zwischen 1 Milliarde und 7 Milliarden Parameter umfassen, sind auf der Hugging Face-Plattform unter MIT-Lizenz verfügbar und erlauben eine uneingeschränkte kommerzielle Nutzung. Laut DeepSeek übertrifft das größte Modell der Familie, Janus-Pro-7B, mehrere …

Weiterlesen …