Alibaba veröffentlicht QwQ-32B, ein leistungsstarkes Reasoning-Modell

Alibabas Qwen-Team hat QwQ-32B vorgestellt, ein neues Open-Source-Sprachmodell, das trotz deutlich geringerer Parameterzahl die Leistung viel größerer Modelle wie DeepSeek-R1 erreicht. Das unter der Apache 2.0-Lizenz veröffentlichte Modell mit 32 Milliarden Parametern nutzt Reinforcement Learning (RL), um seine Reasoning-Fähigkeiten für komplexe Problemlösungsaufgaben zu verbessern. Hauptmerkmale und Fähigkeiten QwQ-32B zeigt beeindruckende Leistungen bei mathematischem Denken, Programmierfähigkeiten …

Weiterlesen …

Cohere stellt Aya Vision vor, ein mehrsprachiges Bildverarbeitungsmodell

Die Forschungsabteilung von Cohere hat Aya Vision eingeführt, ein Bildverarbeitungsmodell mit offenen Gewichten, das 23 Sprachen unterstützt. Laut VentureBeat-Bericht von Carl Franzen gibt es das Modell in Versionen mit 8 und 32 Milliarden Parametern. Es kann Bilder analysieren, Text generieren und visuelle Inhalte übersetzen. Aya Vision übertrifft größere Modelle wie Llama 90B bei geringerem Ressourcenbedarf. …

Weiterlesen …

Alibaba veröffentlicht KI-Modell Wan 2.1 als Open Source

Der chinesische E-Commerce-Konzern Alibaba hat sein KI-Modell Wan 2.1 zur Generierung von Videos und Bildern als Open Source freigegeben. Vier Varianten des Modells sind nun weltweit über die Plattformen ModelScope und HuggingFace für akademische, Forschungs- und kommerzielle Zwecke verfügbar, wie Reuters berichtet. Die leistungsstärksten Versionen können bis zu 14 Milliarden Parameter verarbeiten und damit präzisere …

Weiterlesen …

Sesame zeigt KI-Assistenten mit natürlicher Gesprächspräsenz

Sesame, ein Startup unter der Leitung des Oculus-Mitbegründers Brendan Iribe, hat einen neuen KI-Sprachassistenten namens Maya vorgestellt, der darauf abzielt, „das Uncanny Valley der Konversationssprache“ zu überwinden. Laut eines kürzlich erschienenen Artikels des Technologiejournalisten Sean Hollister bietet Maya natürlichere und ansprechendere Gespräche im Vergleich zu bestehenden Sprachassistenten wie Amazon’s Alexa oder Google’s Gemini. Das Unternehmen …

Weiterlesen …

Microsoft zeigt effizientes Phi-4 für Text-, Bild- und Sprachverarbeitung

Microsoft hat zwei neue KI-Modelle in seiner Phi-Serie vorgestellt: Phi-4-multimodal mit 5,6 Milliarden Parametern und Phi-4-mini mit 3,8 Milliarden Parametern. Diese kleinen Sprachmodelle (SLMs) liefern außergewöhnliche Leistung bei deutlich geringerem Rechenaufwand als größere Systeme und stellen damit die Vorstellung in Frage, dass größere KI-Modelle immer besser sind. Das Phi-4-multimodal-Modell zeichnet sich durch seine Fähigkeit aus, …

Weiterlesen …

Nous Research stellt KI-Modell mit zuschaltbarem Denkmodus vor

Nous Research hat ein neues KI-Sprachmodell namens DeepHermes-3 entwickelt, das zwischen ausführlichem Reasoning und schnellen Antworten wechseln kann. Das Modell basiert auf Metas Llama-Technologie und verfügt über 8 Milliarden Parameter, berichtet VentureBeat. Benutzer können einen speziellen Denkmodus aktivieren, der die Gedankenprozesse der KI vor der endgültigen Antwort offenlegt. Das System nutzt dabei „Chain of Thought“, …

Weiterlesen …

Hugging Face entwickelt KI-Forschungsassistenten als Open Source in 24 Stunden

Hugging Face hat eine quelloffene Alternative zu OpenAIs Deep Research entwickelt, die automatisch im Web recherchieren und Berichte erstellen kann. Wie Benj Edwards für Ars Technica berichtet, wurde das Projekt „Open Deep Research“ innerhalb eines Tages nach OpenAIs Ankündigung fertiggestellt. Das System erreichte 55,15 Prozent Genauigkeit im General AI Assistants Benchmark, während OpenAIs Lösung 67,36 …

Weiterlesen …

OpenEuroLLM: Europäisches Konsortium startet Initiative für Open-Source-KI

Ein europäisches Konsortium aus 20 Forschungseinrichtungen und Unternehmen hat das Projekt OpenEuroLLM angekündigt. Unter der Leitung von Jan Hajič von der Karls-Universität und Peter Sarlin von AMD Silo AI sollen mehrsprachige KI-Sprachmodelle als Open-Source entwickelt werden. Das Projekt startet im Februar 2025 und wird von der Europäischen Kommission im Rahmen des Digital Europe Programme gefördert. …

Weiterlesen …

Forscher entwickeln Reasoning KI für unter 50 Dollar

Wissenschaftler der Stanford University und der University of Washington haben ein KI-Modell namens s1 entwickelt, das mit den Fähigkeiten teurer kommerzieller KI-Systeme konkurriert und weniger als 50 Dollar an Rechenressourcen für das Training benötigte. Das Modell, das durch einen als Destillation bezeichneten Prozess unter Verwendung von Googles Gemini 2.0 Flash Thinking Experimental erstellt wurde, zeigt …

Weiterlesen …

Ai2 Tulu 3 ist eine Open-Source-KI auf Augenhöhe mit führenden Systemen

Das Allen Institute for Artificial Intelligence (Ai2) hat Tulu 3 405B vorgestellt, ein neues KI-Sprachmodell, das laut institutseigenen Tests mehrere führende Systeme wie DeepSeek V3 übertrifft und in bestimmten Benchmarks mit OpenAI’s GPT-4o gleichauf liegt. Das Modell verfügt über 405 Milliarden Parameter und benötigte für das Training 256 parallel laufende GPUs. Die zentrale Innovation von …

Weiterlesen …