Alibaba veröffentlicht Qwen3-Modelle mit KI-Reasoning-Fähigkeiten

Alibaba hat mit Qwen3 eine neue Familie von großen Sprachmodellen vorgestellt, die mit führenden KI-Systemen von OpenAI und Google konkurrieren. Die Produktreihe umfasst zwei Mixture-of-Experts (MoE)-Modelle und sechs Dense-Modelle mit Parametern zwischen 0,6 und 235 Milliarden. Laut den von Alibaba veröffentlichten Benchmarks übertrifft das Flaggschiffmodell Qwen3-235B-A22B DeepSeek R1 und OpenAIs o1 in mehreren wichtigen Metriken …

Weiterlesen …

Pleias veröffentlicht kleine KI-Modelle für RAG mit integrierter Quellenangabe

Das französische KI-Startup Pleias hat zwei quelloffene Reasoning-Modelle für Retrieval-Augmented Generation (RAG) mit nativer Zitierunterstützung vorgestellt. Laut Carl Franzen von VentureBeat sind die neuen Modelle – Pleias-RAG-350M und Pleias-RAG-1B – unter der Apache 2.0-Lizenz verfügbar und erlauben kommerzielle Nutzung. Trotz ihrer geringen Größe übertreffen die Modelle viele größere Alternativen bei komplexen Reasoning-Aufgaben und bieten starke …

Weiterlesen …

Neues KI-Sprachmodell Dia bietet natürliche Dialogfähigkeiten

Das Startup Nari Labs hat mit Dia ein Open-Source-Sprachmodell veröffentlicht, das natürlich klingende Dialoge erzeugen kann. Wie VentureBeat-Journalist Carl Franzen berichtet, soll das 1,6 Milliarden Parameter umfassende Modell mit Angeboten von ElevenLabs, OpenAI und Googles NotebookLM konkurrieren können. Mitgründer Toby Kim entwickelte Dia „ohne Finanzierung“ mit Unterstützung von Google, das Zugang zu TPU-Chips gewährte. Das …

Weiterlesen …

Google macht KI-Modelle Gemma 3 auf üblichen Grafikkarten lauffähig

Google hat neue Versionen seiner Gemma 3 KI-Modelle veröffentlicht, die dank einer speziellen Technik namens Quantization-Aware Training (QAT) auf handelsüblichen Grafikkarten laufen können. Diese Entwicklung macht leistungsstarke KI-Modelle für Nutzer ohne High-End-Hardware zugänglich. Der Speicherbedarf wurde durch QAT erheblich reduziert, während die Qualität der Modelle erhalten bleibt. Das größte Gemma 3 Modell mit 27 Milliarden …

Weiterlesen …

KI-Startup Deep Cogito zeigt seine ersten Open-Source-Sprachmodelle

Das KI-Startup Deep Cogito aus San Francisco hat seine ersten Sprachmodelle namens Cogito v1 veröffentlicht. Diese Open-Source-Modelle basieren auf Metas Llama 3.2 und verfügen über hybride Fähigkeiten zur Selbstreflexion, wie Carl Franzen von VentureBeat berichtet. Die Modelle sind in fünf verschiedenen Größen von 3 bis 70 Milliarden Parametern verfügbar und können über Hugging Face, Ollama …

Weiterlesen …

Nvidias neues Sprachmodell hat zuschaltbares Reasoning

Nvidia hat ein neues Sprachmodell namens Llama-3.1-Nemotron-Ultra-253B veröffentlicht, das trotz seiner geringeren Größe den Konkurrenten DeepSeek R1 in mehreren Benchmarks übertrifft. Wie VentureBeat-Autor Carl Franzen berichtet, wurde das vollständig quelloffene Modell auf Hugging Face bereitgestellt. Eine Besonderheit ist der Wechsel zwischen „Reasoning On“ und „Reasoning Off“-Modi, wodurch die Leistung bei komplexen Aufgaben deutlich steigt, beim …

Weiterlesen …

Metas Llama 4-Modelle stoßen auf gemischte Resonanz

Meta hat seine neueste Generation von Künstliche-Intelligenz-Modellen, Llama 4, mit drei Varianten und verbesserten Fähigkeiten veröffentlicht. Es umfasst zwei sofort verfügbare Angebote – Llama 4 Scout und Llama 4 Maverick – während ein drittes Modell, Llama 4 Behemoth, noch in Entwicklung ist. Laut Meta markieren die Llama 4-Modelle „den Beginn einer neuen Ära“ für ihr …

Weiterlesen …

HallOumi überprüft KI-Output auf Halluzinationen

Oumi hat HallOumi veröffentlicht, ein Open-Source-Modell zur Überprüfung von KI-generierten Inhalten auf Halluzinationen. Das von ehemaligen Apple- und Google-Ingenieuren entwickelte Tool analysiert KI-Ausgaben satzweise und liefert Vertrauenswerte, spezifische Quellenangaben und verständliche Erklärungen. Sean Michael Kerner von VentureBeat berichtet, dass HallOumi Quelldokumente mit KI-Antworten vergleicht, um festzustellen, ob Behauptungen durch Beweise gestützt werden. CEO Manos Koukoumidis …

Weiterlesen …

Open Deep Search ist eine frei verfügbare Alternative

Ein Forschungsteam aus Mitgliedern von Sentient, der University of Washington, Princeton University und UC Berkeley hat mit Open Deep Search (ODS) ein neues Open-Source-Framework vorgestellt. Es soll eine Alternative zu proprietären KI-Suchlösungen bieten. Das von Salaheddin Alzubi geleitete Team entwickelte zwei Hauptkomponenten: das Open Search Tool und den Open Reasoning Agent. Das Suchwerkzeug verarbeitet Webinhalte …

Weiterlesen …

OpenAI kündigt erstes Open-Source-Sprachmodell seit Jahren an

OpenAI plant in den kommenden Monaten sein erstes „offenes“ Sprachmodell seit GPT-2 zu veröffentlichen. Dies geht aus einem Feedback-Formular hervor, das das Unternehmen auf seiner Website veröffentlicht hat. Laut eines Berichts von Kyle Wiggers bittet OpenAI Entwickler, Forscher und Community-Mitglieder um Rückmeldungen zu dem neuen Modell. Das Unternehmen wird Entwickler-Events organisieren, beginnend in San Francisco …

Weiterlesen …