Meta veröffentlicht proprietäres KI-Modell Muse Spark

Meta hat Muse Spark veröffentlicht, ein neues proprietäres KI-Modell seiner internen Abteilung Meta Superintelligence Labs. Das Modell ist über die Meta AI App und die Website verfügbar, mit einem privaten API-Zugang für ausgewählte Nutzer. Anders als Metas frühere Llama-Modelle ist Muse Spark kein Open-Source-Modell. Muse Spark verarbeitet Text und Bilder gemeinsam. Meta nennt diese Fähigkeit …

Weiterlesen …

Google Gemma 4 ist die stärkste Open-Source-KI des Unternehmens

Google hat Gemma 4 vorgestellt, eine neue Familie von Open-Weight-KI-Modellen. Das Unternehmen bezeichnet sie als die bislang fähigsten Modelle dieser Reihe. Sie basieren auf derselben Forschung und Technologie wie Googles proprietäres Gemini-3-System und werden unter einer Apache-2.0-Open-Source-Lizenz veröffentlicht. Diese Lizenz erlaubt es Entwicklern, die Modelle für kommerzielle Zwecke frei zu nutzen und zu verändern. Die …

Weiterlesen …

Denken nur wenn nötig: Microsofts neue KI weiß, wann sie sich die Mühe sparen kann

Microsoft hat das KI-Modell Phi-4-reasoning-vision-15B veröffentlicht. Es verarbeitet sowohl Bilder als auch Text und kann komplexe Mathematik- und Wissenschaftsaufgaben lösen. Michael Nuñez berichtet für VentureBeat, dass das Modell mit 15 Milliarden Parametern deutlich größere Systeme in vielen Bereichen einholt oder übertrifft. Der Rechenaufwand und der Bedarf an Trainingsdaten sind dabei deutlich geringer. Das Modell ist …

Weiterlesen …

GPT‑5.4 soll komplexe Büroarbeit erledigen und bringt neue Agenten‑Funktionen

OpenAI hat das neue KI‑Modell GPT‑5.4 vorgestellt. Das System soll vor allem professionelle Aufgaben unterstützen, etwa Programmieren, Dokumente schreiben, Präsentationen erstellen oder Tabellen analysieren. Das Modell erscheint in zwei Varianten. GPT‑5.4 Thinking ist die Reasoning‑Version in ChatGPT. GPT‑5.4 Pro richtet sich an Entwickler und Unternehmen, die maximale Leistung für komplexe Aufgaben benötigen. Beide Versionen sind …

Weiterlesen …

Google veröffentlicht Gemini 3.1 Pro mit deutlich verbessertem Reasoning

Google hat Gemini 3.1 Pro veröffentlicht, eine aktualisierte Version seines KI-Modells Gemini 3 Pro. Das Unternehmen beschreibt es als einen Schritt vorwärts beim Reasoning — also der Fähigkeit, komplexe Probleme zu lösen, bei denen einfache Antworten nicht ausreichen. Das Modell ist jetzt für Verbraucher über die Gemini-App und NotebookLM verfügbar, allerdings vorerst nur für Nutzer …

Weiterlesen …

Alibaba veröffentlicht Qwen3.5, ein multimodales KI-Modell mit 397 Milliarden Parametern

Alibaba hat Qwen3.5 vorgestellt, ein neues KI-Modell, das als multimodaler Agent Text, Bilder und Videos verarbeiten kann. Das QwenTeam kündigt diese Entwicklung auf der Webseite des Unternehmens an. Das Modell enthält 397 Milliarden Parameter. Pro Aufgabe aktiviert es jedoch nur 17 Milliarden davon. Das Team betont, dieser Ansatz optimiere Geschwindigkeit und Kosten. Die Architektur kombiniert …

Weiterlesen …

Wie Gemini 3 jetzt die Welt sieht und komplexe Probleme besser löst als je zuvor

Googles neuestes und leistungsfähigstes KI-Modell, Gemini 3 Pro, verfügt über erweiterte Fähigkeiten bei Aufgaben, die visuelles Verständnis erfordern. In einem Beitrag im Google Blog beschreibt das Unternehmen, wie das Modell visuelle Informationen aus verschiedenen Quellen verarbeitet und interpretiert. Laut Google zeigt das Modell in mehreren Kernbereichen eine hohe Leistungsfähigkeit. Dazu gehören: Google nennt mögliche Anwendungsfälle …

Weiterlesen …

Mistral AI veröffentlicht 10 Open-Source-Modelle für lokale KI und Unternehmenseinsatz

Mistral AI hat Mistral 3 veröffentlicht, eine Sammlung von 10 Open-Source-Modellen für künstliche Intelligenz. Die Modelle laufen auf Geräten vom Smartphone bis zu Cloud-Systemen für Unternehmen. Das französische Startup hat alle Modelle unter der Apache 2.0-Lizenz veröffentlicht, die kommerzielle Nutzung ohne Einschränkungen erlaubt. Die Veröffentlichung umfasst Mistral Large 3, das Flaggschiff-Modell des Unternehmens, und die …

Weiterlesen …

Google Gemini 3: KI-Agenten und generative Interfaces

Google hat die Einführung von Gemini 3 angekündigt, einer neuen Familie von KI-Modellen, die das Unternehmen als seine bisher „intelligentesten“ und leistungsfähigsten bezeichnet. Das Flaggschiff-Modell, Gemini 3 Pro, wurde sofort in mehreren wichtigen Google-Produkten verfügbar gemacht, darunter die Gemini-App und die Google Suche. Die Veröffentlichung signalisiert dabei den Vorstoß des Unternehmens, über textbasierte Konversationen hinauszugehen …

Weiterlesen …

Qwen3-Omni ist ein Open-Source-Modell für Text, Bild, Audio und Video

Das chinesische Technologieunternehmen Alibaba hat Qwen3-Omni veröffentlicht. Es ist ein neues generatives KI-Modell, das eine Kombination aus Text, Bildern, Audio und Video verarbeiten kann. Das Modell zeichnet sich durch seine „omni-modalen“ Fähigkeiten und seine Open-Source-Lizenz aus. Damit positioniert es sich als direkter Konkurrent zu proprietären Modellen von US-Technologiekonzernen wie OpenAI und Google. Nach von Alibaba …

Weiterlesen …