Zur Autowaschanlage laufen oder fahren? Die meisten KI-Modelle liegen daneben

Ein verblüffend einfacher Test hat eine weitverbreitete Logikschwäche aktueller KI-Modelle aufgedeckt. Felix Wunderlich schreibt bei opper.ai, dass 42 von 53 der getesteten Systeme eine einfach scheinende Frage falsch beantwortet haben: „Ich möchte mein Auto waschen. Die Waschanlage ist 50 Meter entfernt. Soll ich laufen oder fahren?“ Die richtige Antwort lautet natürlich: fahren. Das Auto muss …

Weiterlesen …

Google veröffentlicht Gemini 3.1 Pro mit deutlich verbessertem Reasoning

Google hat Gemini 3.1 Pro veröffentlicht, eine aktualisierte Version seines KI-Modells Gemini 3 Pro. Das Unternehmen beschreibt es als einen Schritt vorwärts beim Reasoning — also der Fähigkeit, komplexe Probleme zu lösen, bei denen einfache Antworten nicht ausreichen. Das Modell ist jetzt für Verbraucher über die Gemini-App und NotebookLM verfügbar, allerdings vorerst nur für Nutzer …

Weiterlesen …

Claude Sonnet 4.6: Hohe Intelligenz zum niedrigen Preis

Anthropic hat Claude Sonnet 4.6 veröffentlicht, ein umfangreiches Update seines KI-Modells der mittleren Preisklasse. Laut Anthropic übertrifft das Modell seinen Vorgänger in den Bereichen Programmierung, Computerbedienung, Verarbeitung langer Texte, Planung von KI-Agenten, Büroarbeit und Design. Sonnet 4.6 ist jetzt das Standardmodell in claude.ai und Claude Cowork. Der Preis bleibt unverändert: 3 Dollar pro Million Input-Tokens …

Weiterlesen …

OpenAI GPT-5.3-Codex: 25% höhere Geschwindigkeit, erweiterte Funktionen

OpenAI hat GPT-5.3-Codex veröffentlicht, ein Coding-Modell, das das Unternehmen als sein bisher leistungsfähigstes Werkzeug für agentisches Programmieren bezeichnet. Das Modell arbeitet 25% schneller als sein Vorgänger und kombiniert fortgeschrittene Coding-Leistung mit Reasoning-Fähigkeiten in einem System. Laut OpenAI markiert GPT-5.3-Codex einen Meilenstein als erstes Modell, das bei seiner eigenen Entwicklung half. Das Codex-Team nutzte frühe Versionen …

Weiterlesen …

Anthropic Claude Opus 4.6: großes Kontextfenster und Agent Teams

Anthropic hat Claude Opus 4.6 veröffentlicht, eine verbesserte Version seines Flaggschiff-AI-Modells, das längere Konversationen verarbeiten und mehrere AI-Agenten koordinieren kann, die gleichzeitig an komplexen Aufgaben arbeiten. Das Unternehmen gibt an, das Modell übertriffe Konkurrenten wie OpenAIs GPT-5.2 in mehreren professionellen Benchmarks. Die Veröffentlichung führt erstmals ein Kontextfenster von einer Million Token in Anthropics Opus-Klasse-Modellen ein. …

Weiterlesen …

Google Gemini 3 Flash verspricht das Ende des Kompromisses zwischen Leistung und Kosten

Google hat Gemini 3 Flash veröffentlicht und positioniert das Modell als Lösung für einen Kompromiss in der künstlichen Intelligenz zwischen Geschwindigkeit und Leistungsfähigkeit. Das Modell kombiniert laut Google Reasoning auf Doktorandenniveau mit höheren Verarbeitungsgeschwindigkeiten und niedrigeren Kosten im Vergleich zu größeren Modellen. Gemini 3 Flash ist jetzt das Standard-Modell in der Gemini App weltweit und …

Weiterlesen …

OpenAI veröffentlicht GPT-5.2 mit verbesserter Genauigkeit für professionelle Aufgaben

OpenAI hat am 11. Dezember GPT-5.2 veröffentlicht, seine neueste Familie von KI-Modellen. Das Unternehmen beschreibt es als das bisher leistungsfähigste Modell für professionelle Wissensarbeit. Die Veröffentlichung umfasst drei Varianten: GPT-5.2 Instant für schnellere Antworten, GPT-5.2 Thinking für komplexe Aufgaben und GPT-5.2 Pro für die anspruchsvollsten Fragen. Nach Angaben von OpenAI zeigt das Modell Verbesserungen beim …

Weiterlesen …

Wie Gemini 3 jetzt die Welt sieht und komplexe Probleme besser löst als je zuvor

Googles neuestes und leistungsfähigstes KI-Modell, Gemini 3 Pro, verfügt über erweiterte Fähigkeiten bei Aufgaben, die visuelles Verständnis erfordern. In einem Beitrag im Google Blog beschreibt das Unternehmen, wie das Modell visuelle Informationen aus verschiedenen Quellen verarbeitet und interpretiert. Laut Google zeigt das Modell in mehreren Kernbereichen eine hohe Leistungsfähigkeit. Dazu gehören: Google nennt mögliche Anwendungsfälle …

Weiterlesen …

Mistral AI veröffentlicht 10 Open-Source-Modelle für lokale KI und Unternehmenseinsatz

Mistral AI hat Mistral 3 veröffentlicht, eine Sammlung von 10 Open-Source-Modellen für künstliche Intelligenz. Die Modelle laufen auf Geräten vom Smartphone bis zu Cloud-Systemen für Unternehmen. Das französische Startup hat alle Modelle unter der Apache 2.0-Lizenz veröffentlicht, die kommerzielle Nutzung ohne Einschränkungen erlaubt. Die Veröffentlichung umfasst Mistral Large 3, das Flaggschiff-Modell des Unternehmens, und die …

Weiterlesen …

DeepSeeks neue Open-Source-KI-Modelle haben angeblich GPT-5-Performance

Das chinesische KI-Startup DeepSeek hat am 1. Dezember 2025 zwei neue Sprachmodelle veröffentlicht. Das Unternehmen behauptet, diese erreichen auf mehreren Benchmarks die Performance von OpenAIs GPT-5 und Googles Gemini-3.0-Pro. Beide Modelle stehen unter einer Open-Source-MIT-Lizenz kostenlos zur Verfügung. DeepSeek-V3.2 dient als Reasoning-Assistent für den täglichen Einsatz. DeepSeek-V3.2-Speciale fokussiert sich auf anspruchsvolle mathematische und Programmieraufgaben. Das …

Weiterlesen …