GPT‑5.4 soll komplexe Büroarbeit erledigen und bringt neue Agenten‑Funktionen

OpenAI hat das neue KI‑Modell GPT‑5.4 vorgestellt. Das System soll vor allem professionelle Aufgaben unterstützen, etwa Programmieren, Dokumente schreiben, Präsentationen erstellen oder Tabellen analysieren. Das Modell erscheint in zwei Varianten. GPT‑5.4 Thinking ist die Reasoning‑Version in ChatGPT. GPT‑5.4 Pro richtet sich an Entwickler und Unternehmen, die maximale Leistung für komplexe Aufgaben benötigen. Beide Versionen sind …

Weiterlesen …

Alibaba veröffentlicht neue Qwen3.5-Modelle für Laptops und Smartphones

Alibabas Forschungsteam hat zwei neue Serien von Open-Source-KI-Modellen veröffentlicht, die auf Consumer-Hardware laufen, vom Desktop-PC bis zum Smartphone. Die Modelle umfassen eine Spanne von 0,8 bis 122 Milliarden Parametern und sind kostenlos unter der Apache-2.0-Lizenz auf Hugging Face und ModelScope verfügbar. Die größere Qwen3.5-Medium-Serie enthält vier Modelle. Das Hauptmodell, Qwen3.5-35B-A3B, nutzt ein Verfahren namens Mixture-of-Experts. …

Weiterlesen …

Weniger Belehrungen, weniger Fehler: OpenAI erneuert wichtigstes ChatGPT-Modell

OpenAI hat GPT-5.3 Instant veröffentlicht, ein Update des Standard-Modells von ChatGPT. Laut OpenAI halluziniert das Modell seltener, verweigert nicht so häufig Antworten und klingt weniger defensiv. Das Update steht allen ChatGPT-Nutzern kostenlos zur Verfügung. Entwickler können es über die API unter dem Namen gpt-5.3-chat-latest nutzen. OpenAI hat die Verbesserungen mit zwei internen Tests gemessen. Bei …

Weiterlesen …

Perplexity KI-Agent „Computer“ koordiniert 19 Modelle

Perplexity hat „Computer“ gestartet, eine Plattform für KI-Agenten, die 19 verschiedene KI-Modelle koordiniert. Das Produkt ist zunächst für Max-Abonnenten für 200 Dollar pro Monat verfügbar. Eine Erweiterung auf Pro- und Enterprise-Nutzer ist geplant. Computer nimmt ein übergeordnetes Ziel vom Nutzer entgegen, teilt es in Teilaufgaben auf und weist jede Aufgabe dem passenden Modell zu. Das …

Weiterlesen …

Nano Banana 2: Googles neues Bildmodell soll Pro-Qualität in Rekordtempo liefern

Google hat Nano Banana 2 veröffentlicht, sein neuestes Modell zur Bildgenerierung. Der offizielle Name lautet Gemini 3.1 Flash Image. Das Modell soll die Bildqualität des bisherigen Nano Banana Pro mit der Geschwindigkeit von Googles Flash-Modellreihe verbinden. Google brachte Nano Banana erstmals im August 2025 heraus. Das Modell stieß auf großes Interesse, besonders in Ländern wie …

Weiterlesen …

WordPress.com integriert KI-Assistenten direkt in den Editor

Automattic hat einen KI-Assistenten in WordPress.com eingebaut, der direkt im Website-Editor funktioniert. Die Funktion steht Nutzern der Business- und Commerce-Tarife ohne Aufpreis zur Verfügung. Sie muss manuell in den Website-Einstellungen aktiviert werden. Nach der Aktivierung erscheint der Assistent im Editor, in der Mediathek und in den Block-Notizen. Nutzer können in einfacher Sprache Befehle geben, um …

Weiterlesen …

Google veröffentlicht Gemini 3.1 Pro mit deutlich verbessertem Reasoning

Google hat Gemini 3.1 Pro veröffentlicht, eine aktualisierte Version seines KI-Modells Gemini 3 Pro. Das Unternehmen beschreibt es als einen Schritt vorwärts beim Reasoning — also der Fähigkeit, komplexe Probleme zu lösen, bei denen einfache Antworten nicht ausreichen. Das Modell ist jetzt für Verbraucher über die Gemini-App und NotebookLM verfügbar, allerdings vorerst nur für Nutzer …

Weiterlesen …

MiniMax veröffentlicht KI-Modell M2.5 zu einem Bruchteil der Konkurrenzpreise

Das chinesische KI-Unternehmen MiniMax hat M2.5 veröffentlicht, ein neues großes Sprachmodell, das laut Unternehmensangaben mit Spitzenmodellen von Anthropic und Google mithalten soll — zu deutlich niedrigeren Kosten. MiniMax bietet zwei Versionen über seine API an. M2.5-Lightning verarbeitet 100 Token pro Sekunde und kostet 0,30 Dollar pro Million Eingabe-Token und 2,40 Dollar pro Million Ausgabe-Token. Das …

Weiterlesen …

Google bringt Musikgenerierung in die Gemini-App

Google hat seine Gemini-App um eine Musikgenerierungsfunktion erweitert. Joël Yawili und Myriam Hamed Torres schreiben im Google Blog, dass die Funktion auf Lyria 3 basiert, dem neuesten generativen Musikmodell von Google DeepMind. Sie befindet sich derzeit in der Beta-Phase. Nutzerinnen und Nutzer können einen Text eingeben, zum Beispiel eine Stimmung, eine Erinnerung oder ein Genre. …

Weiterlesen …