GPT‑5.4 soll komplexe Büroarbeit erledigen und bringt neue Agenten‑Funktionen

OpenAI hat das neue KI‑Modell GPT‑5.4 vorgestellt. Das System soll vor allem professionelle Aufgaben unterstützen, etwa Programmieren, Dokumente schreiben, Präsentationen erstellen oder Tabellen analysieren.

Das Modell erscheint in zwei Varianten. GPT‑5.4 Thinking ist die Reasoning‑Version in ChatGPT. GPT‑5.4 Pro richtet sich an Entwickler und Unternehmen, die maximale Leistung für komplexe Aufgaben benötigen. Beide Versionen sind auch über die OpenAI‑API und das Entwickler‑Tool Codex verfügbar.

Nach Angaben von OpenAI kombiniert GPT‑5.4 Fortschritte in Reasoning, Coding und Tool‑Nutzung. Neu ist eine native Computersteuerung: Das Modell kann Programme über Screenshots erkennen und Aktionen per Maus‑ oder Tastaturbefehlen ausführen. Es kann auch Code schreiben, der Software automatisch bedient.

Fokus auf typische Büroarbeit

OpenAI hebt hervor, dass GPT‑5.4 besonders für klassische Office‑Aufgaben trainiert wurde.

In internen Tests zu Spreadsheet‑Modellen, ähnlich den Aufgaben eines Investmentbank‑Analysten, erreichte GPT‑5.4 im Schnitt rund 87 Prozent. Das Vorgängermodell GPT‑5.2 kam auf etwa 68 Prozent.

Bei Präsentationen bevorzugten menschliche Prüfer die Ergebnisse von GPT‑5.4 in 68 Prozent der Vergleiche. Sie nannten vor allem bessere Gestaltung und mehr visuelle Vielfalt.

Auch bei der Genauigkeit meldet OpenAI Fortschritte: In einer Sammlung von Prompts, bei denen Nutzer zuvor Fehler gemeldet hatten, machte GPT‑5.4 laut Unternehmen 33 Prozent weniger falsche Aussagen und 18 Prozent weniger Antworten mit Fehlern.

Tests zu Wissensarbeit

Ein wichtiger Maßstab ist der Benchmark GDPval. Er misst, wie gut KI‑Modelle typische Wissensarbeit ausführen können. Die Aufgaben stammen aus 44 Berufen in neun Branchen.

OpenAI berichtet, dass GPT‑5.4 in 83 Prozent der Vergleiche die Leistung von Fachleuten erreicht oder übertroffen hat. Dazu gehören Aufgaben wie Finanzanalysen, juristische Texte oder Projektplanung.

Die Ergebnisse werden von menschlichen Fachleuten bewertet.

Auch externe Tester melden gute Resultate. Das Recruiting‑Unternehmen Mercor erklärte, GPT‑5.4 führe aktuell seinen Benchmark für professionelle Dienstleistungen an.

Computersteuerung und Tool‑Nutzung

Eine wichtige Neuerung ist die direkte Steuerung von Software. In der API und in Codex kann GPT‑5.4 Anwendungen bedienen und mehrstufige Workflows ausführen.

OpenAI nennt mehrere Benchmarks:

  • 75 Prozent Erfolgsrate im Desktop‑Test OSWorld‑Verified
  • 67 Prozent Erfolgsrate im Browser‑Benchmark WebArena‑Verified
  • 92,8 Prozent Erfolgsrate im Web‑Test Online‑Mind2Web

Außerdem führt OpenAI eine Funktion namens Tool Search ein: Das Modell lädt Tool‑Definitionen erst dann, wenn es sie braucht. In einem Test mit vielen Tools sank der Token‑Verbrauch laut Unternehmen um 47 Prozent.

Größere Kontextfenster und neue Integrationen

In der API und in Codex unterstützt GPT‑5.4 Kontextfenster von bis zu einer Million Tokens. Dadurch kann das Modell lange Dokumente oder komplexe Workflows bearbeiten.

In ChatGPT zeigt GPT‑5.4 Thinking zuerst einen Plan für seine Antwort. Nutzer können während der Bearbeitung neue Anweisungen geben.

Parallel startet OpenAI Integrationen für Microsoft Excel und Google Sheets. Die KI kann damit Tabellen analysieren, Modelle erstellen und Aufgaben automatisieren.

GPT‑5.4 wird schrittweise in ChatGPT, Codex und der API ausgerollt.

Quellen: OpenAI, The Verge, Engadget, TechCrunch, ZDNet, VentureBeat

Über den Autor

Mehr zum Thema:

Bleib up-to-date:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (3. Ausgabe, Januar 2026)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklich gewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen