OpenAI hat GPT-5.3-Codex veröffentlicht, ein Coding-Modell, das das Unternehmen als sein bisher leistungsfähigstes Werkzeug für agentisches Programmieren bezeichnet. Das Modell arbeitet 25% schneller als sein Vorgänger und kombiniert fortgeschrittene Coding-Leistung mit Reasoning-Fähigkeiten in einem System.
Laut OpenAI markiert GPT-5.3-Codex einen Meilenstein als erstes Modell, das bei seiner eigenen Entwicklung half. Das Codex-Team nutzte frühe Versionen zum Debugging von Trainingsprozessen, zur Verwaltung der Bereitstellung und zur Analyse von Testergebnissen. Das Modell kann nun langfristige Aufgaben über mehrere Tage bearbeiten, während Nutzer interagieren und Anweisungen geben können, ohne den Kontext zu verlieren.
Das Modell setzt neue Leistungsrekorde bei SWE-Bench Pro und Terminal-Bench, zwei Branchen-Benchmarks für Coding und agentische Fähigkeiten. OpenAI berichtet, dass GPT-5.3-Codex diese Ergebnisse mit weniger Tokens als frühere Modelle erreicht, was Operationen effizienter macht.
Über das Schreiben von Code hinaus unterstützt das Modell verschiedene professionelle Aufgaben wie Debugging, Deployment-Monitoring, Erstellen von Präsentationen und Analysieren von Tabellen. OpenAI demonstrierte diese Fähigkeiten, indem GPT-5.3-Codex zwei webbasierte Spiele autonom über Millionen von Tokens entwickelte. Das Modell zeigt auch ein verbessertes Verständnis der Nutzerabsicht und generiert funktionalere Webseiten aus einfachen prompts.
OpenAI klassifiziert GPT-5.3-Codex als erstes Modell mit hoher Fähigkeit für Cybersecurity-Aufgaben nach seinem Preparedness Framework. Das Unternehmen hat Sicherheitsmaßnahmen implementiert, darunter automatisches Monitoring und eingeschränkten Zugang für erweiterte Funktionen. OpenAI startet Trusted Access for Cyber, ein Pilotprogramm für Verteidigungsforschung, und stellt 10 Millionen Dollar in API-Credits für Cybersecurity-Forschung bereit.
