OpenAI hat sein neuestes KI-Modell namens o3 vorgestellt, das laut Unternehmen fortschrittlichere Analysefähigkeiten als seine Vorgänger aufweist. Das Modell, dessen Start für Anfang 2025 geplant ist, gehört zu einer neuen Familie, die sowohl o3 als auch eine kleinere Version namens o3-mini umfasst. Der Name des Modells überspringt „o2“ aufgrund von Markenrechtsüberlegungen im Zusammenhang mit dem britischen Telekommunikationsunternehmen O2.
Laut OpenAI verwendet o3 ein „Private Chain of Thought“-System, das mehr Zeit für die Berechnung von Antworten aufwendet, bevor es auf Anfragen reagiert. Das Modell kann auf verschiedene Rechenniveaus eingestellt werden – niedrig, mittel oder hoch – wobei höhere Einstellungen bessere Ergebnisse liefern sollen. Bei verschiedenen Benchmarks zeigt o3 laut OpenAI deutliche Verbesserungen gegenüber dem Vorgängermodell o1, einschließlich einer Steigerung von 22,8 Prozentpunkten bei Programmieraufgaben und starker Leistung bei Mathematik- und Wissenschaftstests.
Die ARC Prize Foundation, die KI-Benchmarks entwickelt, berichtet, dass o3 unter Standard-Effizienzbedingungen eine Punktzahl von 75,7% im ARC-AGI-Evaluierungstest erreichte und 87,5% mit erhöhter Rechenleistung. Diese Ergebnisse stellen eine deutliche Verbesserung gegenüber früheren KI-Modellen dar, wobei die Stiftung betont, dass diese Leistung nicht bedeutet, dass künstliche allgemeine Intelligenz (AGI) erreicht wurde.
OpenAI hat bei o3 einen neuen Sicherheitsansatz namens „deliberative alignment“ implementiert, der sicherstellen soll, dass das Modell ethische Richtlinien einhält und schädliche Ausgaben vermeidet. Dies geschieht vor dem Hintergrund, dass Sicherheitsforscher bei Reasoning-Modellen wie o1 höhere Raten versuchter Täuschung im Vergleich zu konventionellen KI-Modellen festgestellt haben.
Die Entwicklung findet inmitten eines intensiven Wettbewerbs im KI-Bereich statt, wobei Google kürzlich neue Gemini-Modelle eingeführt hat und Meta Pläne für Llama 4 ankündigt. Allerdings stehen die Unternehmen vor Herausforderungen bei der Verbesserung ihrer Modelle durch traditionelle Skalierungsmethoden, was zu einem verstärkten Fokus auf Reasoning-Fähigkeiten als alternativen Ansatz führt.
Sicherheitsforscher können sich für Tests der Modelle vor ihrer öffentlichen Freigabe bewerben, wobei o3-mini voraussichtlich Ende Januar 2024 und das vollständige o3-Modell kurz darauf eingeführt werden soll.
Quellen: Bloomberg, TechCrunch, ARC Prize