OpenAIs o3-pro ist sein bislang fortschrittlichstes Reasoning-Modell

OpenAI hat o3-pro veröffentlicht, ein neues KI-Modell, das das Unternehmen als sein bisher leistungsfähigstes bezeichnet. Das Modell ist für ChatGPT Pro- und Team-Nutzer verfügbar, Enterprise- und Education-Kunden erhalten in der nächsten Woche Zugang.

o3-pro ist eine erweiterte Version von OpenAIs o3 Reasoning-Modell. Anders als herkömmliche KI-Modelle, die sofortige Antworten generieren, arbeiten Reasoning-Modelle Probleme schrittweise durch. Dieser Ansatz ermöglicht zuverlässigere Leistungen in komplexen Bereichen wie Mathematik, Physik und Programmierung. Erfahre mehr über Reasoning-KI in unserem Erklärbeitrag.

Funktionen und Einschränkungen

Das neue Modell hat Zugang zu verschiedenen Tools, die seine Funktionalität erweitern. Es kann im Web suchen, hochgeladene Dateien analysieren, visuelle Inhalte interpretieren, Python-Code ausführen und Antworten mithilfe von Memory personalisieren. OpenAI erklärt, dass Experten o3-pro in allen getesteten Kategorien gegenüber dem Standard-o3-Modell bevorzugten, besonders in Wissenschaft, Bildung, Programmierung, Business und Schreibhilfe.

Diese erweiterten Fähigkeiten bringen jedoch Nachteile mit sich. OpenAI räumt ein, dass o3-pro-Antworten deutlich länger dauern als beim Vorgänger o1-pro. Das Unternehmen empfiehlt das Modell für anspruchsvolle Fragen, bei denen Genauigkeit wichtiger ist als Geschwindigkeit.

Erste Nutzer berichten von extremen Bearbeitungszeiten für einfache Anfragen.

Preise und technische Beschränkungen

o3-pro hat einen Premium-Preis über OpenAIs Developer-API. Das Modell kostet 20 Dollar pro Million Input-Token und 80 Dollar pro Million Output-Token. Zum Vergleich: eine Million Input-Token entspricht etwa 750.000 Wörtern. Das sind deutlich höhere Kosten als beim Standard-o3-Modell, das bei 2 Dollar für Input und 8 Dollar für Output-Token liegt.

Das Modell hat derzeit mehrere Einschränkungen. OpenAI hat temporäre Chat-Sitzungen vorübergehend deaktiviert, während technische Probleme behoben werden. o3-pro kann keine Bilder generieren, Nutzer müssen zu anderen Modellen wie GPT-4o wechseln. Das Canvas-Workspace-Feature wird ebenfalls noch nicht unterstützt.

Performance-Benchmarks

Laut OpenAIs internen Tests erreicht o3-pro starke Ergebnisse in branchenüblichen KI-Benchmarks. Bei AIME 2024, das mathematische Fähigkeiten testet, übertrifft das Modell Googles Gemini 2.5 Pro und Anthropics Claude Opus 4. OpenAI verwendet ein „4/4 Reliability“-Bewertungssystem, bei dem Modelle Fragen in allen vier Versuchen korrekt beantworten müssen.

Der Launch erfolgt, während Reasoning-Modelle unter KI-Unternehmen zunehmend umkämpft werden. Google, Anthropic, xAI und chinesische Unternehmen wie DeepSeek haben alle eigene Reasoning-fokussierte Modelle veröffentlicht.

Trotz früher Berichte über hohe Kosten und langsame Processing-Zeiten haben einige Nutzer o3-pros Performance gelobt. Der frühere Apple Vision Pro-Designer Ben Hyak bemerkte Verbesserungen bei der Fähigkeit des Modells, seine Umgebung zu verstehen und passende Tools für Aufgaben zu wählen.

Quellen: OpenAI, VentureBeat, TechCrunch

Mehr zum Thema:

Bleib up-to-date: