OpenAI finanzierte Mathe-Benchmark vor Rekordergebnis im Test

5. Februar 202521. Januar 2025 von SCR

Eine Beteiligung von OpenAI am KI-Mathematik-Benchmark FrontierMath wurde erst jetzt bekannt, nachdem das Unternehmen selbst Rekordergebnisse damit erzielte. Wie Decoder-Autor Matthias Bastian berichtet, erreichte OpenAIs neues o3-Modell eine Erfolgsquote von 25,2 Prozent bei komplexen mathematischen Aufgaben – deutlich mehr als die bisherige Quote von 2 Prozent. Entwickler Epoch AI durfte OpenAIs Beteiligung aufgrund vertraglicher Vereinbarungen erst nach der o3-Ankündigung im Dezember 2024 offenlegen. Epoch-AI-Vertreter Tamay Besiroglu räumte ein, dass mehr Transparenz nötig gewesen wäre, besonders gegenüber den über 60 beteiligten Mathematikern. Während OpenAI vorab Zugang zu vielen Testaufgaben erhielt, behielt Epoch AI einen separaten Aufgabenpool für unabhängige Tests zurück.

_{Über den Autor}

Der Autorname SCR steht für Inhalte, die mit KI-Hilfe erstellt wurden. Die Themen werden manuell ausgewählt. Jeder Beitrag wird vor der Veröffentlichung kontrolliert und bearbeitet. Redaktionelle Verantwortung: Jan Tissler. Lies mehr darüber, wie diese Website entsteht und welche Prompts zum Einsatz kommen.

Mehr zum Thema:

Schlagwörter: OpenAI

Bleib up-to-date:

Newsletter

RSS Feed

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (3. Ausgabe, Januar 2026)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklich gewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen

Direkt beim Anbieter …

Bei Amazon …