OpenAIs neuestes Sprachmodell GPT-4.5 hat seit seiner Veröffentlichung erhebliche Diskussionen in der KI-Gemeinschaft ausgelöst. Obwohl es OpenAIs größtes und kenntnisreichstes Modell darstellt, bleibt sein praktischer Wert unter Experten und Nutzern umstritten.
Ein kostspieliger Fortschritt
GPT-4.5 kommt mit einem stolzen Preisschild: etwa 10 bis 20 Mal teurer als Claude 3.7 Sonnet und 15 bis 30 Mal kostspieliger als GPT-4o. Bei der Markteinführung lag der Preis bei 75 Dollar pro Million Eingabe-Tokens und 150 Dollar pro Million Ausgabe-Tokens. Diese hohen Kosten haben OpenAI dazu veranlasst anzudeuten, dass sie das Modell möglicherweise nicht langfristig in ihrer API beibehalten werden, es sei denn, Nutzer identifizieren wirklich neuartige Anwendungsfälle.
Besondere Stärken
Trotz Preisbedenken zeigt GPT-4.5 mehrere bemerkenswerte Verbesserungen:
- Erweitertes Weltwissen und reduzierte Halluzinationen
- Bessere Leistung bei faktischen Benchmarks wie SimpleQA und PersonQA
- Verbesserte Dokumentenverarbeitungsfähigkeiten
- Natürlicherer Schreibstil mit besserer Kontextwahrnehmung
- Überlegene Leistung beim Extrahieren von Informationen aus unstrukturierten Daten
Das Unternehmen Box, das GPT-4.5 in sein Box AI Studio integriert hat, fand es „besonders wirksam für Unternehmensanwendungen, bei denen Genauigkeit und Integrität erfolgskritisch sind.“ Ihre Tests zeigten, dass GPT-4.5 das ursprüngliche GPT-4 bei Frage-Antwort-Aufgaben zu Unternehmensdokumenten um etwa 4 Prozentpunkte übertraf.
Gemischte Resonanz
Die Reaktionen auf GPT-4.5 waren polarisiert. Einige Experten wie Tyler Cowen sind begeistert von der verbesserten Ästhetik und Schreibfähigkeit des Modells. Andere stellen in Frage, ob seine Vorteile die Kosten rechtfertigen, wenn es mit Alternativen wie Claude 3.7 oder GPT-4o verglichen wird.
Andrej Karpathy, KI-Wissenschaftler und Mitgründer von OpenAI, merkte an, dass GPT-4.5 eine Verbesserung bei Aufgaben darstellt, die „mehr EQ-bezogen sind und durch Weltwissen, Kreativität, Analogiebildung, allgemeines Verständnis, Humor usw. begrenzt werden.“ Er räumte jedoch auch ein, dass die Bewertung schwierig bleibt, da herkömmliche Benchmarks diese Verbesserungen nicht vollständig erfassen.
Kein Reasoning-Modell
OpenAI hat betont, dass GPT-4.5 nicht als Reasoning-Modell konzipiert ist. Sam Altman, CEO von OpenAI, beschrieb es als „eine andere Art von Intelligenz“, die „kein Reasoning-Modell ist und keine Benchmarks dominieren wird.“ Das Modell wurde mit Pretraining, überwachtem Finetuning und Reinforcement Learning aus menschlichem Feedback trainiert, es fehlt aber das spezialisierte Training, das für fortgeschrittenes Reasoning in Bereichen wie Mathematik oder Programmierung erforderlich ist.
Dies positioniert GPT-4.5 als Ergänzung zu, nicht als Konkurrenz zu Modellen wie o1 und o3, die bei Reasoning-Aufgaben hervorragende Leistungen erbringen.
Quellen: VentureBeat, Don’t Worry About the Vase, Interconnects