Laut eines umfassenden Berichts von Artificial Analysis (PDF) haben KI-Modelle im Jahr 2024 bemerkenswerte Fortschritte erzielt. Mehrere Unternehmen haben das Leistungsniveau von OpenAIs GPT-4 erreicht oder übertroffen.
Die Analyse zeigt, dass führende Sprachmodelle wie Claude 3.5 Sonnet und Gemini 1.5 Pro neue Maßstäbe in Bezug auf ihre Fähigkeiten gesetzt haben. Open-Source-Modelle von Meta, Mistral und Alibaba haben den Abstand zu proprietären Lösungen deutlich verringert.
Eine wichtige Entwicklung war die drastische Senkung der Inferenzkosten. Einige Modelle bieten nun GPT-4-ähnliche Leistung zu einem bis zu 75-fach niedrigeren Preis an. Kleinere Modelle erreichen inzwischen Intelligenzniveaus, die früher nur mit deutlich größeren Architekturen möglich waren.
Die Kontextfenster wurden erheblich erweitert, wobei 128.000 Token zum neuen Industriestandard geworden sind. Einige Modelle unterstützen jetzt bis zu 2 Millionen Token, was einer 32-fachen Steigerung seit dem dritten Quartal 2023 entspricht.
Der Bericht hebt auch die Fortschritte bei multimodalen Fähigkeiten hervor. 61 Prozent der befragten Entwickler planen die Implementierung solcher Funktionen. Die Qualität der Bildgenerierung verbesserte sich deutlich, besonders im Bereich Fotorealismus und Textwiedergabe. Die Videogenerierung entwickelte sich von einem von OpenAIs Sora dominierten Feld zu einem wettbewerbsintensiven Markt mit mehreren starken Anbietern.
Auch Text-zu-Sprache und Sprache-zu-Text-Technologien machten bedeutende Fortschritte, wobei Transformer-basierte Modelle neue Qualitätsstandards setzten und deutliche Verbesserungen bei Verarbeitungsgeschwindigkeit und Kosteneffizienz erzielten.