Scale AI veröffentlicht erstmals Ranglisten für große Sprachmodelle (LLMs), die deren Leistung in spezifischen Anwendungsbereichen wie generative KI-Programmierung, Anweisungsbefolgung, Mathematik und Mehrsprachigkeit bewerten. OpenAIs GPT-Modelle belegen in drei der vier Bereiche den ersten Platz, während Anthropics Claude 3 Opus in der vierten Kategorie die Spitzenposition einnimmt.