Eine neue Studie von Forschern aus den Organisationen Cohere, Stanford, MIT und Ai2 wirft LM Arena vor, großen KI-Unternehmen Vorzugsbehandlung zu gewähren. Laut eines Berichts von Maxwell Zeff bei TechCrunch durften Firmen wie Meta, OpenAI, Google und Amazon mehrere Modellvarianten privat testen und nur die Ergebnisse der besten veröffentlichen. Die Forscher behaupten, Meta habe vor dem Llama-4-Release 27 Modellvarianten getestet, aber nur ein gut abschneidendes Ergebnis publiziert. LM-Arena-Mitgründer Ion Stoica wehrte sich und bezeichnete die Studie als „voller Ungenauigkeiten“. Er betonte, alle Modellanbieter hätten gleiche Chancen erhalten. Die Kontroverse kommt nur Wochen nachdem Meta bei der Optimierung speziell für Chatbot-Arena-Benchmarks ertappt wurde und während LM Arena plant, als Unternehmen Investorengelder einzusammeln.