OpenAI-Datensatz soll Mehrsprachigkeit verbessern
OpenAI hat einen mehrsprachigen Datensatz veröffentlicht, der die Leistung von KI-Modellen in 14 Sprachen bewertet. Wie Michael Nuñez für VentureBeat berichtet, umfasst der „Multilingual Massive Multitask Language Understanding“ (MMMLU) Datensatz Sprachen wie Arabisch, Deutsch, Swahili und Yoruba. Er wurde auf der offenen Datenplattform Hugging Face geteilt und baut auf dem beliebten MMLU-Benchmark auf, der bisher …