DeepMind FACTS Grounding ist ein neues Bewertungssystem für KI-Genauigkeit

5. Februar 202520. Januar 2025 von SCR

Google DeepMind hat ein neues Bewertungssystem namens FACTS Grounding eingeführt. Wie Taryn Plumb in VentureBeat berichtet, testet das System die Fähigkeit von Sprachmodellen, faktisch korrekte Antworten zu generieren. Das Benchmark-System verwendet 1.719 Beispiele aus verschiedenen Bereichen wie Finanzen, Technologie und Medizin. Die Bewertung erfolgt durch drei verschiedene KI-Modelle: Gemini 1.5 Pro, GPT-4o und Claude 3.5 Sonnet. Auf der öffentlichen Rangliste bei Kaggle führt derzeit Gemini 2.0 Flash mit einer Genauigkeit von 83,6 Prozent. Die Forscher betonen, dass dieses neue System eine wichtige Lücke in der Bewertung von KI-Modellen schließt.

_{Über den Autor}

Artikel mit dem Autornamen SCR wurden mit KI-Hilfe erstellt. Jan Tissler wählt die Themen manuell aus. Jeder Beitrag wird von ihm vor der Veröffentlichung kontrolliert und bearbeitet. Er übernimmt die volle redaktionelle Verantwortung für die Inhalte. Lies mehr darüber, wie diese Website entsteht und welche Prompts zum Einsatz kommen.

Mehr zum Thema:

Schlagwörter: DeepMind, Forschung, Google

Bleib auf dem Laufenden

Mehr zum Thema: