DeepMind FACTS Grounding ist ein neues Bewertungssystem für KI-Genauigkeit

Google DeepMind hat ein neues Bewertungssystem namens FACTS Grounding eingeführt. Wie Taryn Plumb in VentureBeat berichtet, testet das System die Fähigkeit von Sprachmodellen, faktisch korrekte Antworten zu generieren. Das Benchmark-System verwendet 1.719 Beispiele aus verschiedenen Bereichen wie Finanzen, Technologie und Medizin. Die Bewertung erfolgt durch drei verschiedene KI-Modelle: Gemini 1.5 Pro, GPT-4o und Claude 3.5 Sonnet. Auf der öffentlichen Rangliste bei Kaggle führt derzeit Gemini 2.0 Flash mit einer Genauigkeit von 83,6 Prozent. Die Forscher betonen, dass dieses neue System eine wichtige Lücke in der Bewertung von KI-Modellen schließt.

Mehr zum Thema:

Bleib up-to-date:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (2. Ausgabe, September 2025)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklichgewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen