KI-Modelle können sich durch Debatte der Wahrheit annähern

Zwei aktuelle Studien liefern erste empirische Belege dafür, dass Debatten zwischen KI-Modellen einem menschlichen oder maschinellen Richter helfen können, die Wahrheit zu erkennen, berichtet Nash Weerasekera für Quanta Magazine. Bei diesem Ansatz präsentieren zwei Expertenmodelle Argumente zu einer Frage, woraufhin ein weniger informierter Richter entscheidet, welche Seite Recht hat.

In Experimenten von Anthropic und Google DeepMind konnten KI-Richter die richtigen Antworten auf Verständnis- und Wissenschaftsfragen genauer identifizieren, wenn die Sprachmodelle debattierten. Forscher warnen jedoch, dass die Modelle noch immer anfällig für irrelevante Faktoren wie Argumentlänge sein können und sich möglicherweise nicht gut auf komplexe reale Probleme verallgemeinern lassen.

Mehr zum Thema:

Bleib up-to-date: