DeepMinds SCoRE soll KI-Modelle verlässlicher machen

DeepMind hat eine neue Technik namens SCoRe entwickelt, die die Selbstkorrektur-Fähigkeiten von großen Sprachmodellen (LLMs) deutlich verbessert. Das berichtet Ben Dickson in einem Artikel für VentureBeat. SCoRe nutzt dabei selbst generierte Daten und ermöglicht es LLMs, ihr internes Wissen zu nutzen, um Fehler zu erkennen und zu korrigieren. In Tests übertraf SCoRe andere Selbstkorrektur-Methoden deutlich. Die Technik reduzierte auch Fälle, in denen Modelle fälschlicherweise korrekte Antworten änderten.

SCoRe funktioniert, indem es ein zweistufiges Trainingsverfahren mit Reinforcement Learning einsetzt. Zunächst lernt das Modell, seine Antworten zu verbessern, ohne dabei die ursprünglichen Outputs zu stark zu verändern. In der zweiten Phase wird das Modell darauf trainiert, seine Antworten über mehrere Versuche hinweg zu optimieren. Dabei wird es belohnt, wenn es sich von der ersten zur zweiten Antwort verbessert. Die Forscher sehen in SCoRe einen wichtigen Schritt, um LLMs zuverlässiger und robuster zu machen, insbesondere bei komplexen Aufgaben wie Mathematik und Programmierung.

Über den Autor

Mehr zum Thema:

Bleib up-to-date:

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (2. Ausgabe, September 2025)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklichgewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen