Turing-Preis für Pioniere des Reinforcement Learning

Die Association for Computing Machinery hat Andrew Barto und Richard Sutton mit dem renommierten Turing-Preis für ihre bahnbrechende Arbeit im Bereich Reinforcement Learning ausgezeichnet. Wie Cade Metz in der New York Times berichtet, teilen sich die beiden Forscher das Preisgeld von einer Million Dollar.

Barto und Sutton begannen ihre Zusammenarbeit Ende der 1970er Jahre an der University of Massachusetts in Amherst. Sie entwickelten mathematische Modelle, die zeigen, wie Maschinen durch digitale Entsprechungen von Belohnung und Bestrafung lernen können. Ihr 1998 erschienenes Buch „Reinforcement Learning: An Introduction“ gilt bis heute als Standardwerk.

Reinforcement Learning spielt eine entscheidende Rolle bei KI-Durchbrüchen der letzten Jahre. Googles AlphaGo besiegte 2016 den Go-Weltmeister Lee Sedol mithilfe dieser Technik. Auch ChatGPT von OpenAI nutzt diesen Ansatz.

„Sie sind die unbestrittenen Pioniere des Reinforcement Learning“, würdigt Oren Etzioni, emeritierter Professor an der University of Washington, die Preisträger.

Neuere Anwendungen umfassen „Reinforcement Learning from Human Feedback“ (RLHF), das bei der Verbesserung von ChatGPT half, sowie selbstlernende Modelle wie OpenAIs o1 und DeepSeeks R1.

Beide Preisträger sind überzeugt, dass Reinforcement Learning zentral für die künftige KI-Entwicklung sein wird, besonders in der Robotik. „Mit Reinforcement Learning einen Körper steuern zu lernen – das ist ein sehr natürlicher Vorgang“, erklärte Barto.

Mehr zum Thema:

Bleib up-to-date: