Generative KI-Systeme, darunter große Sprachmodelle und Bildgeneratoren, sind grundsätzlich nicht in der Lage, echte wissenschaftliche Entdeckungen zu machen. Das schreibt Richard Sutton auf X, der früher als Twitter bekannten Plattform. Sutton gilt als einer der einflussreichsten Forscher in der Geschichte der künstlichen Intelligenz und als Pionier des Reinforcement Learning.
Sein zentrales Argument ist einfach: Generative KI kann Ergebnisse liefern, die entweder neu oder gut sind, aber niemals beides gleichzeitig. Stützt sich ein System auf seine Trainingsdaten, ist die Ausgabe verlässlich. Weicht es davon ab, halluziniert es. Einen Mittelweg gibt es nicht.
Was generativer KI fehlt
Sutton benennt die fehlende Zutat als das, was er „Discovery“ nennt, also Entdeckung. Er beschreibt sie als dreistufigen Prozess: Variation, Evaluation und selektive Beibehaltung. Evolution, die wissenschaftliche Methode und alltägliches Lernen folgen alle diesem Muster. Generative KI, so sein Argument, vollzieht davon nur den ersten Schritt.
Diese Systeme erzeugen zwar unterschiedliche Ausgaben, haben aber keine eingebaute Möglichkeit zu bewerten, welche davon tatsächlich gut sind. Ohne Evaluation wird nichts behalten, weil es besser wäre. Neuartiges entsteht kurz und verschwindet wieder, ohne eine Spur zu hinterlassen.
Als Beispiele für Systeme, die echte Entdeckungen erzielen, nennt Sutton AlphaGo, AlphaFold, AlphaProof sowie Anwendungen von Reinforcement Learning in Bereichen wie der Fahrdienstvermittlung. All diese Systeme haben eine klare Zielfunktion, die es ihnen erlaubt, ihre eigenen Ergebnisse zu bewerten und sich zu verbessern.
Ein Plädoyer für einen anderen Ansatz
Für Wissenschaft und Mathematik reicht bloße Imitation nach Suttons Einschätzung nicht aus. Er ruft Forschende und Institutionen dazu auf, über Supervised Learning hinauszugehen und in KI-Systeme zu investieren, die ihre eigenen Ideen bewerten und auswählen können. „Lasst uns Kreativität und Entdeckung vollständig automatisieren“, schreibt er.
Sutton erwähnt außerdem, dass seine Forschungsgruppe in der Fachzeitschrift Nature einen Algorithmus veröffentlicht hat, der eine verwandte Schwäche im Deep Learning adressiert. Dieser Algorithmus erhält die Fähigkeit eines neuronalen Netzes, über die Zeit hinweg weiter zu lernen.
Bleib auf dem Laufenden
KI für Contentprofis: die neuesten Tools, Tipps und Trends. Alle 14 Tage in deine Inbox:
