Die Niederlande entwickeln ein eigenes großes Sprachmodell, das unabhängig von amerikanischen KI-Anbietern betrieben werden soll. TNO schreibt, dass das Projekt unter dem Namen GPT-NL vom Forschungsinstitut TNO gemeinsam mit SURF und dem Niederländischen Forensischen Institut (NFI) umgesetzt wird. Die niederländische Regierung stellt dafür 13,5 Millionen Euro über die Niederländische Unternehmensagentur bereit.
Ziel des Projekts ist mehr Kontrolle über KI-Infrastruktur für die Niederlande und Europa. Die Entwickler nennen dies „digitale Autonomie“: die Fähigkeit, unabhängig zu entscheiden, wie ein Sprachmodell funktioniert, welche Daten es nutzt und wie es mit sensiblen Informationen umgeht.
Neutrainiert mit strengen Datenregeln
GPT-NL wird vollständig neu trainiert. Das Team übernimmt keine Daten aus bestehenden Modellen und vermeidet damit ungeklärte Datenherkunft, Urheberrechtsprobleme und den ungewollten Einschluss personenbezogener Daten. Vor dem Training werden persönliche Informationen entfernt und anonymisiert. Vertrauliche, schädliche oder urheberrechtlich geschützte Inhalte werden ausgeschlossen.
Der Quellcode wird als Open Source veröffentlicht. Die Modellgewichte stehen unter einer kontrollierten Lizenz zur Verfügung. So können die Entwickler nachverfolgen, wer das Modell nutzt, und Nutzer über Änderungen informieren, etwa wenn ein Datenanbieter seine Einwilligung zurückzieht.
Ein sogenanntes Content Board gibt Datenanbietern und Rechteinhabern eine Stimme in der Projektentwicklung. Ein Teil der Einnahmen fließt an die Urheber zurück. TNO bezeichnet dies als ein gerechteres Modell der Wertverteilung.
Das Team arbeitet außerdem daran, den Energie- und Wasserverbrauch beim Training des Modells zu reduzieren. Grundlage dafür ist laufende wissenschaftliche Forschung.
GPT-NL soll zeigen, dass leistungsfähige KI und öffentliche Werte wie Datenschutz, Transparenz und Urheberrecht sich nicht gegenseitig ausschließen.
Bleib auf dem Laufenden
KI für Contentprofis: die neuesten Tools, Tipps und Trends. Alle 14 Tage in deine Inbox:
