Die Diskussion um die Herkunft der Trainingsdaten für KI-Tools wird lauter

Moderne KI-Tools wie ChatGPT haben ihre Fähigkeiten durch immense Mengen Trainingsdaten erlangt. Anbieter wie OpenAI legen bislang allerdings meist nicht offen, woher sie dieses Material haben. Und das aus gutem Grund: Es gibt Anzeichen dafür, dass sie beim Einsaugen der Inhalte gegen die Nutzungsbedingungen mancher Websites verstoßen haben. Und es stellt sich die Frage, ob sie urheberrechtlich geschützte Werke ohne Lizenz nutzen dürfen. Die New York Times hat dies in einem ausführlichen Report beleuchtet. Es gibt außerdem eine Zusammenfassung der wichtigsten Erkenntnisse.

Weitere Artikel zu diesem Themenkomplex:

  1. Reuters: Inside Big Tech’s underground race to buy AI training data
  2. Bloomberg: Adobe’s ‘Ethical’ Firefly AI Was Trained on Midjourney Images
  3. VentureBeat: Apple’s $25-50 million Shutterstock deal highlights fierce competition for AI training data
  4. The Hill: Schiff unveils AI training transparency measure
  5. Bloomberg: Adobe Is Buying Videos for $3 Per Minute to Build AI Model

Mehr zum Thema:

Bleib up-to-date: