Interne Gerichtsdokumente zeigen, dass Meta für das Training seiner KI Bücher von der Piraterieseite LibGen verwendet hat. Dies geht aus einem Urheberrechtsstreit hervor, den mehrere bekannte Autoren, darunter Junot Diaz, Sarah Silverman und Ta-Nehisi Coates, eingereicht haben, wie Lithub mit Bezug auf einen Wired-Artikel berichtet.
Die nun öffentlich gewordenen Dokumente enthalten direkte Zitate von Meta-Mitarbeitern. Ein Ingenieur äußerte Bedenken über das „Torrenting von einem Firmen-Laptop“. Die Unterlagen belegen auch, dass Meta-CEO Mark Zuckerberg die Nutzung der raubkopierten Materialien genehmigte.
Der als Kadrey et al. v. Meta Platforms bekannte Fall wird im Northern District of California verhandelt. Die Kläger wollen ihre Klage erweitern, da neue Beweise vorliegen. Diese deuten darauf hin, dass Meta nicht nur urheberrechtlich geschützte Inhalte heruntergeladen, sondern diese auch aktiv über Torrent-Netzwerke verbreitet hat.
Ein Meta-Vertreter bestätigte im November 2024 unter Eid, dass das Unternehmen raubkopierte Dateien der Kläger in Torrent-Netzwerken „geseedet“ hat. Seeding bedeutet, dass heruntergeladene Dateien anderen Nutzern zur Verfügung gestellt werden.
Meta verteidigt sich mit dem Argument, dass die verwendeten Materialien öffentlich zugänglich waren und unter die Fair-Use-Doktrin fallen. Die Kläger halten dagegen, dass öffentliche Verfügbarkeit keine rechtmäßige Nutzung bedeutet, besonders wenn bekannt ist, dass die Inhalte aus illegalen Quellen stammen.
Der Fall wirft grundlegende Fragen zur Rechtmäßigkeit von KI-Trainingsdaten auf. Er verdeutlicht die Verantwortung großer Technologieunternehmen, bei der Entwicklung ihrer KI-Modelle nur legal erworbene Materialien zu verwenden.