Harvard stellt Millionen-Bücher-Datensatz für KI-Training bereit

5. Februar 202517. Dezember 2024 von SCR

Die Harvard Universität hat einen umfangreichen Datensatz für KI-Training veröffentlicht. Wie Kate Knibbs für Wired berichtet, enthält die Sammlung fast eine Million gemeinfreier Bücher. Das von Microsoft und OpenAI finanzierte Projekt wird von der Institutional Data Initiative geleitet. Die Datensammlung umfasst klassische Werke von Shakespeare, Dickens und Dante sowie Fachtexte in verschiedenen Sprachen.

Greg Leppert, Geschäftsführer der Initiative, erklärt, dass das Projekt gleiche Chancen für kleinere KI-Entwickler und Forscher schaffen soll. Die Veröffentlichung erfolgt in Zusammenarbeit mit Google, wobei die genauen Details noch ausgearbeitet werden. Zusätzlich plant die Initiative, mit der Boston Public Library Millionen gemeinfreier Zeitungsartikel zu digitalisieren.

_{Über den Autor}

Artikel mit dem Autornamen SCR wurden mit KI-Hilfe erstellt. Jan Tissler wählt die Themen manuell aus. Jeder Beitrag wird von ihm vor der Veröffentlichung kontrolliert und bearbeitet. Er übernimmt die volle redaktionelle Verantwortung für die Inhalte. Lies mehr darüber, wie diese Website entsteht und welche Prompts zum Einsatz kommen.

Mehr zum Thema:

Schlagwörter: Forschung, Microsoft, OpenAI

Bleib up-to-date:

Newsletter

RSS Feed

Neu vom Autor dieser Website: ChatGPT-Kompass für Marketing Content Creation

Der aktuelle und umfassende Überblick für Marketing-Profis (3. Ausgabe, Januar 2026)

Der KI-Umbruch im Marketing ist in vollem Gange und ChatGPT steht als Plattform Nr. 1 im Zentrum. Aber wie behältst du den Überblick bei all den neuen Funktionen und Möglichkeiten? Wie setzt du ChatGPT wirklich gewinnbringend für deine Arbeit ein?

Der „ChatGPT-Kompass“ liefert dir einen fundierten, aktuellen und umfassenden Überblick über ChatGPT und seine Anwendungsmöglichkeiten im Marketing.

Mehr Informationen

Direkt beim Anbieter …

Bei Amazon …