Harvard stellt Millionen-Bücher-Datensatz für KI-Training bereit
Die Harvard Universität hat einen umfangreichen Datensatz für KI-Training veröffentlicht. Wie Kate Knibbs für Wired berichtet, enthält die Sammlung fast eine Million gemeinfreier Bücher. Das von Microsoft und OpenAI finanzierte Projekt wird von der Institutional Data Initiative geleitet. Die Datensammlung umfasst klassische Werke von Shakespeare, Dickens und Dante sowie Fachtexte in verschiedenen Sprachen. Greg Leppert, …