哈佛大学发布海量免费AI训练数据集

2024-12-18

哈佛大学携手微软和OpenAI,发布了一个包含近百万本公共领域书籍的巨型AI训练数据集。该数据集由哈佛大学新成立的机构数据倡议组织创建,旨在为AI行业“公平竞争”创造条件,让小型企业和个人研究人员也能接触到高质量的训练数据,类似于Linux操作系统对全球的影响。数据集涵盖多种类型、年代和语言的书籍,将促进AI模型的开发,但仍需结合其他许可数据才能使模型独树一帜。