ハーバード大学、大規模な無料AIトレーニングデータセットを公開

2024-12-18

ハーバード大学は、MicrosoftとOpenAIとの協力の下、約100万冊のパブリックドメイン書籍を含む大規模なAIトレーニングデータセットを公開しました。ハーバード大学のInstitutional Data Initiativeによって作成されたこのデータセットは、これまで大企業しかアクセスできなかった高品質のトレーニングデータに、中小企業や個人研究者がアクセスできるようにすることで、「公平な競争環境」を作ることを目指しています。Linuxのような影響力を持ち、様々なジャンル、時代、言語にまたがるこのリソースは、AIモデル開発を促進するでしょう。ただし、企業はモデルの差別化のために、追加のライセンスデータが必要となります。