Harvard Lança imenso Conjunto de Dados Gratuito para Treinamento de IA

2024-12-18

A Universidade Harvard, em parceria com a Microsoft e a OpenAI, lançou um imenso conjunto de dados para treinamento de IA contendo quase 1 milhão de livros de domínio público. Criado pela Iniciativa de Dados Institucionais de Harvard, este conjunto de dados visa 'nivelar o campo de jogo', fornecendo a pequenos participantes e pesquisadores individuais acesso a dados de treinamento de alta qualidade, anteriormente disponíveis apenas para grandes empresas de tecnologia. Semelhante ao impacto do Linux, este recurso, abrangendo vários gêneros, décadas e idiomas, impulsionará o desenvolvimento de modelos de IA. No entanto, as empresas ainda precisarão de dados licenciados adicionais para diferenciar seus modelos.