Open-R1: Reprodução em código aberto do modelo de raciocínio DeepSeek-R1

2025-01-28
Open-R1: Reprodução em código aberto do modelo de raciocínio DeepSeek-R1

As impressionantes capacidades de raciocínio do modelo DeepSeek-R1 cativaram a comunidade de IA, mas seus detalhes de treinamento permanecem não divulgados. O projeto Open-R1 visa reproduzir completamente o DeepSeek-R1 em código aberto, incluindo conjuntos de dados e pipeline de treinamento. Isso envolverá a destilação de um conjunto de dados de raciocínio de alta qualidade do DeepSeek-R1, a replicação de seu processo de treinamento de aprendizado por reforço puro e a exploração de métodos de treinamento em várias etapas. O objetivo final é criar um modelo de raciocínio transparente e reprodutível, impulsionando avanços na comunidade de código aberto.

IA