Open-R1: DeepSeek-R1 추론 모델의 오픈소스 재현
2025-01-28

DeepSeek-R1 모델의 놀라운 추론 능력은 AI 커뮤니티를 매료시켰지만, 그 학습 세부 정보는 아직 공개되지 않았습니다. Open-R1 프로젝트는 데이터셋과 학습 파이프라인을 포함하여 DeepSeek-R1을 완전히 오픈소스로 재현하는 것을 목표로 합니다. 여기에는 DeepSeek-R1에서 고품질 추론 데이터셋을 증류하고, 순수 강화 학습 학습 프로세스를 재현하고, 다단계 학습 방법을 탐구하는 것이 포함됩니다. 최종 목표는 투명하고 재현 가능한 추론 모델을 만들고 오픈소스 커뮤니티의 발전을 촉진하는 것입니다.
AI