开源复现DeepSeek-R1推理模型:Open-R1项目启动

2025-01-28
开源复现DeepSeek-R1推理模型:Open-R1项目启动

DeepSeek-R1模型凭借其强大的推理能力惊艳业界,但其训练细节却未公开。Open-R1项目旨在完全开源复现DeepSeek-R1,包括数据集和训练流程。该项目将通过蒸馏DeepSeek-R1的数据,复现其纯强化学习训练流程,并探索多阶段训练方法,最终目标是构建一个透明、可复现的推理模型,并推动开源社区发展。

AI