Open-R1: Open-Source-Reproduktion des DeepSeek-R1-Reasoning-Modells

Beliebte Tags：

Kosmos Virtualisierung DNS-Sicherheit formale Verifikation Erreichbarkeitsanalyse KI Compilerfehler Makrokonflikt Web-Erweiterung Entwicklungsframework Alle Tags

Open-R1: Open-Source-Reproduktion des DeepSeek-R1-Reasoning-Modells

2025-01-28

Die beeindruckenden Reasoning-Fähigkeiten des DeepSeek-R1-Modells haben die KI-Community begeistert, aber die Details zum Training bleiben geheim. Das Open-R1-Projekt zielt darauf ab, DeepSeek-R1 vollständig Open Source zu reproduzieren, einschließlich der Datensätze und der Trainingspipeline. Dies beinhaltet die Destillation eines hochwertigen Reasoning-Datensatzes aus DeepSeek-R1, die Reproduktion des reinen Reinforcement-Learning-Trainingsprozesses und die Erforschung mehrstufiger Trainingsmethoden. Das letztendliche Ziel ist die Erstellung eines transparenten und reproduzierbaren Reasoning-Modells, das die Fortschritte in der Open-Source-Community vorantreibt.

(huggingface.co)

Verstärkendes Lernen – Algorithmen: Ein umfassender Leitfaden

Leichen bewegen sich über ein Jahr nach dem Tod, so eine Studie