Berkeley-Forscher replizieren DeepSeek R1-Kerntechnologie für nur 30 $

2025-01-28
Berkeley-Forscher replizieren DeepSeek R1-Kerntechnologie für nur 30 $

Ein KI-Team der Universität Berkeley hat die Kerntechnologie von DeepSeek R1-Zero für unter 30 $ repliziert und dabei ein ausgeklügeltes Schlussfolgern in einem kleinen Sprachmodell (1,5 Milliarden Parameter) demonstriert. Mit dem Countdown-Spiel als Benchmark zeigten sie, dass selbst bescheidene Modelle komplexe Problemlösungsstrategien durch Reinforcement Learning entwickeln können und dabei eine Leistung erreichen, die mit größeren Systemen vergleichbar ist. Dieser Durchbruch demokratisiert die KI-Forschung und beweist, dass bedeutende Fortschritte keine riesigen Ressourcen erfordern.