只需30美元!伯克利研究人员复现DeepSeek R1核心技术
2025-01-28
伯克利大学的研究人员以不到30美元的成本复现了DeepSeek R1-Zero的核心技术,实现了在小型语言模型中实现复杂的推理能力。该团队使用倒计时游戏作为测试平台,证明即使是中等规模的语言模型(15亿参数)也能通过强化学习发展出复杂的问题解决策略,其性能与更大的系统相当。这项研究表明,先进的AI能力并非依赖于巨额资源,而是巧妙的思维和正确的方法。