廉价复现尖端AI模型:只需50美元!
2025-02-06

斯坦福大学和华盛顿大学的研究人员仅用不到50美元的云计算费用,就训练出一个名为s1的AI推理模型,其性能与OpenAI的o1和DeepSeek的R1等尖端模型相当。他们通过蒸馏法,利用谷歌Gemini 2.0 Flash Thinking Experimental模型的答案和思考过程作为训练数据,并结合少量精心挑选的问题集(1000个),在16个Nvidia H100 GPU上训练不到30分钟就完成了。这一成果引发了人们对AI模型商品化的讨论,也让大型AI实验室感到不安。
AI
蒸馏法