只需6美元训练的AI模型:S1挑战LLM巨头

2025-02-05
只需6美元训练的AI模型:S1挑战LLM巨头

一篇新论文展示了一个仅需6美元训练成本的AI模型S1,其性能逼近最先进水平,却可在普通笔记本电脑上运行。S1的关键在于其巧妙的“推理时间缩放”方法:通过在LLM的思考过程中插入“Wait”指令,控制其思考时长,从而优化性能。这与Entropix技术异曲同工,都通过干预模型的内部状态来提升性能。S1极度节约数据,仅用1000个精选样本就达到了令人惊讶的效果,这为AI研究带来了新的思路,也引发了关于模型蒸馏和知识产权的讨论。S1的低成本和高效性预示着AI发展将进入一个更加快速迭代的时代。