6달러 AI 모델이 LLM 환경을 뒤흔들다: S1 등장
2025-02-05

새로운 논문에서 단 6달러로 훈련된 AI 모델 S1이 공개되었습니다. 일반 노트북에서 실행하면서 최첨단 성능에 필적하는 결과를 보여줍니다. 비결은 정교한 '추론 시간 스케일링' 기법에 있습니다. LLM의 사고 과정에 '대기' 명령어를 삽입하여 사고 시간을 제어하고 성능을 최적화합니다. 이는 Entropix 기법과 유사하며, 모두 모델의 내부 상태를 조작하여 성능 향상을 도모합니다. S1은 데이터 사용량이 매우 적어 엄선된 1000개의 샘플만으로 놀라운 성과를 거두었으며, AI 연구에 새로운 길을 열고 모델 증류와 지적 재산권에 대한 논쟁을 불러일으키고 있습니다. S1의 저렴한 비용과 높은 효율성은 AI 개발 속도가 빨라질 것임을 시사합니다.