50달러 미만으로 최첨단 AI 모델에 필적하는 추론 모델 등장

2025-02-06
50달러 미만으로 최첨단 AI 모델에 필적하는 추론 모델 등장

스탠포드 대학교와 워싱턴 대학교 연구진이 클라우드 컴퓨팅 비용 50달러 미만으로 s1이라는 AI 추론 모델을 개발했다. s1은 수학 및 코딩 능력을 측정하는 테스트에서 OpenAI의 o1이나 DeepSeek의 R1과 같은 최첨단 추론 모델과 동등한 성능을 보였다. 연구팀은 Google의 Gemini 2.0 Flash Thinking Experimental을 교사 모델로 사용하고, 엄선된 1000개의 질문과 답변 데이터 세트를 사용한 지식 증류법을 활용했다. 이러한 저비용 재현은 AI 모델의 상품화에 대한 논쟁을 불러일으키고, 대형 AI 연구소들을 당황하게 만들었다고 전해진다.