DeepSeek V3: 제한된 자원으로 최고 성능 달성
2025-01-23

OpenAI와 같은 거대 기업이 사용하는 자원의 극히 일부인 2048개의 H800 GPU로만 훈련된 DeepSeek의 새로운 V3 모델은 여러 벤치마크에서 GPT-4와 Claude에 필적하거나 능가합니다. 훈련 비용은 550만 달러로, GPT-4의 추정 4000만 달러와 비교하여 매우 저렴합니다. 이러한 성공은 고성능 GPU 접근을 제한하는 미국의 수출 규제로 인해 부분적으로 촉진되었으며, 순수한 연산 능력보다 아키텍처 혁신과 알고리즘 최적화의 가능성을 부각합니다. 이는 역설적으로 자원 제약이 AI 개발의 획기적인 발전을 촉진할 수 있다는 설득력 있는 주장입니다.