DeepSeek: 중국 AI 경쟁을 이끄는 조용한 거인

2024-12-31
DeepSeek: 중국 AI 경쟁을 이끄는 조용한 거인

DeepSeek은 저명하지 않은 중국 AI 스타트업이지만, R1 모델이 여러 추론 벤치마크에서 OpenAI 모델을 능가하며 주요 업체로 부상했습니다. 양적 헤지펀드인 High-Flyer가 전액 투자하며, 상용 애플리케이션보다 기초 기술에 집중하고, 모든 모델을 오픈소스로 공개할 것을 약속했습니다. 저렴한 API로 중국에서 가격 경쟁을 촉발했습니다. 이는 High-Flyer의 방대한 컴퓨팅 리소스 접근성 덕분입니다. DeepSeek의 야심찬 목표는 인공 일반 지능(AGI) 달성이며, 다중 헤드 잠재적 어텐션(MLA) 및 스파스 믹스처 오브 익스퍼츠(DeepSeekMoE)와 같은 획기적인 아키텍처 및 알고리즘 혁신에 중점을 두어 추론 비용을 대폭 줄였습니다. 성공은 포괄적인 모델 아키텍처 혁신과 국내 인재의 효율적인 활용에 기인하며, 상용화와 복제에 집중하는 많은 중국 기업과는 대조적입니다. 창업주 Liang Wenfeng은 기술적 이상주의자로서 '옳고 그름'을 '이익과 손실'보다 우선시하며, 중국의 독창적인 혁신을 추진하고 중국이 세계 기술 혁신의 물결에서 더 중요한 역할을 수행하기를 목표로 합니다.

AI