低调巨头DeepSeek:引领中国AI竞赛的秘密武器

2024-12-31
低调巨头DeepSeek:引领中国AI竞赛的秘密武器

DeepSeek,这家低调的中国AI初创公司,其最新的R1模型在多个推理基准测试中击败了OpenAI的模型。它由对冲基金幻方全资资助,专注于基础技术而非商业应用,并承诺开源所有模型。DeepSeek通过低廉的API价格引发了中国AI模型的价格战,其背后依靠幻方强大的算力支持。DeepSeek的战略目标是构建通用人工智能(AGI),其研究重点在于突破性的架构和算法创新,例如多头潜在注意力(MLA)和稀疏专家混合(DeepSeekMoE),这些创新极大地降低了推理成本。DeepSeek的成功源于其对模型架构的全面创新和对本土人才的有效利用,这与许多专注于商业化和复制的中国公司形成鲜明对比。创始人梁文锋是一位技术理想主义者,他将“是非观”置于“利害观”之前,致力于推动中国AI领域的原创性创新,并相信中国可以在全球技术创新浪潮中扮演更重要的角色。