中国DeepSeek Coder成为首个超越GPT-4 Turbo的开源编码模型

2024-06-19

中国人工智能初创公司DeepSeek发布了开源代码语言模型DeepSeek Coder V2,该模型基于混合专家 (MoE) 架构,在编码和数学任务方面表现出色。DeepSeek Coder V2支持超过300种编程语言,并在多个基准测试中超越了GPT-4 Turbo、Claude 3 Opus和Gemini 1.5 Pro等最先进的闭源模型,成为首个达到这一成就的开源模型。DeepSeek Coder V2基于DeepSeek V2模型构建,并在包含代码和数学相关数据的6万亿token数据集上进行了预训练,具备处理复杂编码任务的能力,同时在通用推理和语言理解任务中也表现出色。