OpenCoder是一个开源的顶级代码大型语言模型,性能媲美领先模型。与以往只发布模型权重和推理代码不同,OpenCoder还开源了可复现的训练数据、完整的数据处理流程、实验结果和详细的训练协议。OpenCoder的关键要素包括:代码优化启发式规则、代码相关文本语料库的召回以及高质量的合成数据。OpenCoder旨在为代码AI研究提供一个开放的平台,加速研究进展。