搜索技巧 海洋云增白 开源地图 AI 搜索答案 沙丘魔堡2 压缩机站 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 PostgreSQL AI工具 证券 DirectX DrawingPics 化学 KDE 披萨农场 多动症 植物学 分析化学 Three.js 大会 残疾人学校 初创 QB64 更多

OpenCoder:顶级开源代码大型语言模型 (opencoder-llm.github.io)

OpenCoder是一系列开源且可复现的代码大型语言模型,包括15亿和80亿参数的基础模型和聊天模型,支持英语和中文。它在包含90%原始代码和10%代码相关网络数据的2.5万亿个词符上进行训练,达到了顶级代码大型语言模型的性能。除了模型权重和推理代码,OpenCoder还提供了可复现的训练数据、完整的数据处理流程、严格的消融实验结果以及详细的训练协议。