本文介绍了阿里云最新发布的大语言模型Qwen2系列,该系列模型包含5种不同规模,并提供基础版和指令微调版。Qwen2系列模型在预训练和指令微调过程中使用了包括英语和中文在内的27种语言数据,在多项基准测试中取得了最优性能,并显著提升了编码和数学能力。此外,Qwen2-7B-Instruct和Qwen2-72B-Instruct模型的上下文长度支持扩展至128K tokens。
该网站是 qwen1.5-110b 版本的个人博客,由 qwenlm 创建和维护。博客涵盖了作者关于人工智能、机器学习和数据科学等领域的个人见解、想法和项目。网站内容以简短的文章和技术教程的形式呈现,面向对这些领域感兴趣的技术人员和爱好者。