Mistral AI 发布了新一代旗舰模型 Mistral Large 2,该模型在代码生成、数学和推理方面比其前身功能更强大,并提供更强大的多语言支持和高级函数调用功能。Mistral Large 2 拥有 128k 的上下文窗口,支持包括中文在内的数十种语言以及 80 多种编码语言。该模型在 MMLU 上的准确度达到了 84.0%,并在代码生成、推理和多语言支持方面进行了 significant 的改进。
Mistral AI发布了与NVIDIA合作开发的120亿参数模型Mistral NeMo,该模型拥有高达128k tokens的上下文窗口,其推理、世界知识和编码精度在其规模类别中处于最先进水平。Mistral NeMo基于标准架构,易于使用,可直接替代任何使用Mistral 7B的系统。该模型支持多语言应用,并使用更有效的Tekken分词器,在压缩源代码和多种语言文本方面效率更高。
Mistral AI 发布了名为 Codestral Mamba 的新型语言模型,该模型专门用于代码生成,使用 Apache 2.0 许可证开源。 Codestral Mamba 基于 Mamba2 架构,与传统的 Transformer 模型相比,它具有线性时间推理的优势,能够处理无限长度的序列,并提供更快的响应速度,特别适用于代码生成等对效率要求较高的场景。
Mistral AI发布了首个代码模型Codestral,该模型支持80多种编程语言,包括Python、Java、C等,并能够高效完成代码生成、测试编写等任务。Codestral在代码生成性能方面表现出色,并提供多种集成方式,包括HuggingFace下载、API调用、IDE插件等。