“微风”系列模型发布:开拓人工智能应用新 frontier

2024-10-16

Mistral AI 在 Mistral 7B 发布一周年之际,推出了两款新的用于设备端计算和边缘用例的最先进模型:Ministral 3B 和 Ministral 8B。这些模型在知识、常识、推理、函数调用和效率方面设立了新的标杆,可用于各种用途,从协调代理工作流程到创建专业任务执行器。Ministral 3B 和 8B 都支持高达 128k 的上下文长度,而 Ministral 8B 具有特殊的交错滑动窗口注意力模式,可实现更快、更节省内存的推理。

阅读更多
27
未分类

Mistral AI 发布全新大语言模型:Mistral Large 2

2024-07-24

Mistral AI 发布了新一代旗舰模型 Mistral Large 2,该模型在代码生成、数学和推理方面比其前身功能更强大,并提供更强大的多语言支持和高级函数调用功能。Mistral Large 2 拥有 128k 的上下文窗口,支持包括中文在内的数十种语言以及 80 多种编码语言。该模型在 MMLU 上的准确度达到了 84.0%,并在代码生成、推理和多语言支持方面进行了 significant 的改进。

阅读更多
46
未分类

Mistral NeMo:掌握前沿人工智能

2024-07-18

Mistral AI发布了与NVIDIA合作开发的120亿参数模型Mistral NeMo,该模型拥有高达128k tokens的上下文窗口,其推理、世界知识和编码精度在其规模类别中处于最先进水平。Mistral NeMo基于标准架构,易于使用,可直接替代任何使用Mistral 7B的系统。该模型支持多语言应用,并使用更有效的Tekken分词器,在压缩源代码和多种语言文本方面效率更高。

阅读更多
55
未分类 Mistral NeMo

Mistral AI 发布开源代码生成模型 Codestral Mamba

2024-07-16

Mistral AI 发布了名为 Codestral Mamba 的新型语言模型,该模型专门用于代码生成,使用 Apache 2.0 许可证开源。 Codestral Mamba 基于 Mamba2 架构,与传统的 Transformer 模型相比,它具有线性时间推理的优势,能够处理无限长度的序列,并提供更快的响应速度,特别适用于代码生成等对效率要求较高的场景。

阅读更多
45
未分类 Mamba2架构