小米MiMo-7B:70亿参数的推理模型,性能超越320亿参数模型

2025-04-30
小米MiMo-7B:70亿参数的推理模型,性能超越320亿参数模型

小米发布了名为MiMo-7B的70亿参数大型语言模型,专注于推理能力。通过优化的预训练数据和策略,以及创新的强化学习训练方法,MiMo-7B在数学和代码推理任务上表现出色,甚至超越了更大的320亿参数模型。该模型开源,包含基座模型、指令微调模型和强化学习模型等多个检查点,为构建强大的推理能力LLM提供了宝贵的资源。

AI