MiMo-7B : Un modèle de langage de 7 milliards de paramètres pour le raisonnement surpasse les modèles de 32 milliards de paramètres

Tags populaires：

Virtualisation sécurité DNS vérification formelle analyse d'atteignabilité erreurs du compilateur conflit de macro extension web framework de développement Graphiques bitmap incohérences d'API Tous les tags

MiMo-7B : Un modèle de langage de 7 milliards de paramètres pour le raisonnement surpasse les modèles de 32 milliards de paramètres

2025-04-30

Xiaomi présente MiMo-7B, un modèle linguistique de 7 milliards de paramètres conçu pour le raisonnement. Grâce à des données et des stratégies de pré-entraînement optimisées, ainsi qu'à des techniques innovantes d'apprentissage par renforcement, MiMo-7B démontre des performances exceptionnelles sur les tâches de raisonnement mathématique et de codage, surpassant même les modèles de 32 milliards de paramètres plus importants. Le modèle open source inclut des points de contrôle pour le modèle de base, le modèle SFT et les modèles entraînés par RL, offrant des ressources précieuses pour le développement de LLM de raisonnement puissants.

(github.com)

IA capacités de raisonnement

La science de la gestion des espaces sauvages : équilibre entre préservation et accès

Échec de la mission de la fusée Alpha de Firefly Aerospace