SmolLM3 : Un petit raisonneur multilingue à long contexte

Tags populaires：

Virtualisation sécurité DNS vérification formelle analyse d'atteignabilité erreurs du compilateur conflit de macro extension web framework de développement Graphiques bitmap incohérences d'API Tous les tags

SmolLM3 : Un petit raisonneur multilingue à long contexte

2025-07-09

SmolLM3 est un modèle linguistique multilingue open source de 3 milliards de paramètres qui offre un équilibre remarquable entre efficacité et performances. Surpassant Llama-3.2-3B et Qwen2.5-3B sur plusieurs benchmarks, il rivalise même avec des modèles plus grands de 4 milliards de paramètres. Prenant en charge 6 langues et disposant d'une longueur de contexte allant jusqu'à 128 000 tokens, SmolLM3 possède une capacité unique de raisonnement bimodal (think/no_think). Au-delà du modèle lui-même, les chercheurs publient le plan d'ingénierie complet, incluant les détails d'architecture, les mélanges de données et la méthodologie d'entraînement, une ressource précieuse pour quiconque construit ou étudie des modèles à cette échelle.

(huggingface.co)

IA long contexte

Brut : Un framework web Ruby simple mais puissant

Le processus de réglementation de la FTC rejeté : irrégularités de procédure constatées