MiMo-7B: Modelo de Linguagem de 7B Parâmetros para Raciocínio Supera Modelos de 32B
2025-04-30
A Xiaomi apresenta o MiMo-7B, um modelo de linguagem de 7 bilhões de parâmetros projetado para raciocínio. Por meio de dados e estratégias de pré-treinamento otimizados, juntamente com técnicas inovadoras de aprendizado por reforço, o MiMo-7B demonstra desempenho excepcional em tarefas de raciocínio matemático e de código, superando até mesmo modelos de 32B parâmetros maiores. O modelo de código aberto inclui pontos de verificação para o modelo base, modelo SFT e modelos treinados por RL, oferecendo recursos valiosos para o desenvolvimento de LLMs de raciocínio poderosos.