Alibaba Lança Qwen2.5-Max: Um Modelo de Linguagem MoE em Grande Escala

2025-01-28
Alibaba Lança Qwen2.5-Max: Um Modelo de Linguagem MoE em Grande Escala

A Alibaba lançou o Qwen2.5-Max, um modelo de linguagem Mixture-of-Experts (MoE) em larga escala, pré-treinado em mais de 20 trilhões de tokens e refinado com ajuste fino supervisionado e aprendizado por reforço a partir de feedback humano. Benchmarks como MMLU-Pro, LiveCodeBench, LiveBench e Arena-Hard mostram o Qwen2.5-Max superando modelos como o DeepSeek V3. O modelo está acessível via Qwen Chat e uma API da Alibaba Cloud. Este lançamento representa um avanço significativo na escalabilidade de modelos de linguagem grandes e prepara o caminho para melhorias futuras na inteligência do modelo.