Hunyuan-T1 de Tencent : Redéfinition de l'efficacité du raisonnement avec le premier modèle ultralarge alimenté par Mamba
Tencent a dévoilé Hunyuan-T1, le dernier né de sa série de modèles linguistiques de grande taille Hunyuan. Construit sur TurboS, le premier modèle ultralarge hybride Transformer-Mamba MoE au monde, Hunyuan-T1 possède des capacités de raisonnement significativement améliorées et un meilleur alignement avec les préférences humaines après un entraînement postérieur intensif. Comparé à sa version préliminaire, Hunyuan-T1 affiche une amélioration substantielle des performances, doublant sa vitesse de décodage. Il obtient des résultats comparables ou légèrement supérieurs à R1 sur diverses références publiques, et surpasse R1 lors d'évaluations humaines internes, notamment en matière de suivi d'instructions culturelles et créatives, de résumé de texte et de capacités d'agent. Cette sortie marque une avancée significative dans l'exploitation de l'apprentissage par renforcement pour l'optimisation post-entraînement des modèles linguistiques de grande taille.