腾讯HunYuan-T1:首个Mamba赋能的超大型模型,推理效率再定义

2025-03-22

腾讯发布了其HunYuan大模型系列的深度思考模型——HunYuan-T1。该模型基于全球首个超大规模混合Transformer-Mamba MoE大型模型TurboS,通过大规模后期训练,显著提升了推理能力,并更贴合人类偏好。与之前的预览版相比,HunYuan-T1在整体性能上有了显著提升,在推理速度上提升了两倍。其在多个公开基准测试中取得了与R1相当或略优的结果,并在内部人类评估数据集中展现出优势,尤其在文化创意指令遵循、文本摘要和代理能力方面。HunYuan-T1的成功,标志着强化学习在大型语言模型后训练阶段的应用取得了重大突破。

AI