텐센트의 Hunyuan-T1: Mamba 기반 최초의 초대형 모델, 추론 효율성 재정의

2025-03-22

텐센트는 자사의 Hunyuan 대규모 언어 모델 시리즈에 최신 모델인 Hunyuan-T1을 발표했습니다. 세계 최초의 초대규모 하이브리드 Transformer-Mamba MoE 대규모 모델인 TurboS를 기반으로 구축된 Hunyuan-T1은 광범위한 사후 훈련을 통해 추론 능력이 크게 향상되었고, 사용자 선호도와의 일관성이 개선되었습니다. 미리보기 버전과 비교하여 Hunyuan-T1은 성능이 크게 향상되었으며, 디코딩 속도가 2배가 되었습니다. 다양한 공개 벤치마크에서 R1과 동등하거나 약간 더 나은 결과를 달성했으며, 내부 인간 평가 데이터 세트에서는 특히 문화적 및 창의적 지시 사항 준수, 텍스트 요약, 에이전트 기능 측면에서 R1을 능가했습니다. 이번 출시는 대규모 언어 모델의 사후 훈련 최적화에서 강화 학습 활용의 중요한 진전을 보여줍니다.

더 보기
AI