Qwen2.5-VL-32B: 인간의 선호도에 더욱 부합하는 320억 매개변수 시각 언어 모델

2025-03-24
Qwen2.5-VL-32B: 인간의 선호도에 더욱 부합하는 320억 매개변수 시각 언어 모델

Qwen2.5-VL 시리즈 모델의 호평에 힘입어, 새로운 320억 매개변수 시각 언어 모델인 Qwen2.5-VL-32B-Instruct를 오픈소스로 공개했습니다. 이 모델은 수학적 추론, 세밀한 이미지 이해, 인간의 선호도 충족 측면에서 상당한 향상을 보여줍니다. 벤치마크 테스트 결과, MMMU, MMMU-Pro, MathVista와 같은 다중 모드 작업에서 동일 규모의 모델을 능가하며, 720억 매개변수의 Qwen2-VL-72B-Instruct보다도 성능이 뛰어납니다. 또한 동일 규모의 모델 중 텍스트 이해 능력에서 최고 수준의 성능을 달성했습니다.

AI