Qwen2.5-VL-32B: نموذج لغوي بصريّ بـ 32 مليار معلمة، أكثر مواءمةً مع تفضيلات البشر

2025-03-24
Qwen2.5-VL-32B: نموذج لغوي بصريّ بـ 32 مليار معلمة، أكثر مواءمةً مع تفضيلات البشر

بعد النجاح الكبير لسلسلة نماذج Qwen2.5-VL، أطلقنا نموذجًا لغويًا بصريًا جديدًا مفتوح المصدر، يضم 32 مليار معلمة، وهو Qwen2.5-VL-32B-Instruct. يتميز هذا النموذج بتحسينات كبيرة في الاستدلال الرياضي، وفهم الصور بدقة عالية، والمواءمة مع تفضيلات البشر. تُظهر اختبارات المقارنة تفوقه على النماذج المماثلة في المهام متعددة الوسائط (مثل MMMU وMMMU-Pro وMathVista)، متجاوزًا حتى نموذج Qwen2-VL-72B-Instruct الأكبر الذي يضم 72 مليار معلمة. كما يحقق أداءً متميزًا في قدرات النصوص البحتة على نفس النطاق.

الذكاء الاصطناعي نموذج لغوي بصري