Webtagr - Technology News Summarizer

Popular：

Virtualization DNS security formal verification reachability analysis compiler errors macro conflict web extension development framework Bitmap Graphics API inconsistencies All Tags

Qwen VLo: نموذج متعدد الوسائط موحد يفهم ويُنشئ الصور

2025-06-28

تُقدم أكاديمية علي بابا دامو Qwen VLo، وهو نموذج متعدد الوسائط جديد لا يفهم محتوى الصور فحسب، بل يُنشئ أيضًا صورًا عالية الجودة بناءً على هذا الفهم. باستخدام طريقة توليد تدريجية، يُنشئ الصور تدريجيًا من اليسار إلى اليمين ومن الأعلى إلى الأسفل، مما يضمن نتيجة نهائية متماسكة ومتناغمة. يدعم Qwen VLo التعليمات متعددة اللغات، ويتعامل مع المهام المعقدة مثل تحرير الصور ونقل الأنماط، ويمكنه حتى فهم محتوى الصور التي يُنشئها بنفسه. على الرغم من أنه لا يزال في مرحلة المعاينة، إلا أن قدراته متعددة الوسائط القوية تُظهر الإمكانات الهائلة للذكاء الاصطناعي في توليد الصور.