4Real-Video-V2: نموذج نشر فيديو رباعي الأبعاد فعال

2025-06-24

تعاونت شركتا Snap Inc. و KAUST على تطوير 4Real-Video-V2، وهو نموذج نشر فيديو رباعي الأبعاد يعتمد على بنية التغذية الأمامية. يحسب هذا النموذج بكفاءة شبكة مكانية-زمانية رباعية الأبعاد لأطر الفيديو وجسيمات جاوس ثلاثية الأبعاد لكل خطوة زمنية. يكمن المفتاح في نمط الانتباه المتناثر الذي يسمح للرموز بالانتباه إلى رموز أخرى في نفس الإطار، أو في نفس الطابع الزمني، أو من نفس وجهة النظر. يجعل هذا النموذج قابلاً للتطوير إلى نماذج فيديو ضخمة مدربة مسبقًا، وفعالًا في التدريب، ويوفر تعميمًا جيدًا، محققًا تحسينات كبيرة دون إضافة معلمات إلى نموذج الفيديو الأساسي.

اقرأ المزيد