جوكو: نماذج أساسية لتوليد الفيديو القائمة على التدفق
2025-02-15
يقدم فريق تعاوني من بايت دانس وجامعة هونغ كونغ جوكو، وهي عائلة من نماذج توليد الصور والفيديوهات القائمة على محولات التدفق المصححة. حقق جوكو أداءً رائداً في توليد الصور المرئية من خلال عملية انتقاء دقيقة للبيانات، وتصميم متطور للنماذج، وصياغة التدفق. يدعم جوكو توليد النص إلى فيديو، والصورة إلى فيديو، والنص إلى صورة، وحقق درجات عالية في المعايير الرئيسية مثل GenEval و DPG-Bench و VBench. بشكل ملحوظ، حقق جوكو-T2V درجة 84.85 على VBench، محتلاً المركز الثاني في 7 أكتوبر 2024، متجاوزًا العديد من نماذج النص إلى فيديو التجارية الرائدة.
الذكاء الاصطناعي
محول تدفق مصحح