OmniHuman-1: إعادة التفكير في توسيع نطاق نماذج الرسوم المتحركة البشرية المشروطة من مرحلة واحدة

2025-02-04

OmniHuman-1 هو نموذج ذكاء اصطناعي قادر على إنشاء مقاطع فيديو بشرية واقعية. يدعم أنماطًا بصرية وصوتية متنوعة، وينتج مقاطع فيديو بأي نسبة أبعاد ونسب جسم (صورة، نصف جسم، جسم كامل). ينبع الواقعية من تفاصيل شاملة للحركة والإضاءة والقوام. يتعامل النموذج مع مدخلات متنوعة، بما في ذلك الغناء والكلام والوضعية المختلفة، حتى من الرسوم المتحركة أو وجهات النظر الصعبة. وهو يستخدم إشارات قيادة صوتية وفيديو للتحكم الدقيق. يتم معالجة الاعتبارات الأخلاقية، مع صور ومقاطع صوتية من المصادر العامة أو النماذج المُولّدة.