OmniHuman-1:单阶段条件化人体动画模型的扩展性思考

2025-02-04

OmniHuman-1 是一种能够生成逼真人体视频的AI模型,支持多种视觉和音频风格,可以生成任意长宽比和体型的人体视频(肖像、半身、全身),其逼真度源于对动作、光照和纹理细节的全面考虑。该模型支持多种音乐风格和多种身体姿势和演唱形式,甚至能处理高音歌曲并根据音乐类型展现不同的动作风格。此外,OmniHuman-1 还支持卡通、人造物体、动物和具有挑战性的姿势等多种输入,并确保运动特性与每种风格的独特特征相匹配。该研究还关注了伦理问题,所用图片和音频均来自公共资源或由模型生成。