QB64 搜索技巧 核手提箱 文字记录 海洋云增白 开源地图 Bliss AI 搜索答案 深海沉船 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 世界 PostgreSQL AI工具 证券 DirectX 防溢 DrawingPics Zulip 儿童读物 化学 连续滚动 代码审查 三菱电机 更多

SadTalker:用于风格化音频驱动单图像说话人脸动画的逼真3D运动系数学习 (sadtalker.github.io)

原文: SadTalker

SadTalker 是一种通过人脸图像和语音音频生成说话人头像视频的新方法。它通过从音频中学习逼真的3D运动系数(头部姿势、表情),并隐式地调节一个新的3D感知人脸渲染器来生成说话人头像。该方法使用ExpNet从音频中学习准确的面部表情,并通过条件VAE设计PoseVAE来合成不同风格的头部运动。生成的3D运动系数被映射到所提出的人脸渲染器的无监督3D关键点空间,并合成最终视频。