搜索技巧 海洋云增白 开源地图 AI 搜索答案 沙丘魔堡2 压缩机站 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 PostgreSQL AI工具 证券 DirectX DrawingPics 化学 KDE 披萨农场 多动症 植物学 分析化学 Three.js 大会 残疾人学校 初创 QB64 更多

SadTalker:用于风格化音频驱动单图像说话人脸动画的逼真3D运动系数学习 (sadtalker.github.io)

SadTalker 是一种通过人脸图像和语音音频生成说话人头像视频的新方法。它通过从音频中学习逼真的3D运动系数(头部姿势、表情),并隐式地调节一个新的3D感知人脸渲染器来生成说话人头像。该方法使用ExpNet从音频中学习准确的面部表情,并通过条件VAE设计PoseVAE来合成不同风格的头部运动。生成的3D运动系数被映射到所提出的人脸渲染器的无监督3D关键点空间,并合成最终视频。