腾讯混元世界Voyager:基于单图生成一致性3D视频

2025-09-03
腾讯混元世界Voyager:基于单图生成一致性3D视频

腾讯AI团队发布了HunyuanWorld-Voyager,一个能够根据单张图像和用户自定义的摄像机路径生成世界一致性3D点云序列的新型视频扩散框架。Voyager可以生成用于世界探索的3D一致性场景视频,并能生成对齐的深度和RGB视频,用于高效直接的3D重建。该模型训练使用了超过10万个视频剪辑的数据集,结合了真实世界捕捉和虚幻引擎的合成渲染。Voyager在WorldScore基准测试中取得了领先的性能,并提供了易于使用的代码和预训练模型。