HunyuanWorld-Voyager de Tencent : Génération de vidéo 3D cohérente à partir d'une seule image

2025-09-03
HunyuanWorld-Voyager de Tencent : Génération de vidéo 3D cohérente à partir d'une seule image

L'équipe IA de Tencent présente HunyuanWorld-Voyager, un nouveau framework de diffusion vidéo qui génère des séquences de nuages de points 3D cohérents à partir d'une seule image avec des trajectoires de caméra définies par l'utilisateur. Voyager produit des vidéos de scènes 3D cohérentes pour explorer des mondes virtuels le long de trajectoires personnalisées, et génère également des vidéos de profondeur et RGB alignées pour une reconstruction 3D efficace. Entraîné sur plus de 100 000 clips vidéo combinant des captures du monde réel et des rendus synthétiques Unreal Engine, Voyager atteint des résultats de pointe sur le benchmark WorldScore. Le code et les modèles pré-entraînés sont disponibles publiquement.