HunyuanWorld-Voyager de Tencent: Generación de vídeo 3D consistente a partir de una sola imagen

2025-09-03
HunyuanWorld-Voyager de Tencent: Generación de vídeo 3D consistente a partir de una sola imagen

El equipo de IA de Tencent presenta HunyuanWorld-Voyager, un nuevo marco de difusión de vídeo que genera secuencias de nubes de puntos 3D consistentes en todo el mundo a partir de una sola imagen con trayectorias de cámara definidas por el usuario. Voyager produce vídeos de escenas 3D consistentes para explorar mundos virtuales a lo largo de trayectorias personalizadas, y también genera vídeo de profundidad y RGB alineados para una reconstrucción 3D eficiente. Entrenado con más de 100.000 clips de vídeo que combinan capturas del mundo real y renderizados sintéticos de Unreal Engine, Voyager logra resultados de vanguardia en el benchmark WorldScore. El código y los modelos preentrenados están disponibles públicamente.