HunyuanWorld-Voyager da Tencent: Geração de vídeo 3D consistente a partir de uma única imagem

2025-09-03
HunyuanWorld-Voyager da Tencent: Geração de vídeo 3D consistente a partir de uma única imagem

A equipe de IA da Tencent apresenta o HunyuanWorld-Voyager, um novo framework de difusão de vídeo que gera sequências de nuvem de pontos 3D consistentes em todo o mundo a partir de uma única imagem com caminhos de câmera definidos pelo usuário. O Voyager produz vídeos de cenas 3D consistentes para explorar mundos virtuais ao longo de trajetórias personalizadas, gerando também vídeo de profundidade e RGB alinhados para reconstrução 3D eficiente. Treinado em mais de 100.000 clipes de vídeo combinando capturas do mundo real e renderizações sintéticas do Unreal Engine, o Voyager alcança resultados de ponta no benchmark WorldScore. O código e os modelos pré-treinados estão disponíveis publicamente.