テンセントのHunyuanWorld-Voyager:単一画像からの世界整合性のある3Dビデオ生成

2025-09-03
テンセントのHunyuanWorld-Voyager:単一画像からの世界整合性のある3Dビデオ生成

テンセントのAIチームは、HunyuanWorld-Voyagerを発表しました。これは、ユーザー定義のカメラパスを持つ単一画像から世界整合性のある3D点群シーケンスを生成する、新しいビデオ拡散フレームワークです。Voyagerは、カスタムトラジェクトリに沿って仮想世界を探査するための3D整合性のあるシーンビデオを生成し、効率的な3D再構築のための調整済み深度とRGBビデオも生成します。現実世界のキャプチャとUnreal Engineの合成データの組み合わせを含む10万以上のビデオクリップでトレーニングされたVoyagerは、WorldScoreベンチマークで最先端の結果を達成しています。コードと事前トレーニング済みモデルは公開されています。