秒速3D场景重建:VGGT模型惊艳亮相
2025-03-25
Facebook Research 推出的 VGGT (Visual Geometry Grounded Transformer) 模型,能在几秒钟内从单张或多张图像中直接推断出场景的所有关键3D属性,包括相机参数、点云、深度图和3D点轨迹。该模型基于Transformer架构,易于使用,并提供交互式3D可视化工具。即使只有一张图片,VGGT也能展现出令人惊叹的单视图重建能力,性能与最先进的单目方法相比毫不逊色。
AI