VGGT : Reconstruction de scène 3D en quelques secondes

Tags populaires：

Virtualisation sécurité DNS vérification formelle analyse d'atteignabilité erreurs du compilateur conflit de macro extension web framework de développement Graphiques bitmap incohérences d'API Tous les tags

VGGT : Reconstruction de scène 3D en quelques secondes

2025-03-25

Facebook Research présente VGGT (Visual Geometry Grounded Transformer), un réseau neuronal feed-forward capable d'inférer tous les attributs 3D clés d'une scène — paramètres intrinsèques et extrinsèques de la caméra, cartes de points, cartes de profondeur et suivi de points 3D — à partir d'une, quelques ou centaines de vues en quelques secondes. Ce modèle convivial, tirant parti de la puissance des transformateurs, offre un outil de visualisation 3D interactif. Étonnamment, VGGT montre des capacités impressionnantes de reconstruction à partir d'une seule vue, obtenant des résultats compétitifs par rapport aux méthodes monoculaires de pointe, bien qu'il n'ait jamais été explicitement entraîné pour cette tâche.

(github.com)

Polypane : Concevez, déboguez et testez des sites web en un seul endroit

Le faux confort de l'optimisme IA : Une critique de Casey Newton et Kevin Roose