Bolt3D : Génération de scènes 3D en quelques secondes

2025-03-19
Bolt3D : Génération de scènes 3D en quelques secondes

Bolt3D, fruit d'une collaboration entre Google Research, VGG et Google DeepMind, génère des scènes 3D réalistes en seulement 6,25 secondes sur une seule GPU. Le modèle utilise un modèle de diffusion multi-vues pour générer l'apparence et la géométrie de la scène, puis régresse des images de projection à l'aide d'une tête gaussienne. Enfin, il combine des gaussiennes 3D provenant de plusieurs images de projection pour former la scène 3D complète. Prenant en charge une ou plusieurs images d'entrée, Bolt3D génère des régions de scène non observées sans mécanismes de reprojection ou de peinture, marquant un progrès significatif dans la vitesse de génération de scènes 3D.