Nouvelle approche du raisonnement visuel utilisant l'attention centrée sur les objets

2025-06-08
Nouvelle approche du raisonnement visuel utilisant l'attention centrée sur les objets

Les chercheurs proposent une nouvelle approche du raisonnement visuel combinant l'attention centrée sur les objets et un goulot d'étranglement relationnel. La méthode utilise d'abord un CNN pour extraire les caractéristiques de l'image. Ensuite, l'attention centrée sur les objets segmente l'image en objets, générant des représentations visuelles centrées sur les objets. Le goulot d'étranglement relationnel restreint le flux d'informations, extrayant les relations abstraites entre les objets pour comprendre les scènes complexes. Enfin, un cadre de raisonnement de machine algébrique et de séquence à séquence transforme le raisonnement visuel en un problème algébrique, améliorant l'efficacité et la précision. La méthode excelle dans les tâches de raisonnement visuel comme les Matrices Progressives de Raven.