Nova Abordagem de Raciocínio Visual Usando Atenção de Slot Centrada em Objetos

2025-06-08
Nova Abordagem de Raciocínio Visual Usando Atenção de Slot Centrada em Objetos

Pesquisadores propõem uma nova abordagem de raciocínio visual combinando atenção de slot centrada em objetos e um gargalo relacional. O método primeiro usa uma CNN para extrair recursos de imagem. Então, a atenção de slot segmenta a imagem em objetos, gerando representações visuais centradas em objetos. O gargalo relacional restringe o fluxo de informações, extraindo relações abstratas entre objetos para entender cenas complexas. Finalmente, uma estrutura de raciocínio de máquina algébrica e sequência a sequência transforma o raciocínio visual em um problema algébrico, melhorando a eficiência e a precisão. O método se destaca em tarefas de raciocínio visual como Matrizes Progressivas de Raven.