Nuevo Enfoque de Razonamiento Visual Usando Atención de Ranura Centrada en Objetos

2025-06-08
Nuevo Enfoque de Razonamiento Visual Usando Atención de Ranura Centrada en Objetos

Los investigadores proponen un nuevo enfoque de razonamiento visual que combina la atención de ranura centrada en objetos y un cuello de botella relacional. El método primero usa una CNN para extraer características de la imagen. Luego, la atención de ranura segmenta la imagen en objetos, generando representaciones visuales centradas en objetos. El cuello de botella relacional restringe el flujo de información, extrayendo relaciones abstractas entre objetos para comprender escenas complejas. Finalmente, un marco de razonamiento de máquina algebraica y secuencia a secuencia transforma el razonamiento visual en un problema algebraico, mejorando la eficiencia y la precisión. El método sobresale en tareas de razonamiento visual como las Matrices Progresivas de Raven.