객체 중심 슬롯 어텐션을 이용한 새로운 시각 추론 접근법
2025-06-08

연구자들은 객체 중심 슬롯 어텐션과 관계적 병목 현상을 결합한 새로운 시각 추론 접근법을 제안합니다. 이 방법은 먼저 CNN을 사용하여 이미지 특징을 추출한 다음, 슬롯 어텐션을 사용하여 이미지를 여러 개체로 분할하고 개체 중심의 시각적 표현을 생성합니다. 관계적 병목 현상은 정보 흐름을 제한하여 복잡한 장면을 이해하기 위해 개체 간의 추상적인 관계를 추출합니다. 마지막으로, 시퀀스 투 시퀀스 및 대수적 기계 추론 프레임워크를 통해 시각 추론 문제를 대수적 문제로 변환하여 효율성과 정확성을 향상시킵니다. 이 방법은 레이븐스 프로그레시브 매트릭스와 같은 시각 추론 작업에서 뛰어난 성능을 보입니다.