基于对象中心化槽注意机制的视觉推理新方法
2025-06-08
研究人员提出了一种新颖的视觉推理方法,它结合了对象中心化槽注意力机制和关系瓶颈方法。该方法首先使用卷积神经网络提取图像特征,然后利用槽注意力机制将图像分割成多个对象,并生成对象中心化的视觉特征表示。关系瓶颈方法则通过限制信息流,提取对象之间的抽象关系,从而实现对复杂视觉场景的理解。最后,通过序列到序列和代数机器推理框架,将视觉推理问题转化为代数问题,提高了推理效率和准确性。该方法在Raven's Progressive Matrices等视觉推理任务中表现出色。