SAMURAI:基于运动感知记忆的Segment Anything Model零样本视觉追踪自适应

2024-11-23

本文介绍了SAMURAI,一种针对视觉对象跟踪的SAM 2增强型自适应模型。SAM 2在对象分割任务中表现出色,但在视觉对象跟踪方面面临挑战,尤其是在处理快速移动或自遮挡对象的拥挤场景时。SAMURAI通过结合时间运动线索和提出的运动感知记忆选择机制,有效地预测对象运动并改进掩码选择,实现了无需重新训练或微调的鲁棒、准确的跟踪。SAMURAI实时运行,并在各种基准数据集上展现了强大的零样本性能。在评估中,SAMURAI在成功率和精度方面比现有跟踪器有了显著提高,在LaSOT$_{ ext{ext}}$上AUC增益7.1%,在GOT-10k上AO增益3.5%。此外,它在LaSOT上取得了与全监督方法相比具有竞争力的结果。

7
未分类 视觉追踪