Gemini 2.5目标检测能力测试:与YOLOv3不相上下?

2025-07-10

本文对谷歌Gemini 2.5 Pro的多模态大语言模型在目标检测任务上的性能进行了基准测试。实验使用MS-COCO数据集,重点评估其边界框的准确性。结果显示,Gemini 2.5 Pro的平均精度(mAP)约为0.34,与2018年的YOLOv3相当,但远低于最先进模型的0.60 mAP。虽然Gemini在处理开放式任务上的多功能性令人印象深刻,但CNN在速度、成本和可解释性方面仍具有优势。

AI mAP