Gemini 2.5 객체 감지: YOLOv3와 놀라울 정도로 비슷한 성능?

2025-07-10

본 벤치마크는 Google의 멀티모달 대규모 언어 모델 Gemini 2.5 Pro의 객체 감지 작업 성능을 테스트합니다. MS-COCO 데이터셋을 사용하여 바운딩 박스 정확도에 중점을 둡니다. 결과는 Gemini 2.5 Pro가 평균 정밀도(mAP) 약 0.34를 달성하여 2018년 YOLOv3와 비슷하지만, 최첨단 모델의 약 0.60 mAP에는 크게 못 미침을 보여줍니다. 개방형 작업에서 Gemini의 다재다능함은 인상적이지만, CNN은 특히 좋은 학습 데이터가 있을 경우 속도, 비용, 이해도 측면에서 여전히 우수합니다.

AI