كشف الأجسام في Gemini 2.5: مقارنة مفاجئة مع YOLOv3؟

2025-07-10

يقيس هذا المعيار أداء نموذج لغة Gemini 2.5 Pro متعدد الوسائط الكبير من جوجل في مهمة كشف الأجسام. باستخدام مجموعة بيانات MS-COCO، يركز الاختبار على دقة مربعات الإحاطة. تُظهر النتائج أن Gemini 2.5 Pro يحقق متوسط دقة (mAP) يبلغ حوالي 0.34، وهو ما يضاهي YOLOv3 لعام 2018، ولكنه أقل بكثير من نماذج الحالة الفنية التي تصل إلى ~0.60 mAP. على الرغم من تعدد استخدامات Gemini في المهام المفتوحة، إلا أن CNNs لا تزال أسرع وأرخص وأسهل في الفهم، خاصةً مع بيانات تدريب جيدة.

الذكاء الاصطناعي كشف الأجسام