كشف الأجسام في Gemini 2.5: مقارنة مفاجئة مع YOLOv3؟

العلامات الشائعة：

الافتراضية أمان DNS التحقق الرسمي تحليل قابلية الوصول أخطاء المترجم تضارب الماكرو امتدادات الويب إطار عمل تطوير كومودور 64 بياسيك 2.0 جميع العلامات

2025-07-10

يقيس هذا المعيار أداء نموذج لغة Gemini 2.5 Pro متعدد الوسائط الكبير من جوجل في مهمة كشف الأجسام. باستخدام مجموعة بيانات MS-COCO، يركز الاختبار على دقة مربعات الإحاطة. تُظهر النتائج أن Gemini 2.5 Pro يحقق متوسط دقة (mAP) يبلغ حوالي 0.34، وهو ما يضاهي YOLOv3 لعام 2018، ولكنه أقل بكثير من نماذج الحالة الفنية التي تصل إلى ~0.60 mAP. على الرغم من تعدد استخدامات Gemini في المهام المفتوحة، إلا أن CNNs لا تزال أسرع وأرخص وأسهل في الفهم، خاصةً مع بيانات تدريب جيدة.

الذكاء الاصطناعي كشف الأجسام