كشف الأجسام في Gemini 2.5: مقارنة مفاجئة مع YOLOv3؟

2025-07-10

يقيس هذا المعيار أداء نموذج لغة Gemini 2.5 Pro متعدد الوسائط الكبير من جوجل في مهمة كشف الأجسام. باستخدام مجموعة بيانات MS-COCO، يركز الاختبار على دقة مربعات الإحاطة. تُظهر النتائج أن Gemini 2.5 Pro يحقق متوسط دقة (mAP) يبلغ حوالي 0.34، وهو ما يضاهي YOLOv3 لعام 2018، ولكنه أقل بكثير من نماذج الحالة الفنية التي تصل إلى ~0.60 mAP. على الرغم من تعدد استخدامات Gemini في المهام المفتوحة، إلا أن CNNs لا تزال أسرع وأرخص وأسهل في الفهم، خاصةً مع بيانات تدريب جيدة.

اقرأ المزيد
الذكاء الاصطناعي كشف الأجسام

Spegel: متصفح طرفي يستخدم نماذج اللغات الكبيرة لإعادة كتابة صفحات الويب

2025-07-02
Spegel: متصفح طرفي يستخدم نماذج اللغات الكبيرة لإعادة كتابة صفحات الويب

Spegel هو متصفح ويب طرفي لإثبات المفهوم يستخدم نماذج اللغات الكبيرة لتحويل HTML إلى Markdown، وعرضه مباشرةً في محطتك. تم تطويره كمشروع نهاية أسبوع، وقد تم تحسين قابليته للاستخدام بشكل كبير مع إصدار Google Gemini 2.5 Pro Lite الأسرع. يسمح Spegel بإطلالات مخصصة من خلال مطالبات مخصصة، مثل استخراج المعلومات الأساسية فقط من وصفة طعام. على الرغم من أنه لا يدعم طلبات POST، إلا أنه يبسط التصفح من خلال التركيز على الاحتياجات التي يحددها المستخدم، مما يوفر تجربة أنظف وأقل ازدحامًا من متصفحات الأجهزة الطرفية التقليدية.

اقرأ المزيد