مسابقة Kaggle: مقياس متحيز وقوة XGBoost غير المتوقعة

2025-02-23

شارك الكاتب في مسابقة Kaggle للتنبؤ بفرص البقاء على قيد الحياة بعد زراعة نخاع العظم. مقياس التقييم في المسابقة هو درجة التوافق الطبقي المصمم لتجنب التنبؤات المختلفة بشكل مفرط لمجموعات عرقية مختلفة. ومع ذلك، فإن هذا المقياس به عيوب: تحسين درجة مجموعة واحدة لا يحسن دائمًا الدرجة الإجمالية؛ بل قد يقللها. عند استخدام نموذج XGBoost، وجد الكاتب أن نماذج مجموعة أشجار القرار البسيطة كانت أكثر فعالية من النماذج الإحصائية المعقدة، واستكشف الاختلافات بين الأساليب الإحصائية وأساليب التعلم الآلي. وأخيرًا، اكتشف الكاتب أن ضبط معلمة مقياس توزيع AFT أثر بشكل كبير على دقة النموذج، وطرح بعض الأسئلة المفتوحة لتحسين النموذج.

التطوير