Kaggle竞赛:一个有偏见的评价指标和XGBoost的意外之喜
2025-02-23
作者参加了一个Kaggle竞赛,预测骨髓移植后的生存几率。比赛的评价指标是分层计算的concordance,旨在避免模型对不同种族人群的预测差异过大。然而,这个指标存在缺陷:提高某一类别的分数并不总是提高总分,甚至可能降低总分。作者在使用XGBoost模型的过程中,发现简单的决策树集成模型比复杂的统计模型更有效,并探讨了统计方法和机器学习方法的差异。最终,作者发现调整AFT分布的尺度参数对模型精度影响巨大,并提出了几个改进模型的开放性问题。
开发
XGBoost