Kaggleコンペティション:偏った指標とXGBoostの意外な効果
2025-02-23
筆者は、骨髄移植後の生存率を予測するKaggleコンペティションに参加しました。コンペティションの評価指標は、異なる人種グループ間の予測に過度な差異が生じないように設計された層化されたコンコード指数です。しかし、この指標には欠陥があります。あるグループのスコアを向上させても、全体スコアが必ずしも向上するとは限らず、低下することもあります。XGBoostモデルを使用する中で、筆者は、複雑な統計モデルよりも単純な決定木アンサンブルモデルの方が効果的であることを見出し、統計的手法と機械学習手法の違いを探りました。最終的に、筆者は、AFT分布の尺度パラメータを調整することでモデルの精度に大きな影響を与えることを発見し、モデル改善のためのいくつかの未解決の課題を提示しました。
開発