医療AIモデルの堅牢性テスト:MIMIC-III、eICU、SEERデータセット
2025-03-29

本研究は、重篤な疾患の転帰予測における機械学習モデルの精度を評価しました。具体的には、48時間以内に入院中の死亡リスク、5年生存率(乳がん)、5年生存率(肺がん)の予測です。MIMIC-III、eICU、SEERの3つのデータセットを使用し、LSTM、MLP、XGBoostなどのモデルを適用しました。モデルの堅牢性をテストするために、属性ベースのバリエーション、勾配上昇、グラスゴー昏睡スケールに基づくアプローチなど、様々なテストケース生成方法が設計されました。これらの困難なケースにおけるモデルのパフォーマンスを評価した結果、データセットと方法によってパフォーマンスが異なることが明らかになり、信頼性を向上させるためのさらなる改善が必要であることが示唆されました。
AI
モデルの堅牢性