Robustheitstest von medizinischen KI-Modellen: Datensätze MIMIC-III, eICU und SEER
Diese Studie bewertet die Genauigkeit von Machine-Learning-Modellen bei der Vorhersage schwerwiegender Krankheitsverläufe: 48-Stunden-Risiko für einen Krankenhausaufenthalt mit Todesfolge, 5-Jahres-Überlebensrate bei Brustkrebs und 5-Jahres-Überlebensrate bei Lungenkrebs. Es wurden drei Datensätze verwendet – MIMIC-III, eICU und SEER – mit Modellen wie LSTM, MLP und XGBoost. Um die Robustheit des Modells zu testen, wurden verschiedene Methoden zur Erzeugung von Testfällen entwickelt, darunter attributbasierte Variationen, Gradientenaufstieg und Ansätze basierend auf der Glasgow-Koma-Skala. Die Studie bewertete die Modellleistung bei diesen herausfordernden Fällen und zeigte unterschiedliche Leistungen über Datensätze und Methoden hinweg, was die Notwendigkeit weiterer Verbesserungen zur Steigerung der Zuverlässigkeit unterstreicht.