Prueba de Robustez de Modelos de IA Médica: Conjuntos de Datos MIMIC-III, eICU y SEER
Este estudio evalúa la precisión de los modelos de aprendizaje automático en la predicción de resultados de enfermedades graves: riesgo de mortalidad hospitalaria en 48 horas, supervivencia al cáncer de mama a 5 años y supervivencia al cáncer de pulmón a 5 años. Se utilizaron tres conjuntos de datos: MIMIC-III, eICU y SEER, empleando modelos como LSTM, MLP y XGBoost. Para probar la robustez del modelo, se diseñaron varios métodos de generación de casos de prueba, incluidas variaciones basadas en atributos, ascenso de gradiente y enfoques basados en la Escala de Coma de Glasgow. El estudio evaluó el rendimiento del modelo en estos casos desafiantes, revelando un rendimiento variable entre los conjuntos de datos y los métodos, lo que destaca la necesidad de mejoras adicionales para aumentar la fiabilidad.