医疗AI模型的鲁棒性测试:基于MIMIC-III、eICU和SEER数据集
2025-03-29
这项研究评估了机器学习模型在预测严重疾病(48小时院内死亡风险、5年乳腺癌生存率和5年肺癌生存率)方面的准确性。研究使用了MIMIC-III、eICU和SEER三个数据集,并采用了LSTM、MLP、XGBoost等多种模型。为了测试模型的鲁棒性,研究人员设计了多种测试用例生成方法,包括基于属性变化、梯度上升和Glasgow昏迷评分的策略,并评估了模型在这些具有挑战性的病例上的表现。结果表明,模型的性能在不同的数据集和测试方法下存在差异,需要进一步改进以提高其可靠性。
AI
模型鲁棒性