Kalibrierung: Kampf gegen Übervereinfachung und spärliche Daten
Dieser Artikel behandelt ein häufiges Problem bei der Modellkalibrierung: Die isotone Regression vereinfacht aufgrund der viel kleineren Kalibrierungsdatenmenge im Vergleich zum ursprünglichen Trainingsdatensatz die Wahrscheinlichkeitsverteilung übermäßig und verliert dabei die feinen Unterschiede des Modells. Der Artikel analysiert dieses Phänomen der „durch Datensparsamkeit induzierten Glättung“ und schlägt mehrere Diagnosemethoden vor, um zwischen einer berechtigten Vereinfachung aufgrund von Rauschen und einer Übervereinfachung aufgrund von Datenbeschränkungen zu unterscheiden. Schließlich wird das Calibre-Paket vorgestellt, das durch die Lockerung isotoner Einschränkungen oder die Verwendung glatter monotoner Modelle die Kalibrierungsgenauigkeit beibehält und gleichzeitig so viel wie möglich von der Diskriminierungsfähigkeit des ursprünglichen Modells bewahrt.