Reproduire la double descente profonde : le parcours d'un débutant

2025-06-05
Reproduire la double descente profonde : le parcours d'un débutant

Un débutant en apprentissage automatique au Recurse Center s'est lancé dans la reproduction du phénomène de double descente profonde. Partant de zéro, il a entraîné un modèle ResNet18 sur l'ensemble de données CIFAR-10, explorant l'impact de différentes tailles de modèles et du bruit d'étiquette sur les performances du modèle. Le processus a nécessité de surmonter des défis tels que les ajustements de l'architecture du modèle, l'application correcte du bruit d'étiquette et la compréhension des métriques de précision. Finalement, il a reproduit avec succès le phénomène de double descente profonde, observant l'influence de la taille du modèle et du nombre d'époques d'entraînement sur la capacité de généralisation, et le rôle significatif du bruit d'étiquette dans l'effet de double descente.

Lire plus