KAN annoté : Plongeon en profondeur dans les réseaux Kolmogorov-Arnold

2025-05-22
KAN annoté : Plongeon en profondeur dans les réseaux Kolmogorov-Arnold

Cet article fournit une explication complète de l’architecture et du processus d’entraînement des réseaux Kolmogorov-Arnold (KAN), une alternative aux perceptrons multicouches (MLP). Les KAN paramètrent les fonctions d’activation en rebranchant la « multiplication » dans la multiplication matrice-vecteur des poids d’un MLP en application de fonction. L’article détaille le fonctionnement des KAN, notamment une architecture KAN minimale, les optimisations de B-spline, les techniques de régularisation, avec des exemples de code et des résultats de visualisation. Les applications des KAN, comme sur l’ensemble de données MNIST, et les axes de recherche futurs, comme l’amélioration de l’efficacité des KAN, sont également explorés.