KAN anotado: Uma imersão profunda em Redes Kolmogorov-Arnold
2025-05-22

Esta publicação fornece uma explicação abrangente da arquitetura e do processo de treinamento de Redes Kolmogorov-Arnold (KANs), uma alternativa às Perceptrons Multicamadas (MLPs). As KANs parametrizam funções de ativação reconectando a 'multiplicação' na multiplicação matriz-vetor de pesos de uma MLP em aplicação de função. O artigo detalha a funcionalidade da KAN, incluindo uma arquitetura KAN mínima, otimizações de B-spline, técnicas de regularização, com exemplos de código e resultados de visualização. Aplicações de KANs, como no conjunto de dados MNIST, e direções futuras de pesquisa, como melhorar a eficiência da KAN, também são exploradas.