Alineando características polinomial con la distribución de datos: El problema de atención-alineación en ML

2025-08-26
Alineando características polinomial con la distribución de datos: El problema de atención-alineación en ML

Esta publicación explora la alineación de características polinomiales con la distribución de datos para mejorar el rendimiento del modelo de aprendizaje automático. Las bases ortogonales producen características informativas cuando los datos se distribuyen uniformemente, pero los datos del mundo real no lo están. Se presentan dos enfoques: un truco de mapeo, que transforma los datos en una distribución uniforme antes de aplicar una base ortogonal; y la multiplicación por una función cuidadosamente seleccionada para ajustar la función de peso de la base ortogonal para que se alinee con la distribución de datos. La primera es más práctica, alcanzable con el QuantileTransformer de Scikit-Learn. La segunda es más compleja, requiriendo un conocimiento matemático más profundo y ajustes finos. Los experimentos en el conjunto de datos de viviendas de California muestran que las características casi ortogonales del primer método superan el escalado mínimo-máximo tradicional en la regresión lineal.

Leer más

Desmintiendo el Mito de los Polinomios de Alto Grado en la Regresión

2025-04-22
Desmintiendo el Mito de los Polinomios de Alto Grado en la Regresión

La creencia común de que los polinomios de alto grado son propensos al sobreajuste y difíciles de controlar en el aprendizaje automático se cuestiona en este artículo. El autor argumenta que el problema no son los polinomios de alto grado en sí, sino el uso de funciones base inadecuadas, como la base estándar. Experimentos que comparan las bases estándar, Chebyshev y Legendre con la base de Bernstein en el ajuste de datos ruidosos demuestran que la base de Bernstein, con sus coeficientes que comparten las mismas 'unidades' y que son fácilmente regularizables, evita eficazmente el sobreajuste. Incluso los polinomios de alto grado producen ajustes excelentes utilizando la base de Bernstein, requiriendo una mínima sintonización de hiperparámetros.

Leer más