Webtagr - Resumen de noticias de tecnología

Tags populares：

Virtualización seguridad DNS verificación formal análisis de alcanzabilidad errores del compilador conflicto de macro extensión web framework de desarrollo Gráficos de mapa de bits inconsistencias de API Todos los tags

Alineando características polinomial con la distribución de datos: El problema de atención-alineación en ML

2025-08-26

Esta publicación explora la alineación de características polinomiales con la distribución de datos para mejorar el rendimiento del modelo de aprendizaje automático. Las bases ortogonales producen características informativas cuando los datos se distribuyen uniformemente, pero los datos del mundo real no lo están. Se presentan dos enfoques: un truco de mapeo, que transforma los datos en una distribución uniforme antes de aplicar una base ortogonal; y la multiplicación por una función cuidadosamente seleccionada para ajustar la función de peso de la base ortogonal para que se alinee con la distribución de datos. La primera es más práctica, alcanzable con el QuantileTransformer de Scikit-Learn. La segunda es más compleja, requiriendo un conocimiento matemático más profundo y ajustes finos. Los experimentos en el conjunto de datos de viviendas de California muestran que las características casi ortogonales del primer método superan el escalado mínimo-máximo tradicional en la regresión lineal.

Desmintiendo el Mito de los Polinomios de Alto Grado en la Regresión

2025-04-22

La creencia común de que los polinomios de alto grado son propensos al sobreajuste y difíciles de controlar en el aprendizaje automático se cuestiona en este artículo. El autor argumenta que el problema no son los polinomios de alto grado en sí, sino el uso de funciones base inadecuadas, como la base estándar. Experimentos que comparan las bases estándar, Chebyshev y Legendre con la base de Bernstein en el ajuste de datos ruidosos demuestran que la base de Bernstein, con sus coeficientes que comparten las mismas 'unidades' y que son fácilmente regularizables, evita eficazmente el sobreajuste. Incluso los polinomios de alto grado producen ajustes excelentes utilizando la base de Bernstein, requiriendo una mínima sintonización de hiperparámetros.