Webtagr - Resumen de noticias de tecnología

Llamadas al sistema: El costo oculto del rendimiento

2025-09-20

Este artículo profundiza en la sobrecarga de rendimiento de las llamadas al sistema de Linux, revelando que es mucho más que una simple llamada a función del kernel. Las llamadas al sistema interrumpen las optimizaciones de microarquitectura de la CPU, como la canalización de instrucciones y la predicción de saltos, lo que lleva a pérdidas de rendimiento que superan con creces lo que es aparente en el código fuente. El artículo analiza el código del kernel, explica el impacto en el rendimiento de varias mitigaciones de software y hardware, y ofrece estrategias de optimización, como el uso de vDSO, el almacenamiento en caché de valores, la optimización de E/S, las operaciones por lotes y el traslado de trabajo al kernel para reducir la frecuencia de las llamadas al sistema y mejorar el rendimiento del software.

(blog.codingconfessions.com)

Desarrollo

Escribiendo código amigable para la CPU: Una guía para la programación consciente del hardware

2025-03-23

Este artículo utiliza la analogia de un restaurante de autoservicio para explicar tres conceptos cruciales de la arquitectura de la CPU: canalización de instrucciones, almacenamiento en caché de memoria y ejecución especulativa. El autor argumenta que comprender estos mecanismos y escribir código que funcione con ellos (programación consciente del hardware) puede mejorar drásticamente el rendimiento del software. El artículo profundiza en técnicas de optimización del código, como el desdoblamiento de bucles para aprovechar la ejecución superscalar y la optimización del diseño de las estructuras de datos y los patrones de acceso para aprovechar al máximo el caché, para aumentar la eficiencia. En última instancia, el autor enfatiza que escribir código eficiente se reduce a escribir código limpio y mantenible primero, luego perfilar para identificar los cuellos de botella del rendimiento y, finalmente, aplicar los principios de la programación consciente del hardware para abordar esos cuellos de botella.

(blog.codingconfessions.com)

Desarrollo Programación consciente del hardware

El Milagro del Unix Spell: Funcionando con 64kB de RAM

2025-01-19

En la década de 1970, el corrector ortográfico de Unix se enfrentó a un desafío increíble: ajustar un diccionario de 250 kB en solo 64 kB de RAM en una computadora PDP-11. La ingeniosa solución de Douglas McIlroy implicó un enfoque de varias etapas. Inicialmente, un filtro de Bloom proporcionaba búsquedas rápidas, pero a medida que el diccionario crecía, desarrolló un nuevo esquema de compresión hash. Al reconocer que las diferencias entre los códigos hash ordenados seguían una distribución geométrica y empleando la codificación de Golomb, logró límites de compresión casi teóricos. Finalmente, la partición de los datos comprimidos mejoró aún más la velocidad de búsqueda. Esta historia es una clase magistral de optimización restringida, que muestra cómo algoritmos inteligentes pueden superar limitaciones aparentemente imposibles.

(blog.codingconfessions.com)

Desarrollo compresión

Internos de cambio de contexto de Linux: estado del proceso y memoria

2025-01-02

Este artículo profundiza en la representación de procesos y sus estados por parte del kernel de Linux, centrándose en las estructuras de datos clave: task_struct y mm_struct. task_struct gestiona el estado de ejecución, incluyendo el estado del proceso, el seguimiento del tiempo de la CPU y la información de programación. mm_struct maneja el estado de la memoria, abarcando tablas de páginas, límites de segmentos de memoria y detalles específicos de la arquitectura. El artículo explica detalladamente los campos dentro de estas estructuras y sus roles en el cambio de contexto, ofreciendo una comprensión profunda del funcionamiento interno del kernel de Linux.

(blog.codingconfessions.com)

Desarrollo Cambio de Contexto Gestión de Procesos

El Teorema de Imposibilidad del Clustering: Por qué no existen algoritmos perfectos

2024-12-26

Este artículo explora el problema del 'triángulo imposible' en los algoritmos de clustering. Haciendo un paralelo con el teorema CAP, el autor argumenta que todo algoritmo de clustering debe sacrificar una de las tres propiedades deseables: invariancia de escala, riqueza y consistencia. El artículo define cada propiedad e ilustra cómo algoritmos como k-means comprometen una para lograr las otras. La conclusión enfatiza que los desarrolladores deben elegir algoritmos en función de las necesidades específicas de su aplicación, aceptando que un algoritmo de clustering perfecto es matemáticamente imposible.

(blog.codingconfessions.com)

IA teorema de imposibilidad