Webtagr - Resumen de noticias de tecnología

Tags populares：

Virtualización seguridad DNS verificación formal análisis de alcanzabilidad errores del compilador conflicto de macro extensión web framework de desarrollo Gráficos de mapa de bits inconsistencias de API Todos los tags

Cálculo de Fibonacci extremadamente rápido en la GPU con Thrust

2025-06-27

Esta publicación de blog demuestra cómo realizar cálculos de secuencia de Fibonacci increíblemente rápidos utilizando programación de GPU y la biblioteca NVIDIA Thrust. Comienza explicando el algoritmo de exploración, luego muestra cómo usar operaciones de exploración en Thrust para suma y multiplicación simples, extendiéndolas a operaciones de matriz. Finalmente, ilustra el cálculo de números de Fibonacci de manera eficiente mediante operaciones de matriz y la operación de exploración, utilizando aritmética modular para evitar el desbordamiento de enteros. El autor calcula F99999999 (mod 9837) en solo 17 milisegundos en una GPU NVIDIA GeForce RTX 3060 Mobile.

Transposición de Matriz Altamente Eficiente en Mojo: ¿Superando a CUDA?

2025-06-06

Esta entrada de blog detalla cómo implementar un kernel de transposición de matriz altamente eficiente en la arquitectura Hopper usando Mojo. El autor explica las optimizaciones, comenzando con un enfoque ingenuo y culminando en un kernel que alcanza un ancho de banda de 2775,49 GB/s — competitivo con, y posiblemente superior a, implementaciones equivalentes de CUDA. Las optimizaciones incluyen el uso de descriptores TMA (Tensor Map Access), optimizaciones de memoria compartida, intercambio de datos y refinamiento de hilos. La entrada profundiza en los detalles de implementación y las ganancias de rendimiento de cada técnica, proporcionando ejemplos de código completos.