Cálculo de Fibonacci extremadamente rápido en la GPU con Thrust

2025-06-27
Cálculo de Fibonacci extremadamente rápido en la GPU con Thrust

Esta publicación de blog demuestra cómo realizar cálculos de secuencia de Fibonacci increíblemente rápidos utilizando programación de GPU y la biblioteca NVIDIA Thrust. Comienza explicando el algoritmo de exploración, luego muestra cómo usar operaciones de exploración en Thrust para suma y multiplicación simples, extendiéndolas a operaciones de matriz. Finalmente, ilustra el cálculo de números de Fibonacci de manera eficiente mediante operaciones de matriz y la operación de exploración, utilizando aritmética modular para evitar el desbordamiento de enteros. El autor calcula F99999999 (mod 9837) en solo 17 milisegundos en una GPU NVIDIA GeForce RTX 3060 Mobile.

Leer más

Transposición de Matriz Altamente Eficiente en Mojo: ¿Superando a CUDA?

2025-06-06
Transposición de Matriz Altamente Eficiente en Mojo: ¿Superando a CUDA?

Esta entrada de blog detalla cómo implementar un kernel de transposición de matriz altamente eficiente en la arquitectura Hopper usando Mojo. El autor explica las optimizaciones, comenzando con un enfoque ingenuo y culminando en un kernel que alcanza un ancho de banda de 2775,49 GB/s — competitivo con, y posiblemente superior a, implementaciones equivalentes de CUDA. Las optimizaciones incluyen el uso de descriptores TMA (Tensor Map Access), optimizaciones de memoria compartida, intercambio de datos y refinamiento de hilos. La entrada profundiza en los detalles de implementación y las ganancias de rendimiento de cada técnica, proporcionando ejemplos de código completos.

Leer más