Calcul de Fibonacci extrêmement rapide sur GPU avec Thrust

2025-06-27
Calcul de Fibonacci extrêmement rapide sur GPU avec Thrust

Cet article de blog montre comment effectuer des calculs de suite de Fibonacci incroyablement rapides en utilisant la programmation GPU et la bibliothèque NVIDIA Thrust. Il commence par expliquer l'algorithme de balayage, puis montre comment utiliser les opérations de balayage dans Thrust pour l'addition et la multiplication simples, en étendant cela aux opérations matricielles. Enfin, il illustre le calcul de nombres de Fibonacci de manière efficace grâce aux opérations matricielles et à l'opération de balayage, en utilisant l'arithmétique modulaire pour éviter le dépassement d'entier. L'auteur calcule F99999999 (mod 9837) en seulement 17 millisecondes sur une GPU NVIDIA GeForce RTX 3060 Mobile.

Lire plus

Transposition de matrice hautement efficace dans Mojo : surpasser CUDA ?

2025-06-06
Transposition de matrice hautement efficace dans Mojo : surpasser CUDA ?

Cet article de blog détaille comment implémenter un noyau de transposition de matrice hautement efficace sur l'architecture Hopper à l'aide de Mojo. L'auteur explique les optimisations, en commençant par une approche naïve et en culminant avec un noyau atteignant une bande passante de 2775,49 Go/s — compétitif avec, et potentiellement supérieur à, les implémentations CUDA équivalentes. Les optimisations incluent l'utilisation de descripteurs TMA (Tensor Map Access), les optimisations de mémoire partagée, le swizzling des données et l'épaississement des threads. L'article approfondit les détails d'implémentation et les gains de performance de chaque technique, en fournissant des exemples de code complets.

Lire plus
Développement Transposition de matrice