Un ray tracer CUDA surpasse Vulkan/RTX de 3x

2025-06-26
Un ray tracer CUDA surpasse Vulkan/RTX de 3x

Cet article détaille le parcours de l'auteur dans la création d'un ray tracer basé sur CUDA qui surpasse une implémentation Vulkan/RTX, parfois de plus de 3x, sur un matériel identique. En commençant par un port CUDA naïf, l'auteur a optimisé systématiquement le rendu, en s'attaquant à la récursivité, à la pression des registres, aux dispositions de la mémoire et aux inefficacités de branchement. Des techniques telles que les piles explicites, la structure des tableaux, la terminaison anticipée des rayons et la roulette russe ont été utilisées, ce qui a entraîné une réduction du temps d'image de 2,5 secondes à 9 millisecondes. L'article plonge profondément dans les goulots d'étranglement des performances de CUDA et propose des stratégies d'optimisation pratiques. Les benchmarks montrent les gains de performance significatifs obtenus sur un GPU RTX 3080.

Développement Optimisation GPU