Ray Tracer CUDA supera Vulkan/RTX em 3x

2025-06-26
Ray Tracer CUDA supera Vulkan/RTX em 3x

Este artigo descreve a jornada do autor na construção de um ray tracer baseado em CUDA que supera uma implementação Vulkan/RTX — às vezes em mais de 3x — em hardware idêntico. Começando com uma porta CUDA ingênua, o autor otimizou sistematicamente o renderizador, abordando recursão, pressão de registradores, layouts de memória e ineficiências de ramificação. Técnicas como pilhas explícitas, estrutura de matrizes, término antecipado de raios e roleta russa foram empregadas, resultando em uma redução do tempo de quadro de 2,5 segundos para 9 milissegundos. O artigo mergulha profundamente nos gargalos de desempenho da CUDA e oferece estratégias práticas de otimização. Benchmarks mostram os ganhos significativos de desempenho alcançados em uma GPU RTX 3080.

Desenvolvimento