跨平台GPU前缀和计算库GPUPrefixSums:高效并行计算的利器
2025-08-28
GPUPrefixSums是一个旨在将最先进的GPU前缀和技术从CUDA移植到可移植计算着色器的库。它引入了“解耦回退”技术,即使在缺乏前向线程进度保证的设备上也能执行扫描而不会崩溃。该库在D3D12中实现,涵盖了从warp到设备级别的多种算法,并与Nvidia的CUB库进行了基准测试。GPUPrefixSums还提供Unity版本和一个简单的测试版本。该项目旨在提升GPU前缀和计算的效率和可移植性,为并行计算提供强力支持,其应用涵盖排序、压缩和图遍历等领域。
开发
前缀和