GPUPrefixSums: Biblioteca de Soma de Prefixos de GPU Portátil para Computação de Alto Desempenho
2025-08-28
GPUPrefixSums traz técnicas de soma de prefixos de GPU de última geração do CUDA para shaders de computação portáteis. Ele introduz 'Decoupled Fallback', uma nova técnica que permite cálculos de soma de prefixos mesmo em dispositivos que não possuem garantias de progresso de thread para frente. A implementação D3D12 inclui uma pesquisa abrangente de algoritmos, comparada com a biblioteca CUB da Nvidia. Versões estão disponíveis para Unity e como um banco de testes básico. O GPUPrefixSums visa melhorar a eficiência e a portabilidade, suportando tarefas de computação paralela como classificação, compressão e travessia de grafos.