GPUPrefixSums: Portable GPU-Präfixsummen-Bibliothek für Hochleistungsrechnen
2025-08-28
GPUPrefixSums überträgt modernste GPU-Präfixsummen-Techniken von CUDA auf portable Compute-Shader. Es führt 'Decoupled Fallback' ein, eine neuartige Technik, die Präfixsummenberechnungen auch auf Geräten ermöglicht, die keine Garantien für den Vorwärtsfortschritt von Threads bieten. Die D3D12-Implementierung umfasst eine umfassende Übersicht über Algorithmen, die mit der Nvidia CUB-Bibliothek verglichen wurden. Versionen sind für Unity und als einfache Testumgebung verfügbar. GPUPrefixSums zielt darauf ab, Effizienz und Portabilität zu verbessern und unterstützt parallele Berechnungsaufgaben wie Sortieren, Komprimieren und Graph-Traversal.