Merge Sort mit CUDA beschleunigen: Ein Parallel Computing Abenteuer

2025-03-12

Aufbauend auf einem vorherigen Beitrag über Sortieralgorithmen untersucht dieser Artikel Leistungsverbesserungen durch Parallel Computing mit CUDA. Der Autor implementiert Merge Sort, zunächst mit einem rekursiven Top-Down-Ansatz. Dieser erweist sich jedoch als ineffizient in CUDA. Die Umstellung auf einen iterativen Bottom-Up-Merge Sort und die Parallelisierung der Merge-Operationen führen zu signifikanten Leistungsgewinnen. Benchmarks zeigen, dass der iterative CUDA-Ansatz bei größeren Arrays wettbewerbsfähig ist und manchmal sogar die Standard-CPU-Sortierung übertrifft.

Entwicklung