CUDA 并行计算加速合并排序算法
2025-03-12
本文作者基于之前的排序算法文章,使用 CUDA 对合并排序算法进行了并行计算优化。文章首先介绍了基本的递归自顶向下合并排序算法及其 CPU 实现,然后尝试了 CUDA 实现,但发现递归方式效率低下。作者随后改用迭代自底向上合并排序,并通过 CUDA 并行化合并操作,显著提升了效率。实验结果表明,对于较大的数组,CUDA 实现的迭代合并排序算法与 CPU 实现的标准排序算法性能相当,甚至略胜一筹。
开发
合并排序