AMD CDNA 4 架构:在矩阵运算和向量运算之间取得平衡

2025-06-17
AMD CDNA 4 架构:在矩阵运算和向量运算之间取得平衡

AMD发布了最新的CDNA 4计算GPU架构,它在CDNA 3的基础上进行了适度升级,主要提升了低精度数据类型的矩阵乘法性能,这对于机器学习负载至关重要。同时,CDNA 4还保持了AMD在更广泛应用的向量运算方面的领先优势。通过采用与CDNA 3类似的多芯片设计,并提升时钟速度,CDNA 4在保持高吞吐量的同时,改进了本地数据共享(LDS)的容量和带宽,并引入了读取转置LDS指令,优化了矩阵乘法效率。虽然在低精度矩阵运算方面仍落后于Nvidia的Blackwell架构,但在向量运算和高精度数据类型方面,CDNA 4凭借更高的核心数和时钟速度保持了显著优势。

硬件