Nscale 基准测试:通过 GEMM 调优,AMD MI300x GPU 将吞吐量和延迟提高了 7.2 倍
2024-06-29
文章介绍了 Nscale 公司利用 GEMM 调优技术对 AMD MI300x GPU 进行基准测试,结果显示该技术可以显著提高 AI 模型的吞吐量和延迟。通过 rocBLAS 和 hipBLASlt 库对 LLaMA、Mistral、Mixtral 和 Falcon 等大型语言模型进行优化,吞吐量提升高达 7.2 倍,延迟显著降低。测试结果表明,GEMM 调优对于最大化 AMD GPU 上 AI 模型的性能至关重要,能够有效提升 AI 工作负载的处理效率和性能。
阅读更多
38
未分类