zymtrace: 解锁GPU潜能的无摩擦GPU性能分析器

2025-05-04
zymtrace: 解锁GPU潜能的无摩擦GPU性能分析器

zymtrace是一款轻量级、生产级的持续GPU性能分析器,它能够无缝追踪GPU性能瓶颈,例如内核停滞、内存竞争或调度延迟,并将这些问题直接追溯到引发它们的PyTorch代码、CUDA内核、原生函数或调度线程。与其他解决方案不同,zymtrace能够提供全面的系统可见性,关联GPU追踪和触发它们的CPU代码路径,帮助AI/ML工程师优化CUDA内核启动、确定最佳批量大小以及解决GPU利用率低下的问题,从而最大限度地提高GPU性能并降低成本。

开发