zymtrace: Perfilado de GPU sin fricción para liberar todo el potencial
2025-05-04
zymtrace es un perfilador de GPU continuo, ligero y de nivel de producción que rastrea sin problemas los cuellos de botella de rendimiento: bloqueos de kernel, contención de memoria, retrasos de programación, directamente a su origen en el código PyTorch, kernels CUDA, funciones nativas o subprocesos del programador. A diferencia de las soluciones existentes, zymtrace proporciona visibilidad de todo el sistema, correlacionando los rastros de GPU con las rutas de código de la CPU que los activaron. Esto permite a los ingenieros de IA/ML optimizar los lanzamientos de kernel CUDA, determinar los tamaños de lote óptimos y abordar el bajo uso de la GPU, maximizando el rendimiento de la GPU y reduciendo los costos.
Desarrollo
perfilado de GPU