Dynolog:开源系统可观测性工具

2024-07-11

Dynolog是一款面向异构CPU-GPU系统的轻量级监控守护程序,支持持续性能监控和深度分析模式。它与PyTorch Profiler和Kineto CUDA分析库集成,为AI训练应用提供全面支持。Dynolog利用硬件和Linux内核提供的接口,监控CPU、存储、网络、GPU等资源的使用情况,并提供详细的性能指标。此外,Dynolog还支持按需CPU-GPU分析,允许用户在无需修改代码的情况下随时触发CPU-GPU分析,方便开发者深入了解系统性能瓶颈并进行优化。

未分类