zymtrace : Profilage GPU sans friction pour libérer tout le potentiel

zymtrace est un profileur GPU continu, léger et de qualité production qui trace de manière transparente les goulots d'étranglement des performances - blocages de noyaux, contention mémoire, retards d'ordonnancement - directement jusqu'à leur origine dans le code PyTorch, les noyaux CUDA, les fonctions natives ou les threads d'ordonnancement. Contrairement aux solutions existantes, zymtrace offre une visibilité système complète, corrélant les traces GPU avec les chemins de code CPU qui les ont déclenchés. Cela permet aux ingénieurs IA/ML d'optimiser les lancements de noyaux CUDA, de déterminer les tailles de lots optimales et de résoudre la faible utilisation du GPU, maximisant ainsi les performances du GPU et réduisant les coûts.
Lire plus