Un an de débogage des blocages de suspension/réveil sur Linux avec des GPU AMD

2025-02-17

L'auteur a rencontré un problème persistant où son système Linux, équipé d'un GPU AMD RX 570, se bloquait ou plantait après avoir tenté de se mettre en veille, entraînant souvent un écran noir au réveil. Après plus d'un an de débogage intensif, impliquant l'analyse des journaux, des ajustements de configuration de systemd, un shell de débogage et même de l'ingénierie inverse avec Ghidra, la cause racine a été identifiée comme un bug du pilote amdgpu lié à la sauvegarde de la VRAM en cas d'utilisation intensive de la mémoire. La solution, enfin implémentée, utilise l'API de notification de gestion de l'alimentation pour sauvegarder préventivement la VRAM avant la suspension, évitant ainsi les erreurs d'épuisement de la mémoire. Ce correctif devrait être inclus dans la version stable du noyau Linux 6.14.

Développement pilote GPU