AMD GPU가 장착된 Linux에서의 절전 모드 작동 중단 문제 1년간 디버깅 기록
2025-02-17
저자는 AMD RX 570 GPU가 장착된 Linux 시스템에서 절전 모드에서 복귀할 때 시스템이 충돌하거나 멈추는 문제를 오랫동안 겪었습니다. 복귀 후 대부분의 경우 검은 화면이 표시되었습니다. 1년 이상의 집중적인 디버깅 끝에 journalctl 로그 분석, systemd 설정 조정, 디버그 셸, 심지어 Ghidra를 이용한 리버스 엔지니어링까지 수행하여 문제의 원인이 높은 메모리 사용량 상황에서 amdgpu 드라이버의 버그, 구체적으로 VRAM 백업 처리에 있다는 것을 밝혀냈습니다. 최종적으로 구현된 해결책은 전원 관리 알림 API를 사용하여 절전 모드로 들어가기 전에 VRAM을 예방적으로 백업하여 메모리 부족 오류를 방지하는 것입니다. 이 수정 사항은 안정적인 Linux 커널 6.14 버전에서 제공될 예정입니다.
개발
GPU 드라이버