메모리 대역폭 측정을 통한 GPU 아키텍처 이해

2025-08-21
메모리 대역폭 측정을 통한 GPU 아키텍처 이해

Traverse Research팀은 사용자 정의 마이크로 벤치마크를 사용하여 다양한 GPU의 메모리 대역폭을 측정함으로써 GPU 아키텍처를 심층적으로 조사했습니다. 이 글에서는 GPU 메모리 접근의 복잡성, 디스크립터, 버퍼 유형(바이트 주소, 구조화, 형식화된 버퍼), 텍스처 유닛에 대해 설명합니다. 또한 GPU 메모리 계층, 캐시 정책(쓰기 스루, 쓰기 백, 쓰기 바이패스), 지연 숨김 기술도 다룹니다. 실험 결과, 아키텍처 간에 캐시 및 VRAM 대역폭에 상당한 차이가 있음을 보여주었습니다. 예를 들어 Meta Quest 3의 Adreno 740은 텍스처를 사용하여 대역폭이 극적으로 향상되었습니다. AMD Radeon RX 9070 XT는 부동 소수점 및 정수 로드에서 차이를 보였습니다. Intel Arc B580은 다양한 데이터 유형에서 고유한 패턴을 나타냈습니다. NVIDIA GeForce RTX 5070 Ti는 동일한 작은 메모리 영역에 대한 대량 쓰기에서 병목 현상이 발생했습니다. 이러한 결과는 특히 하드웨어별 프로젝트에서 GPU 소프트웨어 성능 최적화에 도움이 됩니다.