AMD CDNA 4 아키텍처: 행렬 연산과 벡터 연산의 균형

2025-06-17
AMD CDNA 4 아키텍처: 행렬 연산과 벡터 연산의 균형

AMD는 CDNA 3에 대한 소폭 업그레이드인 최신 컴퓨팅 중심 GPU 아키텍처인 CDNA 4를 공개했습니다. 이는 머신러닝 작업에 중요한 저정밀도 데이터 유형을 사용한 행렬 곱셈 성능 향상에 중점을 두고 있습니다. 동시에 CDNA 4는 벡터 연산에서 AMD의 선두 위치를 유지하는 것을 목표로 합니다. CDNA 3과 유사한 멀티칩렛 설계를 사용하고 클록 속도를 높임으로써 CDNA 4는 지역 데이터 공유(LDS)의 용량과 대역폭을 개선하고 행렬 곱셈을 최적화하기 위한 읽기 및 전치 LDS 명령어를 도입했습니다. 저정밀도 행렬 연산에서는 Nvidia의 Blackwell 아키텍처에 뒤처지지만, 더 많은 코어 수와 높은 클록 속도 덕분에 벡터 연산과 고정밀도 데이터 유형에서는 상당한 이점을 유지하고 있습니다.

하드웨어