Arquitetura AMD CDNA 4: Equilibrando Operações de Matriz e Vetor

A AMD apresenta sua mais recente arquitetura de GPU orientada para computação, CDNA 4, uma atualização modesta em relação à CDNA 3. O foco é aumentar o desempenho da multiplicação de matrizes com tipos de dados de baixa precisão, cruciais para aprendizado de máquina. Simultaneamente, a CDNA 4 visa manter a liderança da AMD em operações vetoriais. Usando um design multi-chiplet semelhante ao da CDNA 3 e aumentando as velocidades de clock, a CDNA 4 melhora a capacidade e a largura de banda do Compartilhamento de Dados Local (LDS), introduzindo instruções LDS de leitura com transposição para otimizar a multiplicação de matrizes. Embora esteja atrás da arquitetura Blackwell da Nvidia em operações de matriz de baixa precisão, a CDNA 4 mantém uma vantagem significativa em operações vetoriais e tipos de dados de alta precisão devido ao seu maior número de núcleos e velocidades de clock.