Architecture AMD CDNA 4 : Équilibre entre les opérations matricielles et vectorielles

2025-06-17
Architecture AMD CDNA 4 : Équilibre entre les opérations matricielles et vectorielles

AMD dévoile sa dernière architecture de GPU orientée calcul, CDNA 4, une mise à jour modeste par rapport à CDNA 3. L'accent est mis sur l'amélioration des performances de la multiplication matricielle avec des types de données de faible précision, essentiels pour les charges de travail d'apprentissage automatique. Simultanément, CDNA 4 vise à maintenir l'avantage d'AMD sur les opérations vectorielles. Utilisant une architecture multicpuce similaire à celle de CDNA 3 et en augmentant les fréquences d'horloge, CDNA 4 améliore la capacité et la bande passante du partage de données local (LDS), en introduisant des instructions LDS de lecture avec transposition pour optimiser la multiplication matricielle. Bien qu'elle soit en retard sur l'architecture Blackwell de Nvidia pour les opérations matricielles à faible précision, CDNA 4 conserve un avantage significatif sur les opérations vectorielles et les types de données de haute précision grâce à son nombre de cœurs plus élevé et à ses fréquences d'horloge plus élevées.

Matériel