AMD CDNA 4 Architektur: Ausgewogenes Verhältnis zwischen Matrix- und Vektoroperationen
AMD präsentiert seine neueste rechenorientierte GPU-Architektur, CDNA 4, ein moderates Update gegenüber CDNA 3. Der Fokus liegt auf der Steigerung der Leistung der Matrixmultiplikation mit Datentypen niedriger Genauigkeit, die für Machine-Learning-Workloads entscheidend sind. Gleichzeitig zielt CDNA 4 darauf ab, AMDs Vorsprung bei Vektoroperationen zu halten. Mit einer ähnlichen Multi-Chiplet-Architektur wie CDNA 3 und erhöhten Taktraten verbessert CDNA 4 die Kapazität und Bandbreite des lokalen Datenspeicher (LDS) und führt LDS-Read-with-Transpose-Anweisungen ein, um die Matrixmultiplikation zu optimieren. Obwohl CDNA 4 bei Matrixoperationen niedriger Genauigkeit hinter Nvidias Blackwell-Architektur zurückbleibt, behält es aufgrund seiner höheren Kernzahl und Taktraten einen signifikanten Vorteil bei Vektoroperationen und Datentypen höherer Genauigkeit.