GPU-Architektur verstehen durch Messung der Speicherbandbreite
Das Team von Traverse Research hat die GPU-Architektur eingehend untersucht, indem es die Speicherbandbreite verschiedener GPUs mit benutzerdefinierten Mikrobenchmarks gemessen hat. Der Artikel untersucht die Komplexität des GPU-Speicherzugriffs, einschließlich Deskriptoren, Puffersorten (Byte-Adress-, strukturierte, typisierte Puffer) und Textur-Einheiten. Er behandelt auch die GPU-Speicherhierarchie, Cache-Strategien (Write-Through, Write-Back, Write-Around) und Latenz-Verstecktechniken. Experimente zeigten signifikante Unterschiede in der Cache- und VRAM-Bandbreite zwischen den Architekturen: Die Adreno 740 des Meta Quest 3 zeigte eine dramatische Bandbreitenverbesserung bei Verwendung von Texturen; die AMD Radeon RX 9070 XT zeigte Unterschiede zwischen Gleitkomma- und Ganzzahl-Ladevorgängen; die Intel Arc B580 zeigte einzigartige Muster bei verschiedenen Datentypen; und die NVIDIA GeForce RTX 5070 Ti erlebte Engpässe bei vielen Schreibvorgängen in denselben kleinen Speicherbereich. Diese Ergebnisse liefern Einblicke in die Optimierung der GPU-Softwareleistung, insbesondere bei hardwarespezifischen Projekten.