メモリ帯域幅測定によるGPUアーキテクチャの理解
2025-08-21

Traverse Researchチームは、カスタムマイクロベンチマークを使用して様々なGPUのメモリ帯域幅を測定することで、GPUアーキテクチャを深く掘り下げました。この記事では、GPUメモリアクセスの複雑さ、記述子、バッファの種類(バイトアドレス、構造化、型付きバッファ)、テクスチャユニットについて解説しています。GPUメモリ階層、キャッシュポリシー(ライトスルー、ライトバック、ライトアラウンド)、レイテンシ隠蔽技術についても取り上げています。実験の結果、アーキテクチャ間でキャッシュとVRAMの帯域幅に大きな違いがあることが分かりました。例えば、Meta Quest 3のAdreno 740は、テクスチャを使用することで帯域幅が劇的に向上しました。AMD Radeon RX 9070 XTは、浮動小数点と整数のロードで違いが見られました。Intel Arc B580は、様々なデータ型で独特のパターンを示しました。NVIDIA GeForce RTX 5070 Tiは、同じ小さなメモリ領域への大量の書き込みでボトルネックが発生しました。これらの知見は、特にハードウェア固有のプロジェクトにおいて、GPUソフトウェアのパフォーマンス最適化に役立ちます。
テクノロジー
メモリ帯域幅