AMD RDNA 4アーキテクチャにおけるWMMAカーネルの最適化

2025-07-21
AMD RDNA 4アーキテクチャにおけるWMMAカーネルの最適化

第3世代マトリックスコアを搭載したAMD RDNA™ 4アーキテクチャGPUは、一般化行列乗算(GEMM)演算のパフォーマンスを大幅に向上させました。この記事では、RDNA 4 GPU上のHIPカーネルでWMMA(Wave Matrix Multiply Accumulate)組込み関数を使用して行列演算を最適化する方法について詳しく説明します。WMMAの機能、`__builtin_amdgcn_wmma_f32_16x16x16_f16_w32_gfx12`などの新しい組込み関数、およびRDNA 3アーキテクチャとの重要な違いについて説明します。簡素化された多層パーセプトロン(MLP)実装例は、RDNA 4での効率的な行列計算を示しています。

続きを読む
ハードウェア

三角形を超えて:四角形レンダリングの新手法

2025-04-11
三角形を超えて:四角形レンダリングの新手法

リアルタイムコンピュータグラフィックスは、GPUが三角形のみのハードウェアアクセラレーションされたラスタライズをネイティブにサポートしているため、長年三角形に依存してきました。しかし、これは、四角形を三角形に分割した場合、テクスチャ座標や法線などの頂点属性で共有エッジにC^1不連続が生じる原因となります。この記事では、重心座標で表現された双線形補間係数の代数解を用いて、凸四角形から生成された2つの三角形の共有エッジにわたってC^1連続性を維持する新しい手法を提案します。この手法は、ジオメトリシェーダー、テッセレーションシェーダー、メッシュシェーダーで実装されており、レンダリング品質を大幅に向上させ、計算オーバーヘッドは無視できるほど小さいです。

続きを読む
開発 四角形