Eine mathematische Theorie von GPU-Layouts: Anwendung der Kategorientheorie und Operaden

Dieser Artikel stellt CuTe vor, einen neuartigen Ansatz für GPU-Speicherlayouts, und untersucht die zugrunde liegende mathematische Theorie. CuTe-Layouts nutzen die Kategorientheorie und Operaden, wobei diagrammatische Berechnungen und Standarddarstellungen verwendet werden, um das Problem der Abbildung mehrdimensionaler Daten auf den eindimensionalen GPU-Speicher zu lösen. Dies liefert eine theoretische Grundlage für die Optimierung von Speicherzugriffsmustern und die Nutzung spezialisierter Hardwareanweisungen wie Tensor-Cores. Der Artikel konzentriert sich auf das Konzept von handhabbaren Layouts, Layoutfunktionen und Layoutoperationen wie Zusammenführen, Komplement und Komposition und zeigt, wie ein kategorientheoretischer Rahmen die Komposition von Layouts effizient berechnet.