Una Teoría Matemática para Layouts de GPU: Aplicando la Teoría de Categorías y los Operads

Este artículo presenta CuTe, un enfoque novedoso para los layouts de memoria de GPU, y profundiza en la teoría matemática subyacente. Los layouts CuTe aprovechan la teoría de categorías y los operads, empleando el cálculo diagramático y las representaciones estándar para resolver el problema de mapear datos multidimensionales a la memoria unidimensional de la GPU. Esto proporciona una base teórica para optimizar los patrones de acceso a la memoria y utilizar instrucciones de hardware especializadas, como los núcleos de tensor. El artículo se centra en el concepto de layouts tratables, funciones de layout y operaciones de layout, como la fusión, el complemento y la composición, demostrando cómo un marco categórico calcula eficientemente la composición de layouts.