Aprendiendo sobre GPUs mediante la medición del ancho de banda de memoria
El equipo de Traverse Research profundizó en la arquitectura de las GPU midiendo el ancho de banda de memoria en varias GPU utilizando microbenchmarks personalizados. El artículo explora las complejidades del acceso a la memoria de la GPU, incluidos los descriptores, los tipos de búfer (dirección de bytes, estructurado, tipado) y las unidades de textura. También abarca la jerarquía de memoria de la GPU, las políticas de caché (escritura directa, escritura en búfer, escritura de derivación) y las técnicas de ocultación de latencia. Los experimentos revelaron diferencias significativas en el ancho de banda de caché y VRAM entre arquitecturas: la Adreno 740 del Meta Quest 3 mostró una mejora dramática en el ancho de banda utilizando texturas; la AMD Radeon RX 9070 XT exhibió diferencias entre las cargas de punto flotante e entero; la Intel Arc B580 mostró patrones únicos con tipos de datos variados; y la NVIDIA GeForce RTX 5070 Ti experimentó cuellos de botella con muchas escrituras en la misma pequeña área de memoria. Estos hallazgos ofrecen información para optimizar el rendimiento del software de GPU, particularmente en proyectos específicos de hardware.