Comprendre l'architecture des GPU grâce à la mesure de la bande passante mémoire
L'équipe de Traverse Research a approfondi l'architecture des GPU en mesurant la bande passante mémoire de diverses GPU à l'aide de micro-bancs d'essai personnalisés. L'article explore les complexités de l'accès à la mémoire GPU, notamment les descripteurs, les types de tampons (adresse byte, structuré, typé) et les unités de texture. Il couvre également la hiérarchie de mémoire GPU, les politiques de cache (écriture directe, écriture différée, écriture contournée) et les techniques de masquage de latence. Les expériences ont révélé des différences significatives de bande passante de cache et de VRAM entre les architectures : l'Adreno 740 du Meta Quest 3 a montré une amélioration spectaculaire de la bande passante en utilisant des textures ; l'AMD Radeon RX 9070 XT a montré des différences entre les chargements en virgule flottante et en entier ; l'Intel Arc B580 a montré des schémas uniques avec différents types de données ; et la NVIDIA GeForce RTX 5070 Ti a subi des goulots d'étranglement avec de nombreuses écritures dans la même petite zone de mémoire. Ces conclusions fournissent des informations pour optimiser les performances des logiciels GPU, en particulier dans les projets spécifiques au matériel.