Optimizando la multiplicación de matrices de bytes con AVX-VNNI

Tags populares：

Virtualización seguridad DNS verificación formal análisis de alcanzabilidad errores del compilador conflicto de macro extensión web framework de desarrollo Gráficos de mapa de bits inconsistencias de API Todos los tags

Optimizando la multiplicación de matrices de bytes con AVX-VNNI

2025-01-10

Este artículo explora la optimización de la multiplicación de matrices de bytes utilizando el conjunto de instrucciones AVX-VNNI. El autor comienza con una implementación ingenua, luego utiliza las bibliotecas gemmology y xsimd para crear versiones optimizadas empleando transposición y un diseño personalizado. Los resultados de referencia muestran que el diseño personalizado logra el mejor rendimiento, aprovechando la instrucción vpdpbusd para obtener ganancias significativas de eficiencia. El artículo profundiza en los detalles de implementación de la función maddw de la biblioteca gemmology y sus variaciones arquitectónicas.

(github.com)

Desarrollo Multiplicación de Matrices

El éxito insano de SpaceX: El algoritmo Haywood en acción

Construyendo una plataforma sin código con Clojure: Equilibrando la vida y los objetivos ambiciosos