SVDQuant: تسريع ثلاثي على معالجات رسومات Blackwell مع NVFP4
2025-02-22
طور باحثون من معهد ماساتشوستس للتكنولوجيا SVDQuant، وهو نموذج جديد للكمية 4 بت يستخدم فرعًا منخفض الرتبة لامتصاص القيم المتطرفة، مما يؤدي إلى مكاسب كبيرة في الأداء على بنية معالجات رسومات Blackwell من NVIDIA. باستخدام تنسيق NVFP4، يحقق SVDQuant جودة صورة أفضل من INT4 وهو أسرع بثلاث مرات من BF16، مع تقليل استخدام الذاكرة بمقدار 3.5 مرة. البحث مفتوح المصدر ويتضمن عرضًا توضيحيًا تفاعليًا.