معالج الأشعة CUDA يتفوق على Vulkan/RTX بمقدار 3 أضعاف
2025-06-26
تتناول هذه المقالة رحلة الكاتب في بناء معالج أشعة قائم على CUDA يتجاوز تنفيذ Vulkan/RTX - في بعض الأحيان بأكثر من 3 أضعاف - على جهاز مشابه. بدءًا من منفذ CUDA بسيط، قام الكاتب بتحسين المُحوّل بشكل منهجي، مُعالجة العودية، وضغط السجلات، وتخطيطات الذاكرة، وعدم كفاءة التفرّع. تم استخدام تقنيات مثل المكدسات الصريحة، وهيكل المصفوفات، وإنهاء الأشعة المُبكرة، وروليت الروسية، مما أدى إلى تقليل وقت الإطار من 2.5 ثانية إلى 9 ملي ثانية. تتعمق المقالة في مُعوّقات أداء CUDA وتوفر استراتيجيات تحسين عملية. تُظهر الاختبارات المعيارية مكاسب الأداء الكبيرة التي تم تحقيقها على وحدة معالجة الرسوميات RTX 3080.
التطوير