حساب أعداد فيبوناتشي بسرعة فائقة على وحدة معالجة الرسوميات باستخدام ثراست

2025-06-27
حساب أعداد فيبوناتشي بسرعة فائقة على وحدة معالجة الرسوميات باستخدام ثراست

تُظهر هذه المدونة كيفية إجراء حسابات متسلسلة لأعداد فيبوناتشي بسرعة كبيرة جدًا باستخدام برمجة وحدة معالجة الرسوميات و مكتبة ثراست من إنفيديا. تبدأ المدونة بشرح خوارزمية المسح، ثم تُظهر كيفية استخدام عمليات المسح في ثراست لإجراء عمليات الجمع والضرب البسيطة، مع توسيع نطاق ذلك إلى عمليات المصفوفة. وأخيرًا، تُوضح المدونة كيفية حساب أعداد فيبوناتشي بكفاءة باستخدام عمليات المصفوفة و عملية المسح، مع استخدام الحساب النمطي لتجنب تجاوز الأعداد الصحيحة. قام الكاتب بحساب F99999999 (mod 9837) في 17 ميلي ثانية فقط على وحدة معالجة رسوميات إنفيديا جي فورس RTX 3060 موبايل.

اقرأ المزيد

نسخ مصفوفة عالي الكفاءة في موجو: هل يتفوق على CUDA؟

2025-06-06
نسخ مصفوفة عالي الكفاءة في موجو: هل يتفوق على CUDA؟

تتناول هذه المدونة كيفية تنفيذ نواة نسخ مصفوفة عالية الكفاءة على بنية هوبر باستخدام موجو. يشرح الكاتب التحسينات، بدءًا من نهج بسيط وصولاً إلى نواة تحقق عرض نطاق ترددي يبلغ 2775.49 جيجابت/ثانية - وهو ما يضاهي، وربما يتجاوز، تنفيذ CUDA المكافئ. تتضمن التحسينات استخدام واصفات TMA (وصول خريطة الموتر)، وتحسينات الذاكرة المشتركة، وتبديل البيانات، وتقوية الخيوط. تعمق هذه المدونة في تفاصيل التنفيذ ومكاسب الأداء لكل تقنية، مع توفير أمثلة كاملة للرموز.

اقرأ المزيد