هل تتفوق نواة CUDA التي تم توليدها بواسطة الذكاء الاصطناعي على PyTorch؟
2025-05-30
استخدم الباحثون نماذج لغة كبيرة واستراتيجية بحث متفرعة جديدة لإنشاء نواة CUDA-C نقية تلقائيًا دون الاعتماد على مكتبات مثل CUTLASS أو Triton. والمثير للدهشة أن هذه النواة التي تم توليدها بواسطة الذكاء الاصطناعي تتفوق في بعض الحالات على نواة الإنتاج المحسّنة من قبل الخبراء في PyTorch، حيث حققت سرعة تقارب ضعف السرعة في عملية Conv2D. تعتمد هذه الطريقة على الاستدلال اللغوي حول استراتيجيات التحسين والبحث المتفرع لاستكشاف فرضيات متعددة بالتوازي، وتجنب النقاط المثلى المحلية بكفاءة. على الرغم من أن أداء عملية ضرب المصفوفة FP16 و Flash Attention لا يزال بحاجة إلى تحسين، إلا أن هذا البحث يفتح آفاقًا جديدة في توليد النواة عالية الأداء تلقائيًا، مما يشير إلى إمكانات الذكاء الاصطناعي الهائلة في تحسين المُجمّعات.
اقرأ المزيد
الذكاء الاصطناعي
توليد النواة