نواة ميراج المستمرة: تجميع نماذج اللغات الكبيرة في نواة عملاقة واحدة للاستدلال فائق السرعة
2025-06-19
طور باحثون من جامعة كارنيغي ميلون وجامعة واشنطن وبركلي وNVIDIA وجامعة تسينغهوا نواة ميراج المستمرة (MPK)، وهو عبارة عن مُجمِّع ونظام وقت تشغيل يحوّل استنتاج نماذج اللغات الكبيرة (LLM) متعددة وحدات معالجة الرسومات تلقائيًا إلى نواة عملاقة عالية الأداء. من خلال دمج جميع العمليات الحسابية والاتصالات في نواة واحدة، يزيل MPK عبء بدء النواة، ويدمج العمليات الحسابية والاتصالات، ويقلل بشكل كبير من زمن الوصول للاستدلال على نماذج اللغات الكبيرة. تُظهر التجارب تحسينات كبيرة في الأداء في كل من تكوينات وحدة معالجة الرسومات الواحدة والمتعددة، مع مكاسب أكثر وضوحًا في بيئات وحدات معالجة الرسومات المتعددة. تركز الأعمال المستقبلية على توسيع MPK لدعم أجيال وحدات معالجة الرسومات القادمة ومعالجة أحمال العمل الديناميكية.