TorchFT: تدريب نماذج اللغات الكبيرة المقاوم للأعطال بمعدلات أعطال عالية

العلامات الشائعة：

الافتراضية أمان DNS التحقق الرسمي تحليل قابلية الوصول أخطاء المترجم تضارب الماكرو امتدادات الويب إطار عمل تطوير كومودور 64 بياسيك 2.0 جميع العلامات

2025-06-27

استخدم الباحثون TorchFT وTorchTitan لتدريب نموذج في بيئة حقيقية بمعدلات أعطال اصطناعية عالية جدًا لإثبات موثوقية وصحة التدريب المقاوم للأعطال. حتى مع وجود 1200 عطل وبدون نقاط تفتيش، ظلت خسارة التدريب مستقرة. يستخدم TorchFT خادم منارة عالميًا ومديرين لكل مجموعة نسخ متماثلة للتنسيق في الوقت الفعلي، ويوفر العديد من خوارزميات مقاومة الأعطال مثل HSDP المقاوم للأعطال وLocalSGD/DiLoCo. تُظهر نتائج التجارب أنه حتى مع معدلات الأعطال المرتفعة للغاية، فإن TorchFT يدرب النموذج بكفاءة، مما يبرز قوته في التعامل مع سيناريوهات الأعطال المختلفة.