TScale: تدريب نماذج اللغات الكبيرة على أجهزة المستهلك

2025-05-04
TScale: تدريب نماذج اللغات الكبيرة على أجهزة المستهلك

TScale هو إطار عمل لتدريب نماذج اللغات الكبيرة واستنتاجها مكتوب بلغة C++ و CUDA، مصمم للتشغيل على أجهزة المستهلك. يحقق تقليلًا كبيرًا في التكلفة والوقت من خلال بنية مُحسّنة، وحساب منخفض الدقة (fp8 و int8)، وإخراج وحدة المعالجة المركزية، والتدريب الموزع المتزامن وغير المتزامن. حتى نموذج ذو 1 تريليون معلمة يصبح قابلاً للتطبيق مع تقنيات الفهرسة الذكية، مما يسمح بالتدريب على أجهزة الكمبيوتر المنزلية العادية. يُظهر TScale إمكانات هائلة في خفض عتبة الدخول لتدريب نماذج اللغات الكبيرة.