SmolLM3: نموذج استنتاج صغير، متعدد اللغات، وسياق طويل

2025-07-09
SmolLM3: نموذج استنتاج صغير، متعدد اللغات، وسياق طويل

SmolLM3 هو نموذج لغة مفتوح المصدر ومتعدد اللغات، ويحتوي على 3 مليارات معلمة، ويحقق توازنًا مثيرًا للإعجاب بين الكفاءة والأداء. يتفوق على Llama-3.2-3B و Qwen2.5-3B في العديد من المعايير، وحتى أنه ينافس نماذج أكبر حجمًا تحتوي على 4 مليارات معلمة. يدعم 6 لغات، ويضم طول سياق يصل إلى 128 ألف رمز، ويتميز بقدرة فريدة على الاستنتاج ثنائي الوضع (think/no_think). وبالإضافة إلى النموذج نفسه، يصدر الباحثون المخطط الهندسي الكامل، بما في ذلك تفاصيل البنية، ومزائج البيانات، ومنهجية التدريب - وهو مورد قيّم لأي شخص يبني أو يدرس نماذج على هذا النطاق.

الذكاء الاصطناعي سياق طويل