ما هو أبعد من هندسة المطالبات: هندسة السياق لوكلاء الذكاء الاصطناعي القويين

2025-07-01
ما هو أبعد من هندسة المطالبات: هندسة السياق لوكلاء الذكاء الاصطناعي القويين

تُعد هندسة السياق الحد التالي في مجال الذكاء الاصطناعي، حيث تتجاوز هندسة المطالبات البسيطة. وهي تركز على تزويد نماذج اللغات الكبيرة (LLMs) بمعلومات سياقية شاملة من أجل حل المشكلات بفعالية. وتجادل المقالة بأن نجاح وكلاء الذكاء الاصطناعي يعتمد على جودة السياق، وليس فقط على قدرات النموذج. وتشمل هندسة السياق التعليمات الأولية، ومطالبات المستخدم، والذاكرة قصيرة المدى، والذاكرة طويلة المدى، واسترجاع المعلومات الخارجية، والأدوات المتاحة، والإخراج المنظم. ويحتاج وكيل ذكاء اصطناعي ناجح، مثل الذي يخطط للاجتماعات بناءً على رسائل البريد الإلكتروني، إلى دمج بيانات التقويم، وسجل رسائل البريد الإلكتروني، ومعلومات جهة الاتصال لتوليد استجابات بشرية بدلاً من استجابات آلية. وتشدد المقالة على أن هندسة السياق نظام ديناميكي يوفر المعلومات والأدوات الصحيحة في الوقت المناسب، مما يضمن قدرة نماذج اللغات الكبيرة على إنجاز مهمتها - وهو المفتاح لبناء وكلاء ذكاء اصطناعي قويين وموثوقين.

اقرأ المزيد
الذكاء الاصطناعي هندسة السياق

DeepSeek R1: نموذج مفتوح المصدر يتحدى OpenAI في الاستدلال المعقد

2025-01-31
DeepSeek R1: نموذج مفتوح المصدر يتحدى OpenAI في الاستدلال المعقد

يُشكّل DeepSeek R1، وهو نموذج مفتوح المصدر، تحديًا لنماذج OpenAI في مهام الاستدلال المعقدة. باستخدام تحسين سياسة المجموعة النسبية (GRPO) ونهج تدريب متعدد المراحل يركز على التعلم المعزز، أصدر المبدعون ليس فقط النموذج، بل أيضًا ورقة بحثية مفصلة لتطويره. تصف الورقة "لحظة أُوكا" خلال التدريب، حيث تعلم النموذج تخصيص المزيد من وقت التفكير لمشكلة ما من خلال إعادة تقييم نهجه الأولي، دون أي تغذية راجعة بشرية. تُعيد هذه المدونة إنشاء هذه "لحظة أُوكا" باستخدام GRPO ولعبة العد التنازلي، وتدريب نموذج مفتوح لتعلم قدرات التحقق الذاتي وقدرات البحث. يتم توفير رمز تفاعلي لجهاز كمبيوتر محمول Jupyter، بالإضافة إلى نصوص وتعليمات للتدريب الموزع على عقد متعددة الوحدات المعالجة الرسومية أو مجموعات SLURM، لتسهيل تعلم GRPO و TRL.

اقرأ المزيد
الذكاء الاصطناعي