وكيل ذكاء اصطناعي يتعلم استخدام الكمبيوتر مثل الإنسان

2025-02-06
وكيل ذكاء اصطناعي يتعلم استخدام الكمبيوتر مثل الإنسان

يهدف مشروع r1-computer-use إلى تدريب وكيل ذكاء اصطناعي للتفاعل مع الكمبيوتر مثل الإنسان، بما في ذلك أنظمة الملفات، ومتصفحات الويب، وأوامر السطر. مستوحى من تقنيات التعلم المعزز من DeepSeek-R1، فإنه يستبدل المُصححين المُشفرين تقليديًا بنموذج مكافأة عصبي لتقييم صحة و فائدة أفعال الوكيل. تتضمن خط أنابيب التدريب عدة مراحل، من عروض الخبراء إلى تحسين السياسات المُوجهة بنماذج المكافآت والضبط الدقيق، بهدف الحصول في النهاية على وكيل ذكاء اصطناعي آمن وموثوق به وقادر على أداء مهام معقدة.

الذكاء الاصطناعي تفاعل الكمبيوتر