موازنة بين الاستقلالية والموثوقية في وكلاء دعم العملاء القائمة على نماذج اللغات الكبيرة
في حين أن نماذج اللغات الكبيرة (LLMs) أصبحت أكثر قدرة على أداء المهام ذات الاستقلالية العالية، إلا أن نشرها في حالات الاستخدام عالية القيمة مثل دعم العملاء يتطلب إعطاء الأولوية للموثوقية والاتساق. تكشف الأبحاث أن الوكلاء ذوي الاستقلالية العالية يتفوقون في البيئات المثالية، إلا أن دعم العملاء في العالم الحقيقي يمثل تحديات: فجوات في المعرفة، وسلوك المستخدم غير المتوقع، وقيود الوقت. ولمعالجة ذلك، تم تطوير مقياس جديد، وهو pass^k، وتم اختباره من خلال محاكاة تفاعلات العملاء. وتبين النتائج أن الوكلاء ذوي الاستقلالية العالية يعانون من مشاكل في الموثوقية في المهام المعقدة. الحل؟ وكيل "Give Fin a Task"، الذي يحسن الموثوقية عن طريق تقييد استقلالية الوكيل واستخدام تعليمات خطوة بخطوة، وتقسيم المهام المعقدة إلى وحدات أبسط. يوفر هذا النهج مسارًا واعدًا لتحسين أداء LLMs في سيناريوهات دعم العملاء في العالم الحقيقي.