اختراق في تقييم نماذج اللغة الكبيرة في توليد اختبارات الوحدة

العلامات الشائعة：

الافتراضية أمان DNS التحقق الرسمي تحليل قابلية الوصول أخطاء المترجم تضارب الماكرو امتدادات الويب إطار عمل تطوير كومودور 64 بياسيك 2.0 جميع العلامات

2024-12-30

أجرى الباحثون تقييمًا شاملاً لإمكانيات نماذج اللغة الكبيرة (LLMs) في أتمتة توليد اختبارات الوحدة. قارنوا أداء خمسة نماذج مفتوحة المصدر مع GPT-4 المملوكة و أداة Evosuite التقليدية عبر 17 مشروعًا بلغة جافا، ودرسوا تأثير استراتيجيات المطالبات المختلفة. وجدت الدراسة أن نماذج اللغة المفتوحة المصدر توفر مزايا في خصوصية البيانات، وتتفوق في بعض المهام، لكنها كشفت أيضًا عن قيود في توليد اختبارات الوحدة القائمة على نماذج اللغة الكبيرة. توفر هذه الدراسة رؤى قيّمة لتوجيه التطبيقات المستقبلية لـ LLMs في هذا المجال.