هل يمكن للذكاء الاصطناعي أن يحل محل 1 مليون دولار في هندسة البرمجيات الحرة؟ أحدث أبحاث OpenAI
2025-04-16
تقيّم ورقة OpenAI الجديدة، SWE-Lancer، نماذج الذكاء الاصطناعي المتقدمة في مهام تطوير البرمجيات الواقعية. باستخدام أكثر من 1400 وظيفة مستقلة من Upwork (بإجمالي أكثر من مليون دولار)، قسمت الدراسة المهام إلى مهام من المساهمين الأفراد (إصلاح الأخطاء، وإنشاء الميزات) ومهام مدير الهندسة (اختيار أفضل حل). حتى أفضل أداء، Claude 3.5 Sonnet، أكمل فقط 33.7٪ من المهام، محققًا حوالي 403000 دولار. تفوقت تقنية الذكاء الاصطناعي في اختيار الحلول بدلاً من إنشائها، مما يشير إلى أن التطبيقات الأولية قد تركز على مراجعة التعليمات البرمجية واتخاذ القرارات المعمارية. يوفر هذا المعيار طريقة ملموسة لقياس تقدم الذكاء الاصطناعي، مما يساعد القادة على فهم قدرات الذكاء الاصطناعي وتأثيره بشكل أفضل.
التطوير