OpenAI تعترف: حتى أكثر نماذج الذكاء الاصطناعي تطوراً لا يمكنها استبدال المبرمجين البشر
2025-02-24
تكشف ورقة بحثية جديدة من OpenAI أن حتى أكثر نماذج اللغات الكبيرة (LLM) تطوراً، مثل GPT-4 و Claude 3.5، غير قادرة على التعامل مع غالبية مهام هندسة البرمجيات. استخدم الباحثون مقياسًا جديدًا، SWE-Lancer، يتضمن أكثر من 1400 مهمة هندسة برمجيات من Upwork. أظهرت النتائج أن هذه النماذج لم تتمكن إلا من حل المشاكل السطحية، ولم تتمكن من العثور على الأخطاء أو أسبابها الجذرية في المشاريع الأكبر. وعلى الرغم من سرعة نماذج LLM، إلا أن دقتها وموثوقيتها غير كافيتين لاستبدال المبرمجين البشر، مما يتناقض مع توقعات الرئيس التنفيذي لشركة OpenAI، سام ألتمان.
التطوير