OpenAI admet : même les modèles d'IA les plus avancés ne peuvent pas remplacer les programmeurs humains

Tags populaires：

Virtualisation sécurité DNS vérification formelle analyse d'atteignabilité erreurs du compilateur conflit de macro extension web framework de développement Graphiques bitmap incohérences d'API Tous les tags

2025-02-24

Un nouveau document d'OpenAI révèle que même les modèles de langage les plus avancés (LLM), tels que GPT-4 et Claude 3.5, sont incapables de gérer la plupart des tâches d'ingénierie logicielle. Les chercheurs ont utilisé un nouveau benchmark, SWE-Lancer, comprenant plus de 1400 tâches d'ingénierie logicielle provenant du site Upwork. Les résultats ont montré que ces modèles ne pouvaient résoudre que des problèmes superficiels, sans pouvoir trouver les bogues ou les causes profondes dans les projets plus importants. Bien que les LLM soient rapides, leur précision et leur fiabilité sont insuffisantes pour remplacer les programmeurs humains, ce qui contredit les prédictions du PDG d'OpenAI, Sam Altman.

Développement