OpenAI admet : même les modèles d'IA les plus avancés ne peuvent pas remplacer les programmeurs humains
2025-02-24
Un nouveau document d'OpenAI révèle que même les modèles de langage les plus avancés (LLM), tels que GPT-4 et Claude 3.5, sont incapables de gérer la plupart des tâches d'ingénierie logicielle. Les chercheurs ont utilisé un nouveau benchmark, SWE-Lancer, comprenant plus de 1400 tâches d'ingénierie logicielle provenant du site Upwork. Les résultats ont montré que ces modèles ne pouvaient résoudre que des problèmes superficiels, sans pouvoir trouver les bogues ou les causes profondes dans les projets plus importants. Bien que les LLM soient rapides, leur précision et leur fiabilité sont insuffisantes pour remplacer les programmeurs humains, ce qui contredit les prédictions du PDG d'OpenAI, Sam Altman.
Développement