OpenAI admite: Incluso los modelos de IA más avanzados no pueden reemplazar a los programadores humanos
2025-02-24
Un nuevo artículo de OpenAI revela que incluso los modelos de lenguaje grande (LLM) más avanzados, como GPT-4 y Claude 3.5, son incapaces de manejar la mayoría de las tareas de ingeniería de software. Los investigadores utilizaron un nuevo punto de referencia, SWE-Lancer, que comprende más de 1400 tareas de ingeniería de software de Upwork. Los resultados mostraron que estos modelos solo podían resolver problemas superficiales, sin poder encontrar errores o causas raíz en proyectos más grandes. Si bien los LLM son rápidos, su precisión y fiabilidad son insuficientes para reemplazar a los programadores humanos, lo que contradice las predicciones del CEO de OpenAI, Sam Altman.
Desarrollo
codificación