号称“首个AI软件工程师”的Devin,实际能力令人失望
2025-01-26
一款名为Devin的AI软件工程师工具,自称能够端到端构建和部署应用程序,并自动查找和修复代码错误。然而,近期测试结果显示,Devin在20个任务中仅成功完成3个,其能力远低于预期。测试人员发现Devin存在诸多问题,例如解决简单任务耗时过长,陷入技术死胡同,以及尝试无法实现的任务。虽然Devin的用户体验出色,但在实际应用中表现不佳,其自主性甚至成为了负面因素。该事件引发人们对AI工具实际能力的质疑,也暴露出当前AI技术仍存在局限性。