开源AI编程代理Refact.ai在SWE-bench Verified上取得69.8%的惊人成绩
2025-05-22
Refact.ai,一个领先的开源AI编程代理,在SWE-bench Verified基准测试中取得了69.8%的出色成绩,成功解决了500个真实世界GitHub问题中的349个。其成功秘诀在于:强大的Claude-3.7模型作为核心,辅以debug_script()子代理进行调试和代码修改,以及strategic_planning()工具进行策略规划。Refact.ai的流程是完全开源的,其在实际应用中也取得了显著的成效,提高了开发效率。
AI