Webtagr - 기술 뉴스 다이제스트

오픈소스 AI 에이전트 Refact.ai, SWE-bench Verified에서 놀라운 69.8% 달성

2025-05-22

주요 오픈소스 AI 프로그래밍 에이전트인 Refact.ai는 SWE-bench Verified 벤치마크에서 놀라운 69.8% 점수를 달성하여 실제 GitHub 이슈 500개 중 349개를 자율적으로 해결했습니다. 이 성공은 견고한 아키텍처 덕분입니다. 핵심인 Claude-3.7 모델, 디버깅 및 코드 수정을 위한 debug_script() 서브 에이전트, 최적화된 문제 해결을 위한 strategic_planning() 도구입니다. Refact.ai 파이프라인 전체는 오픈소스이며, 실제 애플리케이션에서는 개발자의 생산성을 크게 향상시키는 것을 입증했습니다.

(refact.ai)