Qodo Command, SWE-bench Verified에서 놀라운 71.2% 달성

명령줄 AI 코딩 에이전트인 Qodo Command가 실제 소프트웨어 엔지니어링 작업에서 AI 에이전트를 평가하는 주요 벤치마크인 SWE-bench Verified에서 놀라운 71.2% 점수를 달성했습니다. 이 점수는 파인튜닝이나 벤치마크 특정 조정 없이 Qodo Command의 프로덕션 버전을 사용하여 달성되었습니다. 성공은 컨텍스트 요약, 실행 계획, 재시도 및 대체 메커니즘, LangGraph 프레임워크와 같은 기능 때문입니다. 여러 LLM을 지원하도록 설계되었으며, Qodo Command는 현재 Anthropic의 Claude 4와 협력하여 적응력이 높고 학습 지향적인 코딩 에이전트를 만들고 있습니다.
더 보기