AI가 100만 달러 규모의 프리랜서 소프트웨어 엔지니어링을 대체할 수 있을까요? OpenAI의 최신 연구

2025-04-16

OpenAI의 새로운 논문인 SWE-Lancer는 최첨단 AI 모델을 실제 소프트웨어 개발 작업에서 벤치마킹합니다. Upwork의 1400개 이상의 프리랜서 작업(총 100만 달러 이상)을 사용하여 이 연구는 작업을 개별 기여자 작업(버그 수정, 기능 구축)과 엔지니어링 관리자 작업(최적의 솔루션 선택)으로 나누었습니다. 최고 성능을 보인 Claude 3.5 Sonnet조차도 작업의 33.7%만 완료하고 약 40만 3000달러를 벌었습니다. AI는 솔루션을 만드는 것보다 솔루션을 선택하는 데 뛰어났으며, 초기 애플리케이션은 코드 검토 및 아키텍처 결정에 중점을 둘 수 있음을 시사합니다. 이 벤치마킹은 AI의 발전을 측정하는 구체적인 방법을 제공하며, 리더가 AI의 기능과 영향을 더 잘 이해하고 예측하는 데 도움이 됩니다.

(newsletter.getdx.com)

개발

Google, 검색 도메인 간소화: ccTLD 폐지

API 변동과 보안: 클라이언트 사이드 헤비 로직의 위험성