OpenAI 인정: 최첨단 AI 모델도 인간 프로그래머를 대체할 수 없다

2025-02-24

OpenAI의 새로운 논문에 따르면 GPT-4와 Claude 3.5와 같은 최첨단 대규모 언어 모델(LLM)조차도 소프트웨어 엔지니어링 작업의 대부분을 처리할 수 없다는 사실이 밝혀졌습니다. 연구원들은 Upwork에서 1400개 이상의 소프트웨어 엔지니어링 작업을 수집한 새로운 벤치마크 SWE-Lancer를 사용했습니다. 결과적으로 이러한 모델들은 표면적인 문제만 해결할 수 있었고, 대규모 프로젝트의 버그나 근본 원인을 찾을 수 없었습니다. LLM은 속도가 빠르지만, 정확성과 신뢰성이 인간 프로그래머를 대체하기에는 부족하며, OpenAI CEO인 Sam Altman의 예측과 상반됩니다.

(futurism.com)

개발

o3-mini가 코드 인터프리터 없이 복잡한 계산을 정확하게 시뮬레이션하다

효율적인 슬라이딩 윈도우 알고리즘: 함수형 큐를 사용한 O(n) 해법