Webtagr - 기술 뉴스 다이제스트

Deep Code Bench: 코드 검색을 위한 새로운 벤치마크 데이터셋

2025-09-11

Qodo는 대규모의 복잡한 코드 저장소에서 파생된 실제 질문으로 구성된 새로운 벤치마크 데이터셋인 Deep Code Bench를 출시했습니다. 기존 벤치마크와 달리 이러한 질문은 여러 파일을 검색해야 하므로 실제 개발자 시나리오를 반영합니다. 풀 리퀘스트 데이터에서 LLM을 사용하여 생성된 이 데이터셋은 코드 검색 시스템에 대한 강력한 평가를 제공합니다. Qodo의 심층 연구 에이전트는 사실 재현율에서 다른 에이전트를 능가하며 약 76%의 정확도를 달성했습니다.

(www.qodo.ai)

개발 벤치마크 데이터셋

Qodo Command, SWE-bench Verified에서 놀라운 71.2% 달성

2025-08-12

명령줄 AI 코딩 에이전트인 Qodo Command가 실제 소프트웨어 엔지니어링 작업에서 AI 에이전트를 평가하는 주요 벤치마크인 SWE-bench Verified에서 놀라운 71.2% 점수를 달성했습니다. 이 점수는 파인튜닝이나 벤치마크 특정 조정 없이 Qodo Command의 프로덕션 버전을 사용하여 달성되었습니다. 성공은 컨텍스트 요약, 실행 계획, 재시도 및 대체 메커니즘, LangGraph 프레임워크와 같은 기능 때문입니다. 여러 LLM을 지원하도록 설계되었으며, Qodo Command는 현재 Anthropic의 Claude 4와 협력하여 적응력이 높고 학습 지향적인 코딩 에이전트를 만들고 있습니다.

(www.qodo.ai)

개발

Qodo 코드 리뷰 벤치마크에서 GPT-5 우수한 성능

2025-08-08

Qodo는 실제 코드 리뷰 워크플로우를 시뮬레이션한 자체 PR 벤치마크를 사용하여 GPT-5를 포함한 최첨단 언어 모델을 평가했습니다. 결과는 GPT-5가 코드 차이 이해, 버그 식별 및 개선 제안에서 뛰어난 성능을 보였다는 것을 보여주었습니다. "최소형" 버전은 속도와 품질의 균형을 인상적으로 맞췄습니다. GPT-5에는 오탐과 불일치하는 레이블링과 같은 몇 가지 약점이 있었지만, 전체적인 코드 리뷰 성능은 놀라웠으며 AI 지원 코드 리뷰의 큰 발전을 보여줍니다.

(www.qodo.ai)

개발

Qodo Gen CLI: AI 에이전트를 사용한 SDLC 자동화

2025-06-25

Qodo Gen CLI는 AI 에이전트를 구축, 관리 및 실행하기 위한 강력한 명령줄 인터페이스입니다. 개발자는 사용자 지정 에이전트를 만들어 소프트웨어 개발 라이프사이클(SDLC) 전체의 워크플로를 자동화하고 AI 기능을 모든 IDE에 통합할 수 있습니다. 주요 LLM과 유연한 배포 옵션을 지원하는 Qodo Gen CLI는 터미널 및 브라우저 기반 인터페이스를 제공합니다. 코드 검토, 문서 생성, 테스트 적용 범위 등의 작업을 자동화하여 효율성을 높이고 개발자가 기능 구축에 집중할 수 있도록 합니다.

(www.qodo.ai)

개발 SDLC 자동화

AI 코드 생성: 정확성과 신뢰도가 관건

2025-06-12

AI 생성 코드의 환각이 적고 출시에 대한 신뢰도가 높다고 보고한 개발자는 겨우 3.8%에 불과합니다. 이들은 실제로 AI를 통해 생산성 향상의 혜택을 누리는 팀들입니다. 이들은 제안을 신뢰하고, 더 빠르게 출시하며, 고품질 피드백으로 순환 과정을 완료합니다. 낮은 환각 그룹 중에서도 자신감 있는 개발자(17%)는 코드 품질 향상을 볼 가능성이 1.3배 높고(44% 대 35%), AI 코드 출시에 대한 신뢰도가 2.5배 높은 것(24% 대 9%)으로 나타났습니다. 이 그룹은 ‘최적의 지점’으로, 절반 이상(53%)이 코드 품질의 명확한 개선을 보고했습니다. 이는 정확성, 품질, 신뢰도 사이에 강력한 연관성이 있음을 시사합니다. 개발자가 오류가 적고 품질이 높은 결과를 보면 AI를 신뢰하고 실제 환경에서 사용할 가능성이 훨씬 높아집니다. 또한 낮은 환각은 개발자가 AI가 코드 품질을 향상시켰다고 말할 가능성을 1.3배 높입니다(전체적으로 44% 대 35%). 그러나 정확한 결과를 얻은 개발자들조차도 대부분 여전히 주저하고 있습니다. 자동화된 품질 검사가 이러한 간극을 메울 수 있습니다.

(www.qodo.ai)

개발 개발자 신뢰도

단위 테스트를 사용한 Java 논리 오류 디버깅

2025-05-07

Java 개발에서 논리 오류는 기존 방법으로 디버깅하기가 매우 어렵습니다. 이 글에서는 단위 테스트를 사용한 테스트 주도형 디버깅 방법을 소개합니다. 가설 테스트, 상태 전이 테스트, 회귀 테스트 등 다양한 테스트 기법을 자세히 설명하고, 테스트 결과를 활용하여 코드 동작을 이해하고 최종적으로 로직을 개선하는 방법을 설명합니다. 또한 AI 지원 단위 테스트 도구에 대해서도 언급하여 잠재적인 논리적 취약성을 보다 효과적으로 발견하는 데 도움이 됩니다.

(www.qodo.ai)

개발 논리 오류

LangGraph: 유연하고 모범 사례를 준수하는 AI 코딩 어시스턴트 구축

2025-03-24

Qodo는 LangGraph 프레임워크를 사용하여 유연성과 코딩 모범 사례 준수의 균형을 맞춘 AI 코딩 어시스턴트를 구축했습니다. 초기에는 코딩 작업에 미리 정의된 워크플로를 사용했지만, Claude Sonnet 3.5와 같은 더 강력한 LLM이 등장하면서 LangGraph의 그래프 기반 접근 방식으로 전환했습니다. LangGraph는 완전히 개방형부터 완전히 구조화된 결정적 흐름까지 다양한 범위의 에이전트를 구축할 수 있도록 하여 Qodo는 LLM의 기능에 따라 흐름의 구조화 정도를 조정할 수 있습니다. 프레임워크의 깔끔한 API, 재사용 가능한 구성 요소 및 내장 상태 관리를 통해 개발이 간소화되었으며, 지속성, 체크포인트 및 분기점이 지원됩니다. 문서 및 테스트에는 몇 가지 과제가 있지만, LangGraph는 Qodo가 강력한 AI 코딩 어시스턴트를 구축하기 위한 견고한 기반을 제공했습니다.

(www.qodo.ai)

개발

Qodo Gen 1.0: LangGraph 및 MCP를 사용한 에이전트형 AI 코딩

2025-03-18

Qodo Gen 1.0은 AI 코딩 및 테스트용 IDE 플러그인에 에이전트형 워크플로를 도입하여 AI가 복잡한 코딩 작업을 동적으로 처리할 수 있도록 했습니다. 이는 구조화된 워크플로를 위한 LangGraph와 표준화된 외부 도구 통합을 위한 Anthropic의 Model Context Protocol(MCP)을 사용하여 인프라를 재구축함으로써 달성되었습니다. 이 아키텍처는 비동기 통신, 주문형 컨텍스트 검색, 향상된 오류 처리 및 안정성을 지원하므로 AI는 자율적으로 작동하고, 실시간 데이터를 가져오고, 도구 실행 결과에 따라 전략을 조정할 수 있습니다. LangGraph는 유연성과 제어 기능을 제공하고, MCP는 외부 도구 통합을 간소화합니다. 결과적으로 더욱 지능적인 자동화, 확장 가능한 시스템, 그리고 AI 자율성에 대한 구조화된 접근 방식이 구현되었습니다.

(www.qodo.ai)

개발

Qodo-Embed-1: 효율적이고 컴팩트한 코드 임베딩 모델 패밀리

2025-03-03

Qodo는 기존 모델보다 훨씬 작은 크기로 최첨단 성능을 달성하는 새로운 코드 임베딩 모델 패밀리인 Qodo-Embed-1을 발표했습니다. 15억 매개변수 모델은 CoIR 벤치마크에서 68.53점을 획득하여 70억 매개변수의 더 큰 모델을 능가했습니다. 코드 스니펫의 정확한 검색에서 기존 모델의 한계를 극복하기 위해 합성 데이터 생성을 사용하여 훈련된 Qodo-Embed-1은 코드 검색의 정확성과 효율성을 크게 향상시킵니다. 15억 매개변수 모델은 오픈소스이며 70억 매개변수 모델은 상업적으로 제공됩니다.

(www.qodo.ai)

AI 코드 임베딩 모델

RAG 시스템을 위한 강력한 평가 프레임워크 구축

2025-02-14

Qodo는 검색 증강 생성(RAG) 기반 AI 코딩 어시스턴트를 구축하고 정확성과 포괄성을 보장하기 위한 강력한 평가 프레임워크를 개발했습니다. 과제에는 대규모 비공개 데이터셋에서 도출된 RAG 출력의 정확성을 검증하는 것이 포함되었습니다. 이 프레임워크는 최종 검색된 문서와 최종 생성된 출력을 평가하며, '답변 정확성'과 '검색 정확도'에 중점을 둡니다. 자연어 출력의 과제를 해결하기 위해 'LLM을 심사관으로' 사용하는 접근 방식을 채택하고 현실적인 질문, 답변 및 컨텍스트를 포함하는 ground truth 데이터셋을 만들었습니다. 효율성을 높이기 위해 LLM을 데이터셋 구축에 활용하고 LLM과 RAGAS를 사용하여 답변의 정확성을 평가했습니다. 최종적으로 고유한 LLM 심사관을 구축하고 RAGAS와 결합하여 신뢰성을 높였으며, 회귀 테스트를 포함하는 워크플로에 통합하여 코드 변경이 품질에 미치는 영향을 검증하는 노력을 크게 줄였습니다.

(www.qodo.ai)

개발

Qodo Merge 1.0: 진화하는 AI 코드 리뷰

2025-02-02

Qodo Merge 1.0은 AI 기반 코드 리뷰 도구로, 1년 이상의 개발 기간 동안 AI 지원 코딩의 고유한 과제를 해결했습니다. 새 버전에는 버그 및 보안 취약성과 같은 중요한 문제를 우선시하는 문제 집중 모드, 승인된 변경 사항을 기반으로 제안을 개선하는 동적 학습, 실시간 티켓 컨텍스트 통합 및 피드백을 실행 가능한 코드 변경으로 변환하는 `/implement` 명령이 포함되어 있습니다. Qodo Merge 1.0을 통해 코드 리뷰는 더욱 정확하고, 적응력이 뛰어나며, 효율적입니다.

(www.qodo.ai)

개발 AI 코드 리뷰

효과적인 AI 코드 제안: 적을수록 좋다

2025-01-29

Qodo(이전 Codium)는 AI 기반 풀 리퀘스트 분석 및 피드백 도구인 Qodo Merge를 통해 LLM을 사용한 코드 검토에서 중요한 교훈을 얻었습니다. 처음에는 스타일 제안보다 버그 탐지를 우선시하는 접근 방식이 효과적이지 않았습니다. 모델은 더 쉽게 찾을 수 있는 스타일 문제에 압도되어 개발자들 사이에서 제안 피로를 유발했습니다. 획기적인 발전은 모델의 작업을 단순화하는 것, 즉 의미 있는 버그와 문제에만 집중하는 것이었습니다. 이 집중적 접근 방식을 통해 버그 탐지율과 신호 대 잡음비가 향상되어 제안 수락률은 50% 증가하고 전반적인 영향은 11% 증가했습니다. 중요한 교훈은 복잡한 우선 순위 지정보다 산만함을 제거하는 것이 더 효과적일 수 있다는 것입니다.

(www.qodo.ai)

개발 코드 검토

오픈소스 LLM DeepSeek-R1, Qodo Gen에 통합

2025-01-27

Qodo(구 Codium)는 OpenAI의 o1과 비교할 만한 강력한 오픈소스 대규모 언어 모델 DeepSeek-R1을 AI 기반 코딩 어시스턴트 Qodo Gen에 통합했다고 발표했습니다. DeepSeek-R1은 강력한 추론 능력과 비용 효율성으로 알려져 있으며, 복잡한 코딩 과제를 처리하고 많은 독점 모델보다 빠르고 저렴하게 응답을 생성합니다. Qodo Gen은 여러 최고 수준의 LLM을 지원하여 개발자에게 안전하고 안정적인 AI 지원 코딩 환경을 제공합니다.

(www.qodo.ai)

개발

VS Code의 Python 디버거: print문을 넘어서

2025-01-10

Python 코드에 print문을 잔뜩 넣어 디버깅하는 데 지치셨나요? Visual Studio Code의 강력한 디버깅 기능이 여러분의 워크플로우를 혁신적으로 바꿔줄 것입니다. 이 튜토리얼에서는 VS Code의 Python 디버거 설정, 중단점 관리, 변수 검사, 그리고 예외 처리, 원격 디버깅, 성능 분석과 같은 고급 기법을 다룹니다. 비효율적인 print문 시대를 뒤로 하고 Python 코드를 효율적으로 디버깅하는 방법을 배우고 개발 효율성을 높여보세요.

(www.qodo.ai)

개발 Python 디버깅