AI가 코드를 작성하고 AI가 검토한다면? 어리석은 일일까요?

2025-05-01
AI가 코드를 작성하고 AI가 검토한다면? 어리석은 일일까요?

Greptile의 공동 창업자인 Daksh는 Devin이라는 AI 코드 생성 도구가 어떤 인간 엔지니어보다 더 많은 풀 리퀘스트를 제출하고 있다는 것을 발견했습니다. 이는 흥미로운 질문을 제기합니다. AI 생성 코드는 AI 자체에 의해 검토되어야 할까요? LLM은 상태 비저장이지만 각 호출은 독립적입니다. 그러나 이는 AI가 자체 코드를 완벽하게 검토할 수 있다는 것을 의미하지 않습니다. AI 생성 코드는 효율성을 높이지만 인간이 찾기 어려운 버그를 도입할 수 있습니다. 연구에 따르면 AI는 특정 유형의 버그를 찾는 데 인간보다 효과적이지만 정확도는 여전히 개선이 필요합니다. 결론적으로 이 글은 AI 코드 검토가 완벽하지 않더라도 AI 자체가 도입한 특정 유형의 버그를 찾는 데 인간보다 효과적이라고 주장합니다.

더 보기

LLM로 재미있는 밈 생성하기: 생각보다 어렵다

2025-01-06
LLM로 재미있는 밈 생성하기: 생각보다 어렵다

워털루 대학교 인턴이 LLM과 Greptile API를 사용하여 GitHub 저장소를 비꼬는 밈을 생성하는 앱을 만들려고 시도했습니다. 이 과정은 예상 외로 어려운 것으로 판명되었습니다. LLM에 직접 밈 텍스트를 생성하도록 지시하면 일반적인 결과만 얻을 수 있었습니다. 따라서 코드 분석(Greptile을 사용하여 구체적인 문제점을 파악)과 밈 텍스트 생성(LLM을 사용하여 타겟을 지정한 유머 생성)이라는 두 가지 작업으로 나누었습니다. 텍스트 처리의 한계로 인해 이미지 생성이 어려워 미리 만들어진 밈 템플릿과 node-canvas를 사용하여 텍스트를 삽입했습니다. 이러한 어려움에도 불구하고 이 프로젝트는 사용자 지정 코드 비꼬는 밈을 생성할 수 있는 웹사이트 reporoast.com으로 결실을 맺었습니다.

더 보기
개발 밈 생성

AI 코드 리뷰 봇이 조용해진 방법

2024-12-21
AI 코드 리뷰 봇이 조용해진 방법

Greptile의 AI 코드 리뷰 봇은 처음에 과도한 코멘트 생성으로 비판을 받았습니다. 이 문제를 해결하기 위해 프롬프트 엔지니어링과 LLM의 자체 평가를 시도했지만, 이러한 방법은 효과적이지 않았습니다. 획기적인 돌파구는 이전 코멘트를 벡터화하고 벡터 데이터베이스에서 클러스터링하여 이전에 거부된 코멘트와 유사한 새로운 코멘트를 필터링하는 것이었습니다. 이 접근 방식을 통해 개발자의 처리율이 19%에서 55% 이상으로 증가하여 LLM 노이즈가 크게 감소했습니다.

더 보기
개발 코드 리뷰