Voyage-code-3: 더욱 정확한 코드 검색, 낮은 비용으로
2025-01-14
Voyage AI는 차세대 코드 검색 임베딩 모델인 Voyage-code-3을 공개했습니다. 32개의 데이터 세트에서 OpenAI-v3-large와 CodeSage-large를 평균 13.80%와 16.81% 앞질렀습니다. Matryoshka 학습과 양자화(int8 및 이진)를 활용하여 검색 품질에 대한 영향을 최소화하면서 스토리지 및 검색 비용을 대폭 줄였습니다. 2048, 1024, 512, 256차원 임베딩과 다양한 양자화 형식을 지원하며, 32K 토큰의 컨텍스트 길이를 자랑합니다. 대규모의 다양한 코드 코퍼스로 학습된 Voyage-code-3는 특히 알고리즘적 추론과 미묘한 구문 규칙 처리에서 뛰어난 코드 검색 성능을 보이며, 강건성과 정확성이 엄격하게 평가되었습니다.
AI
임베딩 모델