Voyage-code-3: Recuperação de código mais precisa com custos reduzidos

A Voyage AI lançou o Voyage-code-3, um modelo de embedding de recuperação de código de próxima geração que supera o OpenAI-v3-large e o CodeSage-large em uma média de 13,80% e 16,81% em 32 conjuntos de dados. Aproveitando o aprendizado Matryoshka e a quantização (int8 e binário), o Voyage-code-3 reduz drasticamente os custos de armazenamento e pesquisa com impacto mínimo na qualidade de recuperação. Suporta embeddings de 2048, 1024, 512 e 256 dimensões e vários formatos de quantização, e possui um comprimento de contexto de 32K tokens. Treinado em um corpus de código massivo e diversificado, o Voyage-code-3 se destaca na recuperação de código, especialmente no tratamento de raciocínio algorítmico e sintaxe nuances, e foi rigorosamente avaliado para robustez e precisão.