Voyage-3.5: Modelos de incorporação de nova geração com custo-benefício superior

2025-05-24
Voyage-3.5: Modelos de incorporação de nova geração com custo-benefício superior

A Voyage AI lançou os modelos de incorporação de nova geração Voyage-3.5 e Voyage-3.5-lite. Eles mantêm o mesmo tamanho que seus predecessores, mas oferecem melhorias significativas na qualidade de recuperação a um custo menor. Em comparação com o OpenAI v3-large, o Voyage-3.5 e o Voyage-3.5-lite apresentam uma qualidade de recuperação 8,26% e 6,34% melhor, respectivamente, custando 2,2 vezes e 6,5 vezes menos. Suporta múltiplas dimensões de incorporação e opções de quantização por meio da aprendizagem Matryoshka e treinamento de quantização consciente, reduzindo drasticamente os custos do banco de dados vetorial, mantendo simultaneamente precisão superior.

Leia mais

Benchmarking de Recuperação de Código: Desafios e Abordagem da Voyage AI

2025-02-03
Benchmarking de Recuperação de Código: Desafios e Abordagem da Voyage AI

Assistentes de codificação modernos dependem muito da recuperação de código, mas os métodos de avaliação existentes são insuficientes. A pesquisa da Voyage AI destaca problemas com conjuntos de dados atuais, incluindo rótulos ruidosos, falta de avaliação de raciocínio algorítmico profundo e contaminação de dados, levando a avaliações de modelos não confiáveis. Para resolver isso, a Voyage AI propõe dois métodos para criar conjuntos de dados de recuperação de código de alta qualidade: reaproveitar conjuntos de dados de perguntas e respostas e aproveitar repositórios e problemas/solicitações do GitHub. A Voyage AI também construiu seu próprio conjunto de testes de referência interno, abrangendo várias linguagens de programação, vários conjuntos de dados de perguntas e respostas e benchmarks específicos de domínio, avaliando vários modelos de incorporação de código. O Voyage-code-3 surgiu como o modelo de melhor desempenho.

Leia mais

Voyage-code-3: Recuperação de código mais precisa com custos reduzidos

2025-01-14
Voyage-code-3: Recuperação de código mais precisa com custos reduzidos

A Voyage AI lançou o Voyage-code-3, um modelo de embedding de recuperação de código de próxima geração que supera o OpenAI-v3-large e o CodeSage-large em uma média de 13,80% e 16,81% em 32 conjuntos de dados. Aproveitando o aprendizado Matryoshka e a quantização (int8 e binário), o Voyage-code-3 reduz drasticamente os custos de armazenamento e pesquisa com impacto mínimo na qualidade de recuperação. Suporta embeddings de 2048, 1024, 512 e 256 dimensões e vários formatos de quantização, e possui um comprimento de contexto de 32K tokens. Treinado em um corpus de código massivo e diversificado, o Voyage-code-3 se destaca na recuperação de código, especialmente no tratamento de raciocínio algorítmico e sintaxe nuances, e foi rigorosamente avaliado para robustez e precisão.

Leia mais