Voyage-3.5: Modelos de incrustación de próxima generación con una relación costo-rendimiento superior

2025-05-24
Voyage-3.5: Modelos de incrustación de próxima generación con una relación costo-rendimiento superior

Voyage AI lanzó Voyage-3.5 y Voyage-3.5-lite, sus modelos de incrustación de próxima generación. Estos mantienen el mismo tamaño que sus predecesores, pero ofrecen mejoras significativas en la calidad de recuperación a un costo menor. En comparación con OpenAI v3-large, Voyage-3.5 y Voyage-3.5-lite muestran una calidad de recuperación un 8,26% y un 6,34% mejor, respectivamente, mientras que cuestan 2,2 veces y 6,5 veces menos. Con soporte para múltiples dimensiones de incrustación y opciones de cuantificación a través del aprendizaje Matryoshka y el entrenamiento con conocimiento de la cuantificación, reducen drásticamente los costos de la base de datos vectorial, manteniendo al mismo tiempo una precisión superior.

Leer más

Evaluación de la Recuperación de Código: Desafíos y el Enfoque de Voyage AI

2025-02-03
Evaluación de la Recuperación de Código: Desafíos y el Enfoque de Voyage AI

Los asistentes de codificación modernos dependen en gran medida de la recuperación de código, pero los métodos de evaluación existentes son insuficientes. La investigación de Voyage AI destaca problemas con los conjuntos de datos actuales, incluyendo etiquetas ruidosas, falta de evaluación del razonamiento algorítmico profundo y contaminación de datos, lo que lleva a evaluaciones de modelos poco fiables. Para abordar esto, Voyage AI propone dos métodos para crear conjuntos de datos de recuperación de código de alta calidad: reutilizar conjuntos de datos de preguntas y respuestas y aprovechar repositorios y problemas/entradas de GitHub. Voyage AI también construyó su propio conjunto de pruebas de referencia interno, que abarca varios lenguajes de programación, varios conjuntos de datos de preguntas y respuestas y benchmarks específicos de dominio, evaluando varios modelos de incrustación de código. Voyage-code-3 surgió como el modelo con mejor rendimiento.

Leer más

Voyage-code-3: Recuperación de código más precisa con menores costos

2025-01-14
Voyage-code-3: Recuperación de código más precisa con menores costos

Voyage AI presentó Voyage-code-3, un modelo de incrustación de recuperación de código de próxima generación que supera a OpenAI-v3-large y CodeSage-large en un promedio de 13,80% y 16,81% en 32 conjuntos de datos. Aprovechando el aprendizaje Matryoshka y la cuantización (int8 y binaria), Voyage-code-3 reduce drásticamente los costos de almacenamiento y búsqueda con un impacto mínimo en la calidad de recuperación. Admite incrustaciones de 2048, 1024, 512 y 256 dimensiones y varios formatos de cuantización, y cuenta con una longitud de contexto de 32K tokens. Entrenado en un corpus de código masivo y diverso, Voyage-code-3 sobresale en la recuperación de código, especialmente en el manejo del razonamiento algorítmico y la sintaxis matizada, y ha sido rigurosamente evaluado para garantizar su robustez y precisión.

Leer más