Voyage-3.5 : modèles d’intégration nouvelle génération avec un meilleur rapport coût-performance

2025-05-24
Voyage-3.5 : modèles d’intégration nouvelle génération avec un meilleur rapport coût-performance

Voyage AI a lancé Voyage-3.5 et Voyage-3.5-lite, ses modèles d’intégration de nouvelle génération. Ils conservent la même taille que leurs prédécesseurs, mais offrent des améliorations significatives de la qualité de la récupération à moindre coût. Comparés à OpenAI v3-large, Voyage-3.5 et Voyage-3.5-lite affichent une qualité de récupération supérieure de 8,26 % et 6,34 %, respectivement, tout en coûtant 2,2 fois et 6,5 fois moins cher. Prenant en charge plusieurs dimensions d’intégration et des options de quantification grâce à l’apprentissage Matryoshka et à l’entraînement conscient de la quantification, ils réduisent considérablement les coûts de la base de données vectorielle tout en maintenant une précision supérieure.

Lire plus

Évaluation de la récupération de code : défis et approche de Voyage AI

2025-02-03
Évaluation de la récupération de code : défis et approche de Voyage AI

Les assistants de codage modernes reposent fortement sur la récupération de code, mais les méthodes d'évaluation existantes sont insuffisantes. La recherche de Voyage AI met en évidence des problèmes avec les ensembles de données actuels, notamment des étiquettes bruitées, l'absence d'évaluation du raisonnement algorithmique profond et la contamination des données, ce qui conduit à des évaluations de modèles non fiables. Pour y remédier, Voyage AI propose deux méthodes pour créer des ensembles de données de récupération de code de haute qualité : réutiliser les ensembles de données de questions-réponses et exploiter les référentiels et les problèmes/tickets GitHub. Voyage AI a également construit sa propre suite de tests de référence interne, englobant plusieurs langages de programmation, divers ensembles de données de questions-réponses et des benchmarks spécifiques à un domaine, évaluant plusieurs modèles d'intégration de code. Voyage-code-3 s'est avéré être le modèle le plus performant.

Lire plus

Voyage-code-3 : Récupération de code plus précise à moindre coût

2025-01-14
Voyage-code-3 : Récupération de code plus précise à moindre coût

Voyage AI a dévoilé Voyage-code-3, un modèle d'embedding de nouvelle génération pour la récupération de code, surpassant OpenAI-v3-large et CodeSage-large de 13,80% et 16,81% en moyenne sur 32 ensembles de données. En utilisant l'apprentissage Matryoshka et la quantification (int8 et binaire), Voyage-code-3 réduit considérablement les coûts de stockage et de recherche avec un impact minimal sur la qualité de la récupération. Il prend en charge les embeddings de 2048, 1024, 512 et 256 dimensions, ainsi que plusieurs formats de quantification, et dispose d'une longueur de contexte de 32K tokens. Entraîné sur un corpus de code massif et diversifié, Voyage-code-3 excelle dans la récupération de code, notamment pour le raisonnement algorithmique et les règles syntaxiques nuancées, et a été rigoureusement évalué pour sa robustesse et sa précision.

Lire plus