Voyage-code-3 : Récupération de code plus précise à moindre coût

2025-01-14
Voyage-code-3 : Récupération de code plus précise à moindre coût

Voyage AI a dévoilé Voyage-code-3, un modèle d'embedding de nouvelle génération pour la récupération de code, surpassant OpenAI-v3-large et CodeSage-large de 13,80% et 16,81% en moyenne sur 32 ensembles de données. En utilisant l'apprentissage Matryoshka et la quantification (int8 et binaire), Voyage-code-3 réduit considérablement les coûts de stockage et de recherche avec un impact minimal sur la qualité de la récupération. Il prend en charge les embeddings de 2048, 1024, 512 et 256 dimensions, ainsi que plusieurs formats de quantification, et dispose d'une longueur de contexte de 32K tokens. Entraîné sur un corpus de code massif et diversifié, Voyage-code-3 excelle dans la récupération de code, notamment pour le raisonnement algorithmique et les règles syntaxiques nuancées, et a été rigoureusement évalué pour sa robustesse et sa précision.