Voyage-code-3: Genauere Code-Retrieval mit geringeren Kosten

2025-01-14
Voyage-code-3: Genauere Code-Retrieval mit geringeren Kosten

Voyage AI hat Voyage-code-3 vorgestellt, ein Code-Retrieval-Modell der nächsten Generation, das OpenAI-v3-large und CodeSage-large auf 32 Datensätzen durchschnittlich um 13,80% und 16,81% übertrifft. Durch Matryoshka-Lernen und Quantisierung (int8 und binär) reduziert Voyage-code-3 die Speicher- und Suchkosten drastisch, bei minimalem Verlust der Retrieval-Qualität. Es unterstützt Einbettungen von 2048, 1024, 512 und 256 Dimensionen sowie verschiedene Quantisierungsformate und verfügt über eine Kontextlänge von 32K Tokens. Trainiert auf einem massiven, diversen Code-Korpus, zeichnet sich Voyage-code-3 durch hervorragende Code-Retrieval-Leistung aus, insbesondere bei algorithmischem Denken und nuancierten Syntaxregeln, und wurde umfassend auf Robustheit und Genauigkeit getestet.