ベクトルIDの損失なし圧縮による近似最近傍探索の高速化

2025-01-23
ベクトルIDの損失なし圧縮による近似最近傍探索の高速化

研究者らは、近似最近傍探索におけるインデックスのストレージコストの高さを解決するため、ベクトルIDの損失なし圧縮スキームを提案しました。多くのインデックス構造においてIDの順序が重要ではないという事実と、非対称数値システムまたはウェーブレットツリーを利用することで、精度や探索時間に影響を与えることなく、ベクトルIDを最大7倍に圧縮できます。これにより、10億規模のデータセットにおいて、インデックスサイズを30%削減できます。さらに、この手法は、元の量子化アルゴリズムの最適化不足を利用することで、量子化されたベクトルコードも損失なしで圧縮できます。