VectorVFS:ファイルシステムをベクトルデータベースに変換
2025-05-05
VectorVFSは、軽量なPythonパッケージで、ネイティブのVFS(仮想ファイルシステム)拡張属性を利用して、Linuxファイルシステムをベクトルデータベースに変換します。個別のインデックスや外部データベースを維持する代わりに、VectorVFSは各ファイルの横にベクトル埋め込みを直接保存します。これにより、既存のディレクトリ構造が、効率的で意味的に検索可能な埋め込みストアになります。VectorVFSは、MetaのPerception Encoders(PE)をサポートしており、画像/ビデオエンコーダーを含み、ゼロショット画像タスクにおいてInternVL3、Qwen2.5VL、SigLIP2を上回ります。CPUとGPUの両方をサポートしていますが、大量の画像コレクションをGPUを使用せずに埋め込むには、最初に時間がかかる場合があります。現在、Perception Encoders(PE)と画像のみをサポートしており、今後のリリースでモデルとデータ型を拡張する予定です。
開発