VectorVFS: 파일 시스템을 벡터 데이터베이스로 변환

2025-05-05

VectorVFS는 가벼운 Python 패키지로, 네이티브 VFS(가상 파일 시스템) 확장 속성을 활용하여 Linux 파일 시스템을 벡터 데이터베이스로 변환합니다. 별도의 인덱스나 외부 데이터베이스를 유지 관리하는 대신, VectorVFS는 각 파일 옆에 벡터 임베딩을 직접 저장합니다. 이를 통해 기존의 디렉토리 구조가 효율적이고 의미적으로 검색 가능한 임베딩 저장소가 됩니다. VectorVFS는 Meta의 Perception Encoders(PE)를 지원하며, 여기에는 비전 언어 이해를 위한 이미지/비디오 인코더가 포함되어 있으며, 제로샷 이미지 작업에서 InternVL3, Qwen2.5VL, SigLIP2를 능가합니다. CPU와 GPU를 모두 지원하지만, GPU를 사용하지 않고 대량의 이미지 컬렉션을 임베딩하는 데는 처음에 시간이 걸릴 수 있습니다. 현재 Perception Encoders(PE)와 이미지만 지원하며, 향후 릴리스에서 모델과 데이터 유형을 확장할 예정입니다.

더 보기
개발