VectorVFS: Seu sistema de arquivos como um banco de dados vetorial
O VectorVFS é um pacote Python leve que transforma seu sistema de arquivos Linux em um banco de dados vetorial, aproveitando os atributos estendidos VFS (Virtual File System) nativos. Em vez de manter um índice separado ou banco de dados externo, o VectorVFS armazena embeddings vetoriais diretamente ao lado de cada arquivo, transformando sua estrutura de diretórios existente em um armazenamento de embeddings eficiente e pesquisável semanticamente. O VectorVFS suporta os Codificadores de Percepção (PE) do Meta, incluindo codificadores de imagem/vídeo para compreensão de linguagem visual, superando o InternVL3, Qwen2.5VL e SigLIP2 em tarefas de imagem de zero-shot. Ele suporta CPU e GPU, mas se você tiver um grande acervo de imagens, pode levar algum tempo na primeira vez para incorporar todos os itens se você não estiver usando uma GPU. Observação: Esta é a primeira versão do VectorVFS e estamos expandindo modelos e tipos de dados. Atualmente, suportamos apenas Codificadores de Percepção (PE) e imagens.