Introdução rápida: RAG, Milvus e Docling com Feast

2025-04-22
Introdução rápida: RAG, Milvus e Docling com Feast

Este projeto demonstra como usar o Feast para alimentar um aplicativo de Geração Aumentada por Recuperação (RAG). Ele expande a demonstração básica do RAG para mostrar como transformar PDFs em dados de texto utilizáveis por LLMs com o Docling, como usar o Milvus como um banco de dados vetorial para armazenar e recuperar embeddings para RAG, e como transformar PDFs com o Docling durante a ingestão. Também demonstra recuperação online de recursos, definições de visualizações de recursos declarativas, busca vetorial, contexto estruturado e não estruturado, e versionamento e reusabilidade. O projeto inclui dados de demonstração, um arquivo Python que define as visualizações de recursos e configurações de entidades para o Feast, um arquivo YAML que configura as lojas offline e online, e dois notebooks principais: um que demonstra como usar o Docling para extrair texto de PDFs e armazená-lo em um arquivo Parquet, e outro que mostra como usar o Feast para ingerir os dados de texto e armazená-los e recuperá-los do armazenamento online.

Desenvolvimento