Inicio rápido: RAG, Milvus y Docling con Feast
Este proyecto demuestra cómo usar Feast para impulsar una aplicación de Generación Aumentada por Recuperación (RAG). Amplía la demostración básica de RAG para mostrar cómo transformar archivos PDF en datos de texto utilizables por LLMs con Docling, cómo usar Milvus como una base de datos vectorial para almacenar y recuperar incrustaciones para RAG, y cómo transformar archivos PDF con Docling durante la ingestión. También demuestra la recuperación en línea de características, definiciones declarativas de vistas de características, búsqueda vectorial, contexto estructurado y no estructurado, y versionado y reutilización. El proyecto incluye datos de demostración, un archivo Python que define las vistas de características y las configuraciones de entidades para Feast, un archivo YAML que configura las tiendas sin conexión y en línea, y dos cuadernos principales: uno que demuestra cómo usar Docling para extraer texto de archivos PDF y almacenarlo en un archivo Parquet, y otro que muestra cómo usar Feast para ingerir los datos de texto y almacenarlos y recuperarlos de la tienda en línea.