Démarrage rapide : RAG, Milvus et Docling avec Feast
Ce projet montre comment utiliser Feast pour alimenter une application de génération augmentée par la recherche (RAG). Il étend la démo RAG de base pour illustrer comment transformer des fichiers PDF en données textuelles utilisables par les modèles linguistiques de grande taille (LLM) avec Docling, comment utiliser Milvus comme base de données vectorielle pour stocker et récupérer les plongements pour RAG, et comment transformer les fichiers PDF avec Docling lors de l'ingestion. Il montre également la récupération en ligne des caractéristiques, les définitions déclaratives des vues de caractéristiques, la recherche vectorielle, le contexte structuré et non structuré, ainsi que le versionnement et la réutilisabilité. Le projet inclut des données de démonstration, un fichier Python définissant les vues de caractéristiques et les configurations d'entités pour Feast, un fichier YAML configurant les magasins hors ligne et en ligne, et deux notebooks principaux : l'un montrant comment utiliser Docling pour extraire le texte des fichiers PDF et le stocker dans un fichier Parquet, et l'autre montrant comment utiliser Feast pour ingérer les données textuelles et les stocker et les récupérer à partir du magasin en ligne.