Schnellstart: RAG, Milvus und Docling mit Feast

2025-04-22
Schnellstart: RAG, Milvus und Docling mit Feast

Dieses Projekt demonstriert, wie man Feast verwendet, um eine Retrieval-Augmented Generation (RAG)-Anwendung zu betreiben. Es erweitert die grundlegende RAG-Demo und zeigt, wie man PDFs mit Docling in Textdaten umwandelt, die von LLMs verwendet werden können, wie man Milvus als Vektor Datenbank verwendet, um Einbettungen für RAG zu speichern und abzurufen, und wie man PDFs während der Ingestion mit Docling transformiert. Zusätzlich werden Online-Retrieval von Features, deklarative Feature-Definitionen, Vektorsuche, strukturierter und unstrukturierter Kontext sowie Versionierung und Wiederverwendbarkeit demonstriert. Das Projekt enthält Beispieldaten, eine Python-Datei, die die Feature-Views und Entitätskonfigurationen für Feast definiert, eine YAML-Datei, die die Offline- und Onlinespeicher konfiguriert, und zwei Haupt-Notebooks: eines, das zeigt, wie man Docling verwendet, um Text aus PDFs zu extrahieren und in einer Parquet-Datei zu speichern, und ein anderes, das zeigt, wie man Feast verwendet, um Textdaten zu importieren und im Onlinespeicher zu speichern und abzurufen.

Entwicklung