Feast, Milvus, Docling을 사용한 RAG 빠른 시작
2025-04-22
이 프로젝트는 Feast를 사용하여 검색 증강 생성(RAG) 애플리케이션을 구축하는 방법을 보여줍니다. 기본 RAG 데모를 확장하여 Docling을 사용하여 PDF를 LLM에서 사용할 수 있는 텍스트 데이터로 변환하는 방법, Milvus를 벡터 데이터베이스로 사용하여 RAG의 임베딩을 저장하고 검색하는 방법, 그리고 섭취 중에 Docling을 사용하여 PDF를 변환하는 방법을 보여줍니다. 또한 온라인 기능 검색, 선언적 기능 정의, 벡터 검색, 구조화 및 비구조화 컨텍스트, 버전 관리 및 재사용 가능성과 같은 기능도 보여줍니다. 이 프로젝트에는 샘플 데이터, Feast의 기능 뷰와 엔티티 구성을 정의하는 Python 파일, 오프라인 및 온라인 저장소를 구성하는 YAML 파일, 그리고 두 개의 주요 노트북이 포함되어 있습니다. 하나는 Docling을 사용하여 PDF에서 텍스트를 추출하고 Parquet 파일로 저장하는 방법을 보여주고, 다른 하나는 Feast를 사용하여 텍스트 데이터를 수집하고 온라인 저장소에서 저장하고 검색하는 방법을 보여줍니다.
개발