NVIDIA Ingest: Microservicios para el Análisis Eficiente de Documentos Masivos

2025-01-10
NVIDIA Ingest: Microservicios para el Análisis Eficiente de Documentos Masivos

NVIDIA Ingest es un conjunto de microservicios de acceso anticipado diseñados para analizar eficientemente cientos de miles de PDFs complejos, desordenados y no estructurados, y otros documentos empresariales. Extrae metadatos y texto para integrarlos en sistemas de recuperación. Aprovechando los microservicios NVIDIA NIM, admite PDFs, Word, PowerPoint e imágenes, extrayendo texto, tablas, gráficos e imágenes, contextualizándolos y generando JSON estructurado. Los embeddings se pueden calcular opcionalmente y almacenar en una base de datos vectorial Milvus. Se proporciona un cliente Python y una interfaz de línea de comandos para facilitar su uso.