NVIDIA Ingest: Microsserviços para Análise Eficiente de Documentos em Massa
2025-01-10
O NVIDIA Ingest é um conjunto de microsserviços em acesso antecipado, projetado para analisar eficientemente centenas de milhares de PDFs complexos, desorganizados e não estruturados, e outros documentos empresariais. Ele extrai metadados e texto para incorporação em sistemas de recuperação. Aproveitando os microsserviços NVIDIA NIM, ele suporta PDFs, Word, PowerPoint e imagens, extraindo texto, tabelas, gráficos e imagens, contextualizando-os e gerando JSON estruturado. Embeddings podem ser opcionalmente computados e armazenados em um banco de dados vetorial Milvus. Um cliente Python e uma interface de linha de comando são fornecidos para facilitar o uso.