NVIDIA Ingest : Microservices pour l’analyse efficace de documents massifs
2025-01-10
NVIDIA Ingest est un ensemble de microservices en accès anticipé conçus pour analyser efficacement des centaines de milliers de PDF complexes, désordonnés et non structurés, ainsi que d’autres documents d’entreprise. Il extrait les métadonnées et le texte pour les intégrer dans des systèmes de recherche. Tirant parti des microservices NVIDIA NIM, il prend en charge les PDF, Word, PowerPoint et les images, en extrayant le texte, les tableaux, les graphiques et les images, en les contextualisant et en générant du JSON structuré. Les embeddings peuvent être calculés en option et stockés dans une base de données vectorielle Milvus. Un client Python et une interface en ligne de commande sont fournis pour faciliter l’utilisation.
Développement
Analyse de Documents