NVIDIA Ingest:大量ドキュメントを効率的に解析するためのマイクロサービス
2025-01-10
NVIDIA Ingestは、複雑で、不規則で、非構造化された数十万ものPDFやその他のエンタープライズドキュメントを効率的に解析するために設計された、早期アクセス版のマイクロサービスです。検索システムに埋め込むためのメタデータとテキストを抽出します。NVIDIA NIMマイクロサービスを活用して、PDF、Word、PowerPoint、画像をサポートし、テキスト、表、グラフ、画像を抽出し、コンテキスト化し、構造化されたJSONを出力します。埋め込みはオプションで計算され、Milvusベクターデータベースに保存できます。使いやすさのために、Pythonクライアントとコマンドラインインターフェースが提供されています。
開発
ドキュメント解析