Nanonets-OCR-s:従来のOCRを超えたインテリジェントな文書処理
2025-06-16

Nanonets-OCR-sは、最先端の画像からMarkdownへのOCRモデルであり、従来のテキスト抽出を超えています。インテリジェントなコンテンツ認識とセマンティックタグ付けにより、ドキュメントを構造化されたMarkdownに変換し、大規模言語モデル(LLM)による後処理に最適です。主な機能には、LaTeX数式認識、インテリジェントな画像説明、署名検出、透かし抽出、スマートチェックボックス処理、複雑な表抽出などがあります。transformers、vLLM、またはdocextを使用してモデルを使用できます。
AI