Nanonets-OCR-s:超越传统OCR的智能文档处理模型
2025-06-16
Nanonets-OCR-s 是一款先进的图像到Markdown OCR 模型,它不仅仅进行简单的文本提取,还能将文档转换为结构化的Markdown格式,并进行智能内容识别和语义标记。该模型支持LaTeX公式识别、智能图像描述、签名检测、水印提取、复选框处理和复杂表格提取等功能,非常适合大型语言模型 (LLM) 的后续处理。用户可以通过transformers、vLLM或docext等方式使用该模型。
AI