Nanonets-OCR-s: 지능형 문서 처리를 통한 기존 OCR 뛰어넘기

2025-06-16
Nanonets-OCR-s: 지능형 문서 처리를 통한 기존 OCR 뛰어넘기

Nanonets-OCR-s는 최첨단 이미지-Markdown OCR 모델로 기존의 텍스트 추출을 뛰어넘습니다. 지능형 콘텐츠 인식 및 의미 태깅을 통해 문서를 구조화된 Markdown으로 변환하여 대규모 언어 모델(LLM)의 후속 처리에 이상적입니다. 주요 기능으로는 LaTeX 수식 인식, 지능형 이미지 설명, 서명 감지, 워터마크 추출, 스마트 체크박스 처리, 복잡한 표 추출 등이 있습니다. transformers, vLLM 또는 docext를 통해 모델을 사용할 수 있습니다.

AI