OmniAI OCR 벤치마크: 거대 언어 모델 대 기존 OCR

2025-02-23
OmniAI OCR 벤치마크: 거대 언어 모델 대 기존 OCR

OmniAI는 기존 OCR 제공업체와 비전 언어 모델(VLM)의 정확성, 비용, 지연 시간을 비교하는 오픈소스 OCR 벤치마크를 출시했습니다. 실제 문서 1,000개를 테스트한 결과, Gemini 2.0과 같은 VLM은 차트, 필기, 복잡한 입력 필드가 포함된 문서에서 기존 OCR 제공업체 대부분을 능가하는 것으로 나타났지만, 고밀도 텍스트 페이지에서는 기존 모델이 더 우수했습니다. 그러나 VLM은 비용이 더 많이 들고 처리 속도가 느립니다. 이 지속적인 벤치마크는 공정성과 대표성을 보장하기 위해 정기적으로 새로운 데이터 세트로 업데이트됩니다.

AI