Mistral의 새로운 OCR 모델, 기대에 못 미침; Google Gemini 2.0이 선두
2025-03-11
최근 테스트 결과 Mistral이 새롭게 출시한 OCR 전용 모델이 홍보 내용과 달리 성능이 저조한 것으로 나타났습니다. 개발자 Willis와 Doria는 복잡한 레이아웃과 손글씨 처리에서 도시 이름 반복, 숫자 오류, 환각 등의 문제점을 지적했습니다. 반면 Google Gemini 2.0 Flash Pro Experimental은 뛰어난 성능을 보이며 Mistral이 처리하지 못하는 복잡한 PDF 파일, 손글씨가 포함된 파일도 처리할 수 있습니다. 넓은 컨텍스트 윈도우도 큰 강점입니다. LLM 기반 OCR은 유망하지만 정보 조작, 지시 사항 오해, 전반적인 데이터 오해석 등의 문제점을 가지고 있습니다.
AI