Benchmark OmniAI OCR: LLMs x OCR Tradicional
2025-02-23

A OmniAI lançou um benchmark OCR de código aberto comparando a precisão, o custo e a latência de provedores de OCR tradicionais e modelos de linguagem de visão (VLMs). Testando em 1.000 documentos do mundo real, os resultados mostram que VLMs como o Gemini 2.0 superam a maioria dos provedores de OCR tradicionais em documentos com gráficos, escrita à mão e campos de entrada complexos, mas os modelos tradicionais se destacaram em páginas de texto de alta densidade. No entanto, os VLMs são mais caros e mais lentos. Este benchmark contínuo será atualizado regularmente com novos conjuntos de dados para garantir justiça e representatividade.
Leia mais
IA