Benchmark de código aberto para OCR e extração de dados de LLMs

Tags populares：

Virtualização segurança DNS verificação formal análise de alcance IA erros do compilador conflito de macro extensão web framework de desenvolvimento Gráficos de Bitmap Todos os tags

Benchmark de código aberto para OCR e extração de dados de LLMs

2025-04-01

Omni é uma ferramenta de benchmarking de código aberto que compara as capacidades de OCR e extração de dados de vários modelos multimodais grandes, como o gpt-4o, avaliando a precisão da extração de texto e JSON. Este benchmark fornece uma avaliação abrangente da precisão do OCR em provedores tradicionais de OCR e LLMs. O conjunto de dados e as metodologias são de código aberto, incentivando contribuições e expansão. O benchmark concentra-se na extração de JSON, medindo a precisão de todo o pipeline: Documento ⇒ OCR ⇒ Extração. Ele usa um json-diff modificado para precisão de JSON e distância de Levenshtein para similaridade de texto. A ferramenta suporta vários modelos, incluindo OpenAI, Google Gemini e Anthropic, com uma interface simples de linha de comando e saída JSON.

(github.com)

Desenvolvimento

O humilde pacote de gel de sílica: Herói não cantado das cadeias de suprimentos globais

Além da Dívida Técnica: Uma Reflexão sobre as 'Dívidas' Organizacionais