Benchmark OmniAI OCR : LLMs contre OCR traditionnel
2025-02-23
OmniAI a publié un benchmark OCR open source comparant la précision, le coût et la latence des fournisseurs d'OCR traditionnels et des modèles linguistiques de vision (VLMs). Testé sur 1 000 documents réels, les résultats montrent que les VLMs comme Gemini 2.0 surpassent la plupart des fournisseurs d'OCR traditionnels sur les documents contenant des graphiques, de l'écriture manuscrite et des champs d'entrée complexes, mais les modèles traditionnels excellent sur les pages de texte à haute densité. Cependant, les VLMs sont plus coûteux et plus lents. Ce benchmark continu sera mis à jour régulièrement avec de nouveaux ensembles de données pour garantir l'équité et la représentativité.
Lire plus
IA