Benchmark OmniAI OCR: LLMs vs. OCR Tradicional
2025-02-23
OmniAI lanzó un benchmark OCR de código abierto que compara la precisión, el costo y la latencia de los proveedores de OCR tradicionales y los modelos de lenguaje de visión (VLMs). Tras realizar pruebas con 1.000 documentos del mundo real, los resultados muestran que los VLMs como Gemini 2.0 superan a la mayoría de los proveedores de OCR tradicionales en documentos con gráficos, escritura a mano y campos de entrada complejos, pero los modelos tradicionales sobresalen en páginas de texto de alta densidad. Sin embargo, los VLMs son más costosos y lentos. Este benchmark continuo se actualizará regularmente con nuevos conjuntos de datos para garantizar la equidad y la representatividad.
Leer más
IA