El nuevo modelo OCR de Mistral decepciona; Google Gemini 2.0 toma la delantera
2025-03-11
Pruebas recientes revelan que el nuevo modelo OCR específico de Mistral no cumple con sus afirmaciones promocionales. Los desarrolladores Willis y Doria destacan problemas al manejar diseños complejos y escritura manuscrita, incluyendo la repetición de nombres de ciudades, errores numéricos y alucinaciones. En contraste, Google Gemini 2.0 Flash Pro Experimental sobresale, procesando PDFs complejos que superan a Mistral, incluidos aquellos con contenido manuscrito. Su gran ventana de contexto es una ventaja clave. Si bien es prometedor, el OCR basado en LLM sufre problemas como la fabricación de información, la mala interpretación de instrucciones y la mala interpretación general de datos.
IA