Le nouveau modèle OCR de Mistral déçoit ; Google Gemini 2.0 prend les devants
Des tests récents révèlent que le nouveau modèle OCR spécifique de Mistral ne répond pas à ses affirmations promotionnelles. Les développeurs Willis et Doria mettent en évidence des problèmes de traitement des mises en page complexes et de l'écriture manuscrite, notamment la répétition des noms de villes, des erreurs numériques et des hallucinations. En revanche, Google Gemini 2.0 Flash Pro Experimental excelle, traitant des PDF complexes que Mistral ne parvient pas à gérer, y compris ceux contenant du contenu manuscrit. Sa grande fenêtre de contexte est un avantage clé. Bien que prometteur, l'OCR basé sur LLM souffre de problèmes tels que la fabrication d'informations, la mauvaise interprétation des instructions et l'interprétation générale incorrecte des données.