نموذج Mistral OCR الجديد مخيب للآمال ؛ Google Gemini 2.0 يتصدر
2025-03-11

تكشف الاختبارات الحديثة أن نموذج Mistral OCR الجديد المخصص لا يفي بوعوده التسويقية. ويبرز المطوران Willis و Doria مشاكل في معالجة التصاميم المعقدة والخط اليدوي، بما في ذلك تكرار أسماء المدن، والأخطاء العددية، والهلوسات. على النقيض من ذلك، يتفوق Google Gemini 2.0 Flash Pro Experimental، ويعالج ملفات PDF المعقدة التي لا يستطيع Mistral معالجتها، بما في ذلك تلك التي تحتوي على محتوى مكتوب بخط اليد. تُعد نافذة السياق الكبيرة ميزة رئيسية. على الرغم من كونه واعدًا، إلا أن OCR القائم على LLM يعاني من مشاكل مثل اختلاق المعلومات، وسوء تفسير التعليمات، وسوء تفسير البيانات بشكل عام.
الذكاء الاصطناعي