مقياس جديد يكشف عن اختناق الأتمتة في التعرف الضوئي على الحروف (OCR): تحقيق دقة 98٪
2025-03-14
إن تدفق اللاعبين الجدد في مجال التعرف الضوئي على الحروف (OCR) مثل Mistral وعروض Andrew Ng يجعل من الصعب على الشركات التمييز بين التطورات الحقيقية والمبالغات. تركز المقاييس الحالية على دقة التعرف الضوئي على الحروف (OCR) واستخراج المعلومات، متجاهلة مستويات الأتمتة. تقدم Nanonets مقياسًا جديدًا يركز على الأتمتة بدقة 98٪. باستخدام مجموعة بيانات من 1000 صورة و 16639 نقطة بيانات مُعلّمة، يقيسون أداء النموذج بناءً على درجات الثقة - نسبة البيانات التي تتم معالجتها بدقة دون تدخل بشري. بينما تتفوق نماذج اللغات الكبيرة في الدقة العامة، إلا أن درجات الثقة الموثوقة تظل بعيدة المنال. حقق Gemini 2.0 Flash دقة 98٪، لكنه أتمتة 8٪ فقط من البيانات. يهدف هذا المقياس إلى مساعدة الشركات في إيجاد حلول تقلل بالفعل من الجهد اليدوي في معالجة المستندات.
اقرأ المزيد
التطوير
المقياس