مقارنة OmniAI OCR: نماذج اللغات الضخمة مقابل تقنية OCR التقليدية
2025-02-23
أصدرت OmniAI معيارًا مفتوح المصدر لتقنية التعرف الضوئي على الأحرف (OCR) يقارن دقة وتكلفة وزمن استجابة مزودي تقنية OCR التقليدية ونماذج لغة الرؤية (VLMs). أظهرت الاختبارات التي أجريت على 1000 وثيقة من العالم الحقيقي أن نماذج VLMs مثل Gemini 2.0 تتفوق على معظم مزودي تقنية OCR التقليدية في الوثائق التي تحتوي على رسوم بيانية وخطوط يدوية وحقول إدخال معقدة، لكن النماذج التقليدية تفوقت في صفحات النصوص عالية الكثافة. ومع ذلك، فإن نماذج VLMs أغلى ثمناً وأبطأ. سيتم تحديث هذا المعيار المستمر بانتظام بمجموعات بيانات جديدة لضمان الإنصاف والتمثيل.
اقرأ المزيد
الذكاء الاصطناعي