معيار مفتوح المصدر لـ OCR واستخراج البيانات من نماذج اللغات الكبيرة

2025-04-01
معيار مفتوح المصدر لـ OCR واستخراج البيانات من نماذج اللغات الكبيرة

أومي هي أداة قياس مفتوحة المصدر تقارن قدرات التعرف الضوئي على الحروف (OCR) واستخراج البيانات من نماذج اللغات الكبيرة متعددة الوسائط المختلفة مثل gpt-4o، وتقييم دقة استخراج كل من النصوص وجافا سكريبت (JSON). يوفر هذا المعيار تقييمًا شاملاً لدقة OCR عبر مزودي OCR التقليديين ونماذج اللغات الكبيرة. مجموعة البيانات والمنهجيات مفتوحة المصدر، مما يشجع على الإسهامات والتوسع. يركز المعيار على استخراج JSON، وقياس دقة خط الأنابيب الكامل: المستند ⇒ OCR ⇒ الاستخراج. يستخدم json-diff معدلاً لدقة JSON ومسافة Levenshtein لتشابه النص. تدعم الأداة نماذج متعددة، بما في ذلك OpenAI وGoogle Gemini وAnthropic، مع واجهة سطر أوامر بسيطة وإخراج JSON.

التطوير معيار