معيار مفتوح المصدر لـ OCR واستخراج البيانات من نماذج اللغات الكبيرة
2025-04-01
أومي هي أداة قياس مفتوحة المصدر تقارن قدرات التعرف الضوئي على الحروف (OCR) واستخراج البيانات من نماذج اللغات الكبيرة متعددة الوسائط المختلفة مثل gpt-4o، وتقييم دقة استخراج كل من النصوص وجافا سكريبت (JSON). يوفر هذا المعيار تقييمًا شاملاً لدقة OCR عبر مزودي OCR التقليديين ونماذج اللغات الكبيرة. مجموعة البيانات والمنهجيات مفتوحة المصدر، مما يشجع على الإسهامات والتوسع. يركز المعيار على استخراج JSON، وقياس دقة خط الأنابيب الكامل: المستند ⇒ OCR ⇒ الاستخراج. يستخدم json-diff معدلاً لدقة JSON ومسافة Levenshtein لتشابه النص. تدعم الأداة نماذج متعددة، بما في ذلك OpenAI وGoogle Gemini وAnthropic، مع واجهة سطر أوامر بسيطة وإخراج JSON.
التطوير
معيار