خدمة استخراج المستندات الجديدة من أندرو نغ: تحديات الدقة

2025-02-28
خدمة استخراج المستندات الجديدة من أندرو نغ: تحديات الدقة

أصبحت خدمة استخراج المستندات الجديدة التي أطلقها أندرو نغ شائعة على منصة إكس، لكن اختبارات Pulse كشفت عن مشاكل كبيرة في التعامل مع البيانات المالية المعقدة، بما في ذلك أكثر من 50% من القيم الوهمية، وغياب علامات الطرح ورموز العملات. وتجادل المقالة بأن هذه الأخطاء قد تكون كارثية للقطاعات التي تعتمد على دقة البيانات، مثل القطاع المالي. ويقدم حل Pulse مزيجًا من تقنيات الرؤية الحاسوبية التقليدية ونماذج محول الجداول الخاصة، مما يحقق دقة أعلى وانخفاضًا في زمن الاستجابة، ويعالج الطبيعة غير الحتمية، وضعف الوعي المكاني، وبطء معالجة نماذج اللغات الكبيرة (LLMs) في استخراج المستندات.

اقرأ المزيد
الذكاء الاصطناعي استخراج المستندات أندرو نغ

نماذج اللغات الكبيرة تفشل في التعرف الضوئي على الحروف المعقدة: لماذا تكافح نماذج اللغات الكبيرة مع ملفات PDF؟

2025-02-07
نماذج اللغات الكبيرة تفشل في التعرف الضوئي على الحروف المعقدة: لماذا تكافح نماذج اللغات الكبيرة مع ملفات PDF؟

اكتشفت شركة Pulse، التي تهدف إلى استخراج البيانات من جداول البيانات و ملفات PDF، قيدًا بالغ الأهمية في استخدام نماذج اللغات الكبيرة (LLMs) للتعرف الضوئي على الحروف (OCR). في حين أن نماذج LLMs تتفوق في توليد النصوص والتلخيص، إلا أنها تفشل بشكل كبير عند التعامل مع ملفات PDF والجدول المعقدة. الطبيعة الاحتمالية لنماذج LLMs ومعالجتها المجردة للصور تؤدي إلى الهلوسة، وفقدان البيانات، و سوء التفسير، مما يشكل مخاطر كبيرة، خاصة مع البيانات المالية والطبية. علاوة على ذلك، فإن نماذج LLMs معرضة لهجمات حقن المطالبات، مما يثير مخاوف تتعلق بالأمان والأخلاقيات. تخلت Pulse في النهاية عن نماذج LLMs لـ OCR، وهي تعمل على تطوير حل مخصص يدمج خوارزميات رؤية الكمبيوتر التقليدية ومحولات الرؤية.

اقرأ المزيد