تعرف على الرموز باستخدام تقنية التعرف الضوئي على الحروف OCR: تحويل لقطات الشاشة إلى أكواد

2025-05-22
تعرف على الرموز باستخدام تقنية التعرف الضوئي على الحروف OCR: تحويل لقطات الشاشة إلى أكواد

قامت شركة Pieces بتحسين تقنية التعرف الضوئي على الحروف (OCR) لكي تتمكن من التعرف بدقة على الرموز من لقطات الشاشة. بناءً على محرك Tesseract، أضافوا خطوات ما قبل المعالجة وما بعد المعالجة للتعامل مع بيئات البرمجة المختلفة (الوضع الفاتح/الوضع الداكن)، والخلفيات الصاخبة، والصور منخفضة الدقة. عملية ما قبل معالجة الصور، بما في ذلك عكس الوضع الداكن، والحد من الضوضاء، وتحسين الدقة، بالإضافة إلى عملية ما بعد المعالجة لاستعادة مسافة البداية للرمز، تعمل على تحسين الدقة بشكل كبير. يستخدمون مسافة Levenshtein لتقييم أداء النموذج، واختاروا تجريبياً طريقة فعالة لزيادة حجم عينات الصور. تتيح هذه التقنية للمطورين تحويل لقطات الشاشة للرموز بسهولة إلى رموز قابلة للتحرير، مما يزيد من كفاءة التطوير.

اقرأ المزيد
التطوير

بروتوكول سياق النموذج (MCP): لحظة USB-C للذكاء الاصطناعي؟

2025-03-26
بروتوكول سياق النموذج (MCP): لحظة USB-C للذكاء الاصطناعي؟

يُحدث بروتوكول سياق النموذج (MCP) من أنثروبيك، الذي تم إصداره في أواخر عام 2024، ثورة في عالم الذكاء الاصطناعي. فكّر فيه على أنه منفذ USB-C لتكاملات الذكاء الاصطناعي: فهو يسمح لنماذج اللغات الكبيرة (LLMs) مثل كلود أو تشات جي بي تي بالتواصل بسلاسة مع مصادر البيانات الخارجية والأدوات (أوبسيديان، جيميل، التقويمات، إلخ) دون الحاجة إلى ملايين عمليات التكامل المخصصة. يستخدم MCP بنية ثلاثية الطبقات - مضيفين، وعملاء، وخوادم - للسماح بالوصول الآمن والموثوق إلى البيانات وتشغيل الإجراءات، مما يبسط عملية التطوير بشكل كبير ويولد تطبيقات مبتكرة. تتضمن الأمثلة توصيل LLMs بقواعد بيانات شخصية، ومستودعات رمزية، وحتى بيانات سوق الأسهم في الوقت الفعلي. لقد جعلت طبيعة MCP مفتوحة المصدر منه موضوعًا ساخنًا في مجتمع المطورين، مدمجًا في العديد من تطبيقات الذكاء الاصطناعي، وهو يبشر بتغيير ثوري في كيفية تفاعلنا مع تطبيقات الذكاء الاصطناعي.

اقرأ المزيد
الذكاء الاصطناعي

Phi-3-Mini من مايكروسوفت: نموذج لغة خفيف الوزن لتحسين التطوير

2024-12-28
Phi-3-Mini من مايكروسوفت: نموذج لغة خفيف الوزن لتحسين التطوير

كشفت مايكروسوفت عن Phi-3-Mini، وهو نموذج لغوي خفيف الوزن يوفر أداءً مشابهًا لـ GPT-3.5 على الأجهزة ذات الموارد المحدودة. تستعرض هذه المقالة نقاط قوته، بما في ذلك قدراته القوية في الاستدلال والترميز، وتكاملها السلس مع أدوات مثل Ollama و Pieces. تشغيل Phi-3-Mini محليًا عبر Ollama، بالإضافة إلى Pieces لإدارة شظايا التعليمات البرمجية، يبسط عملية إنشاء التعليمات البرمجية وإعادة هيكلتها، مما يعزز إنتاجية المطور. على الرغم من أن تجاوز سياق النصوص الطويلة لا يزال مشكلة، إلا أن طبيعة Phi-3-Mini الخفيفة ووظائفه القوية تجعله أداة قيّمة في تطوير الذكاء الاصطناعي.

اقرأ المزيد