فشل ذكاء أليكسا من أمازون: دراسة حالة حول الهشاشة

2025-06-11
فشل ذكاء أليكسا من أمازون: دراسة حالة حول الهشاشة

تحلّل هذه المقالة أسباب تأخر أليكسا من أمازون عن منافسيها في مجال نماذج اللغات الكبيرة، مُعرّفةً ذلك على أنه فشل "هشاشة" ضمن هندسة المرونة. يبرز الكاتب ثلاثة عوامل مُساهمة رئيسية: تخصيص غير فعال للموارد، مما يُعيق الوصول في الوقت المناسب إلى الموارد الحاسوبية الحيوية؛ وهيكل تنظيمي لامركزي للغاية يُشجّع على عدم مواءمة أهداف الفريق والنزاعات الداخلية؛ ونهج مُركز على العميل عتيق، غير مُلائم لطبيعة البحث في مجال الذكاء الاصطناعي التجريبية والطويلة الأمد. وقد أدّت هذه العوامل مجتمعة إلى تراجع ذكاء أليكسا من أمازون، مُقدّمةً دروسًا قيّمة حول الهيكل التنظيمي وإدارة الموارد.

اقرأ المزيد
الذكاء الاصطناعي

ما وراء تحليل السببية الجذرية: هندسة المرونة لأعطال الأنظمة المعقدة

2025-05-24
ما وراء تحليل السببية الجذرية: هندسة المرونة لأعطال الأنظمة المعقدة

ينتقد هذا المقال قيود تحليل السببية الجذرية (RCA) في تحليل أعطال الأنظمة المعقدة، بحجة أن نموذج سلسلة السببية الخاطئ فيه يفشل في معالجة الأعطال التي تسببها تفاعلات عوامل متعددة في الأنظمة المعقدة بشكل فعال. يقترح الكاتب هندسة المرونة (RE) كبديل. تركز RE على التفاعلات بين مكونات النظام بدلاً من الأسباب الفردية. تعترف RE بأن الأنظمة تحتوي دائمًا على العديد من الأعطال الكامنة؛ يكمن النجاح في القدرة التكيفية وتسامح النظام مع الأخطاء. من خلال فهم كيفية تكيف النظام والتعامل مع الأعطال، بدلاً من مجرد القضاء على أسباب الجذر، يتم تحقيق تحسينات مستمرة ومرونة أعلى للنظام.

اقرأ المزيد

FizzBee: نمذجة الاستبعاد المتبادل ومكامن الخطر في Redlock

2025-03-22
FizzBee: نمذجة الاستبعاد المتبادل ومكامن الخطر في Redlock

تتناول هذه المقالة تجربة الكاتب في استخدام FizzBee، وهي لغة مواصفات رسمية جديدة مبنية على Starlark، لنمذجة خوارزميات الاستبعاد المتبادل والتحقيق في المشاكل المتعلقة بخوارزمية Redlock. من خلال نمذجة الأقسام الحرجة، والأقفال، والإيجارات، ورموز السياج، يكشف الكاتب عن قيود تحمل Redlock للأخطاء، مما يدل في النهاية على أن رموز السياج لا تحل مشاكل الاستبعاد المتبادل تمامًا. يختتم الكاتب بمناقشة سهولة استخدام FizzBee ونقاط ضعفها مع تسليط الضوء على أهمية المواصفات الرسمية في تصميم الخوارزميات. وقد كشف التمرين العملي بشكل غير متوقع عن عيوب دقيقة في فهم الكاتب لرموز السياج، مما يؤكد أهمية الأساليب الرسمية.

اقرأ المزيد

تجاهل الحوادث التي كادت تحدث: خطر خفي على شركات التكنولوجيا

2025-02-08
تجاهل الحوادث التي كادت تحدث: خطر خفي على شركات التكنولوجيا

تكشف بيانات FAA عن 30 حادثًا كاد أن يحدث في مطار ريغان. وتجادل هذه المقالة بأن شركات التكنولوجيا غالبًا ما تعطي الأولوية لمنع الحوادث الكبرى، متجاهلةً العديد من الحوادث التي كادت تحدث والتي قد تتفاقم. الحوادث التي كادت أن تحدث، وهي سلائف للحوادث الكبيرة، غالبًا ما تُتجاهل نظرًا لعدم تأثيرها. يدعو الكاتب إلى التعامل مع الحوادث التي كادت أن تحدث بنفس الجدية التي تُعامل بها الحوادث الكبرى، من خلال إنشاء آليات للكشف عنها وتحليلها استباقيًا. ويتطلب ذلك تغييرًا ثقافيًا، يشجع على الإبلاغ عنها وتحليلها من أجل تحسين الموثوقية.

اقرأ المزيد
التكنولوجيا الموثوقية

تعطل Canva: قصة التشبع والمرونة

2025-01-12
تعطل Canva: قصة التشبع والمرونة

عانت Canva مؤخرًا من انقطاع كبير ناتج عن تشبع النظام. لم يكن نشر إصدار جديد من صفحة المحرر هو السبب؛ بدلاً من ذلك، تسببت قاعدة قديمة في Cloudflare CDN في حدوث تأخير هائل للمستخدمين الآسيويين الذين يقومون بتحميل ملفات Javascript. أدى ذلك إلى أكثر من 270,000 طلب متزامن، مما أدى إلى إغراق بوابة واجهة برمجة التطبيقات بمقدار 1.5 مليون طلب في الثانية - ثلاثة أضعاف ذروتها المعتادة. وقد تفاقم هذا الأمر بسبب مشكلة أداء معروفة ولكن لم يتم إصلاحها في بوابة واجهة برمجة التطبيقات. قام قاتل ذاكرة OOM في نظام Linux بإنهاء جميع مهام بوابة واجهة برمجة التطبيقات، مما أدى إلى تعطل Canva.com بالكامل. قام مهندسو Canva بحل المشكلة عن طريق زيادة عدد المهام يدويًا، ومنع حركة المرور مؤقتًا باستخدام قواعد جدار الحماية Cloudflare، واستعادة حركة المرور تدريجيًا. يبرز هذا الحادث أهمية مرونة النظام والعيوب المحتملة للأنظمة الآلية تحت حمولة ثقيلة.

اقرأ المزيد

مستقبل تصميم لوحات المعلومات؟

2024-12-23
مستقبل تصميم لوحات المعلومات؟

تتناول هذه المقالة أوجه القصور في تصميم لوحات المعلومات الحالية. ويشير الكاتب إلى أن لوحات المعلومات الحالية غالباً ما تكون مصممة بشكل سيئ، ولا تستغل النظام البصري البشري بكفاءة لمعالجة كميات كبيرة من المعلومات. وتستعرض المقالة أبحاث هندسة النظم المعرفية من الثمانينيات والتسعينيات حول تصميم لوحات المعلومات، مثل تصميم الواجهة البيئية والزخم البصري، وتلاحظ عدم تركيز الصناعة الحالي على تحسين تصميم لوحات المعلومات. ويدعو الكاتب إلى إيلاء المزيد من الاهتمام لتصميم لوحات المعلومات، من أجل دمج وظائف الاستعلام بشكل أفضل وتحسين كفاءة معالجة المعلومات.

اقرأ المزيد

انقطاع خدمة كبير في OpenAI: خدمة قياس عن بُعد جديدة تسبب تعطلاً رئيسيًا

2024-12-16
انقطاع خدمة كبير في OpenAI: خدمة قياس عن بُعد جديدة تسبب تعطلاً رئيسيًا

شهدت OpenAI انقطاعًا كبيرًا في الخدمة في 11 ديسمبر، ناجمًا عن خدمة قياس عن بُعد جديدة تم نشرها مؤخرًا. وتهدف هذه الخدمة إلى تحسين الموثوقية، لكنها ولّدت بشكل غير متوقع حملًا هائلاً على خوادم واجهة برمجة التطبيقات Kubernetes، مما أدى إلى تشبع الخوادم وتسبب في تعطل مستوى التحكم في Kubernetes في معظم العناقيد الكبيرة. وقد أدى ذلك إلى تعطل آلية اكتشاف الخدمات القائمة على DNS. يُبرز الحادث التفاعلات غير المتوقعة داخل الأنظمة المعقدة، وتحديات اختبار أوضاع الفشل التي تظهر فقط عند التحميل الكامل. استعادت OpenAI الخدمة من خلال تقليل حجم العناقيد، وحظر الوصول إلى شبكة واجهات برمجة التطبيقات الإدارية Kubernetes، وزيادة عدد خوادم واجهة برمجة التطبيقات.

اقرأ المزيد