من الخطوط العشوائية إلى الأرقام القابلة للتعرف عليها: بناء نموذج توليد صور ذاتية الانحدار
2025-06-08

تتناول هذه المقالة بالتفصيل بناء نموذج أساسي لتوليد الصور ذاتية الانحدار باستخدام مُعالج متعدد الطبقات (MLP) لإنشاء صور لأرقام مكتوبة بخط اليد. يشرح الكاتب المفهوم الأساسي المتمثل في التنبؤ بالبكسل التالي بناءً على ما سبقه. يتم بناء ثلاثة نماذج تدريجيًا: يستخدم النموذج V1 ترميزًا واحدًا ساخنًا ويتجاهل المعلومات المكانية ؛ يُدخِل النموذج V2 ترميزات مكانية ، مما يحسّن بنية الصورة ؛ يستخدم النموذج V3 تضمينات الرموز المُتعلمة والترميزات المكانية ، ويحقق توليدًا مشروطًا ، حيث يُنشئ صورًا بناءً على فئة رقم معينة. على الرغم من أن الصور المُنشأة تقلّ جودتها عن نماذج الحالة الفنية ، إلا أن البرنامج التعليمي يُظهر بوضوح المفاهيم الأساسية ذاتية الانحدار وعملية البناء ، مما يوفر رؤى قيّمة حول الذكاء الاصطناعي التوليدي.
الذكاء الاصطناعي
نموذج ذاتي الانحدار