تحسين توليد الصور من OpenAI باستخدام الذكاء الاصطناعي: تجربة تحسين متكررة

العلامات الشائعة：

الافتراضية أمان DNS التحقق الرسمي تحليل قابلية الوصول أخطاء المترجم تضارب الماكرو امتدادات الويب إطار عمل تطوير كومودور 64 بياسيك 2.0 جميع العلامات

2025-05-21

تتناول هذه المقالة تجربة استخدام نماذج اللغة الكبيرة (LLMs) لتحسين جودة الصور التي تولدها واجهة برمجة التطبيقات (API) من OpenAI بشكل متكرر. بدءًا من موجه معقد، وجد الباحثون أن الصور الناتجة تعاني من غموض النص وضعف الجاذبية البصرية. تم اختبار نهجين: الأول، استخدام نموذج لغة كبير كـ«حكم» لتحديد وإصلاح عيوب الصورة بشكل متكرر، لكن هذا ثبت أنه غير فعال لأن نموذج اللغة الكبير واجه صعوبة في التعامل مع المهام الإبداعية والتقنية في وقت واحد. والثاني، استخدام نموذج لغة كبير لإنشاء مربعات حدودية حول النص الغامض للتحرير الموجه، لكن نموذج اللغة الكبير واجه صعوبة في تحديد الموقع بدقة. في النهاية، أدى فصل تحسين وضوح النص عن تحسين جودة الصورة الإجمالية إلى نتائج أفضل.