تعزيز البحث باستخدام نماذج اللغات الكبيرة: نهجٌ رخيصٌ وسريع

العلامات الشائعة：

الافتراضية أمان DNS التحقق الرسمي تحليل قابلية الوصول أخطاء المترجم تضارب الماكرو امتدادات الويب إطار عمل تطوير كومودور 64 بياسيك 2.0 جميع العلامات

2025-04-09

تُظهر هذه المقالة كيفية بناء خدمة بحث سريعة وفعّالة من حيث التكلفة باستخدام نماذج اللغات الكبيرة (LLMs). يقوم الكاتب بنشر تطبيق FastAPI الذي يستدعي نموذج LLM خفيف الوزن (Qwen2-7B) ، مستفيدًا من Google Kubernetes Engine (GKE) Autopilot لإدارة العناقيد الآلية لتحقيق تحليل مُهيكل لاستعلامات البحث. يُحسّن إنشاء ونشر صور Docker ، بالإضافة إلى آلية التخزين المؤقت Valkey ، الأداء والقابليّة للتطوير بشكل كبير. يتجنب هذا النهج المكالمات المتكررة إلى واجهات برمجة التطبيقات السحابية باهظة الثمن ، مما يُقلّل التكاليف ويُظهر إمكانية تشغيل LLMs على البنية التحتية المحليّة ، مُقدّماً منظورًا جديدًا لبناء محركات بحث أكثر ذكاءً وسرعةً.

التطوير