تعزيز البحث باستخدام نماذج اللغات الكبيرة: نهجٌ رخيصٌ وسريع
2025-04-09
تُظهر هذه المقالة كيفية بناء خدمة بحث سريعة وفعّالة من حيث التكلفة باستخدام نماذج اللغات الكبيرة (LLMs). يقوم الكاتب بنشر تطبيق FastAPI الذي يستدعي نموذج LLM خفيف الوزن (Qwen2-7B) ، مستفيدًا من Google Kubernetes Engine (GKE) Autopilot لإدارة العناقيد الآلية لتحقيق تحليل مُهيكل لاستعلامات البحث. يُحسّن إنشاء ونشر صور Docker ، بالإضافة إلى آلية التخزين المؤقت Valkey ، الأداء والقابليّة للتطوير بشكل كبير. يتجنب هذا النهج المكالمات المتكررة إلى واجهات برمجة التطبيقات السحابية باهظة الثمن ، مما يُقلّل التكاليف ويُظهر إمكانية تشغيل LLMs على البنية التحتية المحليّة ، مُقدّماً منظورًا جديدًا لبناء محركات بحث أكثر ذكاءً وسرعةً.
التطوير