بناء محرك بحث مدونة من الصفر باستخدام Word2Vec
2025-05-20
قام المؤلفان ببناء محرك بحث مدونة من الصفر باستخدام بايثون و Word2Vec. تم دمج المنشورات واستفسارات البحث في فضاء متجه ثلاثي الأبعاد، ويتم استخدام تشابه جيب التمام لترتيب النتائج. لجعله مناسبًا للويب، تم تقسيم نموذج Word2Vec إلى فهرس ومتجهات، مع استخدام طلبات HTTP Range لتحميل البيانات الضرورية فقط، مما يقلل من عبء الويب بشكل كبير. تم تصميم مقياس تقييم لتقييم دقة محرك البحث، وتم مناقشة التحسينات المستقبلية، مثل استخدام TF-IDF للحد من الضوضاء.
التطوير
متجهات الكلمات