ما وراء RAG: استدعاء أدوات LLM يعلن عن عصر جديد للبحث الدلالي

تتناول هذه المقالة طرق تنفيذ البحث الدلالي، خاصةً باستخدام نماذج اللغات الكبيرة (LLMs) للبحث عن الاندماجات المتجهة. على الرغم من أن دمج مصطلحات البحث الخاصة بالمستخدم والوثائق مباشرةً قد يؤدي أحيانًا إلى نتائج دون المستوى الأمثل، إلا أن التقنيات الجديدة مثل Nomic Embed Text v2 تعمل على تحسين أساليب الاندماج، مما يقرب الأسئلة والإجابات في الفضاء المتجهي. علاوة على ذلك، يمكن لـ LLMs توليد إجابات محتملة، ثم استخدام هذه الاندماجات للبحث عن وثائق ذات صلة. كما تقدم المقالة أنظمة توليد معززة بالاسترجاع (RAG) تعتمد على LLMs، وتؤكد على أن RAG لا تعتمد على الاندماجات المتجهة، ويمكن دمجها مع البحث عن الكلمات الرئيسية أو أنظمة البحث الهجينة. يجادل الكاتب بأنه على الرغم من ظهور نماذج السياق الطويل، إلا أن RAG لن تختفي لأن كمية البيانات ستتجاوز دائمًا سعة سياق النموذج. يفضل الكاتب نهج استدعاء أدوات LLM، كما هو موضح في o3 و o4-mini، معتقدًا أنه أكثر فعالية من RAG التقليدي (استرجاع واحد يتبعه إجابة مباشرة).