فرز القاعدة يتفوق على جداول التجزئة: مقارنة أداء لعد القيم الفريدة

2025-09-11
فرز القاعدة يتفوق على جداول التجزئة: مقارنة أداء لعد القيم الفريدة

في مشكلة عد القيم الفريدة في مصفوفة كبيرة من قيم uint64 الفريدة بشكل أساسي، يكون فرز القاعدة، عند ضبطه بشكل جيد، أسرع عادةً من جداول التجزئة. من خلال استخدام عرض النطاق الترددي للذاكرة بكفاءة ودمج التجزئة بذكاء مع عملية الفرز، يحقق فرز القاعدة تسريعًا يصل إلى 1.5 مرة مقارنةً بجداول التجزئة المُحسّنة لمجموعات البيانات الأكبر من 1 ميجابايت، وحتى أسرع بأربعة أضعاف من جداول التجزئة الممتازة "Swiss Table" في Rust. ومع ذلك، يتدهور أداء فرز القاعدة مع توزيعات البيانات غير المنتظمة؛ حيث يساعد استخدام دالة تجزئة قابلة للعكس في معالجة البيانات مسبقًا للحفاظ على الكفاءة. تقارن المقالة كلا الأسلوبين في أحجام البيانات المختلفة وترددات الوصول، وتناقش استراتيجية الاختيار بينهما في التطبيقات الواقعية.

التطوير جداول التجزئة