RepoRoulette: أخذ عينات عشوائية من مستودعات GitHub

2025-05-20
RepoRoulette: أخذ عينات عشوائية من مستودعات GitHub

RepoRoulette أداة قوية لأخذ عينات عشوائية من مستودعات GitHub، وتوفر ثلاث طرق مميزة: أخذ عينات حسب المعرف، وأخذ عينات زمنيًا، وأخذ عينات باستخدام BigQuery. أخذ العينات حسب المعرف يختار معرفات عشوائية مباشرة من مساحة معرفات GitHub، مما يوفر سرعة لكن بنسبة نجاح منخفضة. أخذ العينات الزمني يختار المستودعات التي تم تحديثها خلال فترة زمنية محددة، مما يسمح بالتصفية حسب عدد النجوم واللغات وما إلى ذلك. أخذ العينات باستخدام BigQuery يستخدم مجموعة بيانات GitHub العامة من Google BigQuery، مما يوفر إمكانيات قوية لكنه يتطلب حساب GCP والفوترة. RepoRoulette مناسب للبحث الأكاديمي، وموارد التعلم، وعلوم البيانات، وتحليل الاتجاهات، وبحث الأمن.