وضع المدى الطويل في Zstandard: إنجاز في ضغط الجينوم
2025-09-15
يعمل مُحدد المطابقة على المدى الطويل في Zstandard على تحسين كفاءة الضغط بشكل كبير للملفات الكبيرة من خلال زيادة نافذة البحث. أظهرت الاختبارات على مجموعة بيانات حجمها 2.6 تيرابايت تحتوي على 661.405 جينوم بكتيري أن Zstandard الافتراضي حقق نسبة ضغط تبلغ 3 فقط. أدى تمكين وضع --long إلى تحسين ذلك بشكل طفيف إلى 4. ومع ذلك، فإن إزالة علامات نهاية الأسطر من ملفات FASTA زادت النسبة بشكل كبير إلى 31، لتقترب من أداء ضواغط الحمض النووي المتخصصة، مما قلل من حجم الملف إلى 80 جيجابايت. على الرغم من زيادة وقت الضغط قليلاً، إلا أن هذا المكسب في الكفاءة يمثل تحسينًا قيّمًا في معالجة مجموعات البيانات الجينومية الكبيرة.
التكنولوجيا
ضغط الجينوم