دزينة Datasaurus: الكشف عن مصائد الإحصاءات

2024-12-17

ثلاث عشرة مجموعة بيانات، إحصائيات وصفية بسيطة متطابقة تقريبًا، ولكن بتوزيعات وتصورات مختلفة جدًا! هذه هي دزينة Datasaurus الرائعة. تتكون من مجموعة بيانات على شكل ديناصور واثني عشر أخرى بأشكال متنوعة، جميعها تشترك تقريبًا في نفس المتوسطات والانحرافات المعيارية ودرجات الارتباط. هذا يوضح بوضوح خطر الاعتماد فقط على الإحصائيات الوصفية الأساسية؛ التصور أمر بالغ الأهمية. تُعد دزينة Datasaurus بمثابة تحذير، وتحث محللي البيانات على إعطاء الأولوية للتصور قبل التحليل لتجنب استنتاجات مضللة.