データサウルス・ダズン:統計の落とし穴を暴く

2024-12-17

13個のデータセット、ほぼ同一の単純な記述統計量を持つにもかかわらず、分布と可視化は大きく異なります!これが魅力的なデータサウルス・ダズンです。恐竜の形をしたデータセットと、様々な形状の他の12個のデータセットから構成され、すべてほぼ同一の平均値、分散、相関関係を共有しています。これは、基本的な記述統計にのみ依存することの危険性を明確に示しています。可視化が不可欠です。データサウルス・ダズンは、データアナリストに、誤解を招く結論を避けるために、分析の前に可視化を優先することを促す警告として役立ちます。