La Docena de Datasaurus: Exponiendo las Trampas de la Estadística

2024-12-17

Trece conjuntos de datos, con estadísticas descriptivas simples casi idénticas, ¡pero con distribuciones y visualizaciones muy diferentes! Esta es la fascinante Docena de Datasaurus. Compuesta por un conjunto de datos con forma de dinosaurio y otros doce con formas variadas, todos comparten casi las mismas medias, varianzas y correlaciones. Esto demuestra poderosamente el peligro de depender únicamente de estadísticas descriptivas básicas; la visualización es crucial. La Docena de Datasaurus sirve como una advertencia, instando a los analistas de datos a priorizar la visualización antes del análisis para evitar conclusiones engañosas.