避免P值作弊:启动公司中统计陷阱的揭秘

2025-06-21
避免P值作弊:启动公司中统计陷阱的揭秘

初创公司为快速发布产品承受着巨大的压力,这导致团队倾向于报告任何看起来像改进的结果,从而导致p值作弊。本文分析了三种常见的p值作弊案例:未经校正的多重比较、结果出来后重新定义指标以及在获得预期结果前多次运行实验。文章强调了预先注册假设和指标、避免事后挖掘指标、在测试多个变量时使用校正以及在提前查看结果时应用适当阈值的重要性,并建议庆祝明确的负面结果,最终目的是通过更严格的统计实践来加速学习,避免发布无效信息,建立对驱动用户行为因素的真正理解。

阅读更多
开发

线性回归与梯度下降:从房屋定价到深度学习

2025-05-08
线性回归与梯度下降:从房屋定价到深度学习

本文以房屋定价为例,深入浅出地讲解了线性回归和梯度下降算法。线性回归通过寻找最佳拟合直线来预测房价,而梯度下降则是一种迭代算法,用于找到最小化误差函数的最佳参数。文章比较了绝对误差和平方误差,解释了为什么平方误差在梯度下降中更有效,因为它保证了误差函数的平滑性,从而避免了局部最优解。最终,文章将这些概念与深度学习联系起来,指出深度学习的本质也是通过调整参数来最小化误差。

阅读更多

Briefer:云端协作数据平台

2024-07-23

Briefer 是一款支持 SQL、Python 的云端笔记本工具,它提供文件树、块和标签、文件和数据库、自动数据帧、AI 助手、计划任务、快照和版本控制、评论和共享、笔记本到仪表板等功能。您可以使用 Briefer 查询数据、创建可视化图表、编写 Python 代码、安排笔记本运行时间、与团队成员共享和协作,并将笔记本输出用于创建仪表板。

阅读更多
未分类 云端笔记本

自助式商业智能的迷思与真相

2024-06-11
自助式商业智能的迷思与真相

这篇文章批判了自助式商业智能(BI)的理念,认为即使技术门槛降低,非技术人员也缺乏理解和运用数据的上下文和语义知识。作者分析了两种自助式BI的尝试:下拉菜单和文本转SQL,并指出它们的局限性。作者认为真正的解决方案是让技术人员使用更灵活、高效的工具来支持业务人员,例如结合LLM、Python、R等工具,并简化数据分析结果的分享流程。

阅读更多
未分类

对数:简明入门指南

2024-05-09
对数:简明入门指南

该网站提供对数的全面概述,包括概念、历史、性质、公式和应用。它用易于理解的语言编写,并提供了大量的示例和图表来帮助理解。该网站还探讨了对数在不同领域的应用,如数学、科学和计算机科学。

阅读更多
未分类 对数