MicroGrad.jl:第一部分 - 链式法则

2024-08-30

本文是 Julia 自动微分系列文章的第一部分,概述了自动微分并定义了显式链式法则。文章首先介绍了自动微分在机器学习框架中的重要性,然后详细解释了 Julia 自动微分生态系统,包括 Flux.jl、ChainRules.jl 和 Zygote.jl 等关键软件包及其工作原理。文章重点介绍了 ChainRules.jl 的 rrule 函数,并通过多个例子演示了如何使用链式法则计算各种数学运算(如加减乘除、三角函数、多项式求值和矩阵乘法)的导数。文章最后通过多项式曲线拟合的例子,展示了如何使用链式法则进行梯度下降优化。

阅读更多
未分类 链式法则

覆盖所有生日

2024-07-27

本文探讨了在n个人群中,所有N个生日都被覆盖的概率,以及需要询问多少人才能获得所有生日的期望值。作者将其与优惠券收集者问题进行类比,并使用蒙特卡洛模拟和包含-排除原则公式进行了解释。结果表明,当n小于2364时,概率非常低;当n大于2364时,概率迅速上升。

阅读更多