搜索技巧 海洋云增白 开源地图 AI 搜索答案 沙丘魔堡2 压缩机站 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 PostgreSQL AI工具 证券 DirectX DrawingPics 化学 KDE 披萨农场 多动症 植物学 分析化学 Three.js 大会 残疾人学校 初创 QB64 更多

谷歌DeepMind论文成本计算 (152334H.github.io)

本文分析了谷歌DeepMind论文“Scaling Exponents Across Parameterizations and Optimizers”中进行的所有实验,计算了复制该论文所需的总计算成本。作者详细分析了不同类型实验的计算量,包括对齐实验、学习率实验、Adam Epsilon实验等,并估算了每种实验所需的H100 GPU小时数。最终得出结论:该论文总共需要大约5.42e24 FLOPs,相当于1290万美元的H100租用费用,或747个H100节点月的计算时间。

评论已经关闭!