数值精度如何影响大型语言模型的数学推理能力

数值精度如何影响大型语言模型的数学推理能力 (arxiv.org)

原文: [2410.13857] How Numerical Precision Affects Mathematical Reasoning Capabilities of LLMs

这篇论文研究了数值精度对基于Transformer的大型语言模型（LLM）数学推理能力的影响。研究发现，低数值精度的Transformer模型在处理迭代加法和整数乘法等算术任务时表现不佳，除非模型规模相对于输入长度呈超多项式增长。相比之下，具有标准数值精度的Transformer模型可以用小得多的模型规模有效地处理这些任务。

数值精度

上一篇: 美国联邦贸易委员会禁止虚假网络评论新规生效

下一篇: Anthropic 推出 Claude 3.5：具备计算机使用能力的新一代 AI 模型

评论已经关闭！

返回首页