Webtagr - Technology News Summarizer

Popular：

Virtualization DNS security formal verification reachability analysis compiler errors macro conflict web extension development framework Bitmap Graphics API inconsistencies All Tags

Transformer 的残差流如何表征信念状态几何

2024-06-01

本文探讨了 Transformer 在进行下一词预测训练时所构建的计算结构。研究表明，这种结构是由数据生成过程中隐藏状态的信念更新元动力学决定的。作者使用隐藏马尔可夫模型 (HMM) 来表征训练数据，并引入了混合状态表示 (MSP) 的概念来描述信念更新的元动力学。实验结果表明，Transformer 的残差流激活可以线性地表征 MSP 的几何结构，这意味着 Transformer 不仅学习了世界模型，还学习了同步到该模型的计算结构。

(www.lesswrong.com)

未分类信念状态计算力学