QB64 搜索技巧 核手提箱 文字记录 海洋云增白 开源地图 Bliss AI 搜索答案 深海沉船 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 世界 PostgreSQL AI工具 证券 DirectX 防溢 DrawingPics Zulip 儿童读物 化学 连续滚动 代码审查 三菱电机 更多

xLSTM:扩展的长短期记忆网络 (arxiv.org)

本文介绍了扩展的长短期记忆网络(xLSTM),它对传统的LSTM进行了改进,包括采用指数门控和修改的内存结构。xLSTM包含两种变体:sLSTM采用标量内存和更新,mLSTM采用矩阵内存和协方差更新规则,可完全并行化。实验结果表明,xLSTM在性能和扩展性方面优于最先进的Transformer和状态空间模型。

评论已经关闭!