xLSTM:扩展的长短期记忆网络

2024-05-08

本文介绍了扩展的长短期记忆网络(xLSTM),它对传统的LSTM进行了改进,包括采用指数门控和修改的内存结构。xLSTM包含两种变体:sLSTM采用标量内存和更新,mLSTM采用矩阵内存和协方差更新规则,可完全并行化。实验结果表明,xLSTM在性能和扩展性方面优于最先进的Transformer和状态空间模型。

42