颠覆Transformer的相似性度量:基于Tversky相似性的神经网络

2025-08-17
颠覆Transformer的相似性度量:基于Tversky相似性的神经网络

这篇论文提出了一种基于Tversky相似性的神经网络,挑战了深度学习中常用的点积或余弦相似性度量方法。它巧妙地将Tversky模型中传统的离散集合运算转化为可微分函数,从而能够在深度学习框架下进行训练。实验结果表明,这种新的神经网络在图像识别和语言建模任务中取得了显著的性能提升,同时具备良好的可解释性,能够直观地解释模型的决策过程。其核心创新在于使用一个可微分的Tversky相似性函数,该函数考虑了特征的共同性和独特性,更符合人类对相似性的认知。