Softmax 永恒的魅力?一个关于对数谐波函数的深度思考

2025-02-20

十年前,作者在教授自然语言处理课程时,被学生问到softmax的替代方案。最近一篇论文提出对数谐波函数作为softmax的替代,引发了作者的深入思考。文章分析了softmax和对数谐波函数的偏导数,发现softmax的梯度具有良好的可解释性和收敛性,而对数谐波函数的梯度在原点附近存在奇异性,可能导致训练困难。作者认为,尽管如此,强大的优化器或许可以克服这些挑战,但对数谐波函数的改进空间仍值得探索。

阅读更多

NeurIPS'24:AI人才市场焦虑与转变

2024-12-24

NeurIPS'24会议上,许多即将毕业的博士生和博士后表达了对AI就业市场的焦虑和沮丧。这源于过去十年深度学习的快速发展,大型科技公司曾积极招聘AI博士生,提供优厚待遇和研究自由。然而,随着大规模语言模型等技术的成熟和产品化,对博士生的需求下降,大学也开始培养本科生和硕士生掌握相关技能。这种转变使得许多博士生感到被“时代抛弃”,其研究方向与市场需求脱节,未来的职业前景充满不确定性。作者对此表示理解和歉意,并指出AI领域还有许多重要研究方向值得探索,并非只有大规模语言模型。

阅读更多