CURLoRA：利用CUR矩阵分解实现稳定的LLM持续微调和灾难性遗忘缓解

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

2024-07-14

本文介绍了CURLoRA，这是一种利用CUR矩阵分解在低秩适应（LoRA）环境中微调大型语言模型（LLM）的新方法。该方法解决了LLM微调中的两个关键挑战：在持续学习期间减轻灾难性遗忘和减少可训练参数的数量。

(zenodo.org)

未分类 CUR矩阵分解灾难性遗忘