Meta 的 Llama 3.1 模型被发现大量记忆版权书籍

2025-06-15
Meta 的 Llama 3.1 模型被发现大量记忆版权书籍

最新研究显示,Meta 的 Llama 3.1 70B 大型语言模型惊人地记忆了大量书籍内容,例如《哈利·波特与魔法石》的 42%。这比其前代模型 Llama 1 65B 高出许多,引发了对 AI 版权的严重担忧。研究人员通过计算模型生成特定文本序列的概率,而非实际生成大量文本,高效地评估了模型的“记忆”能力。这一发现可能对 Meta 面临的版权诉讼产生重大影响,并可能促使法院重新审视 AI 模型训练中合理使用的界限。虽然该模型对一些冷门书籍的记忆较少,但对热门书籍的过度记忆,凸显了大型语言模型在版权问题上的挑战。