大型语言模型不适合头脑风暴
2024-05-16
这篇文章认为,大型语言模型(LLM)不适合用于真正的头脑风暴。作者指出,LLM主要训练目标是模仿人类产生的语料库中现有的模式,而不是被教导如何“头脑风暴”。因此,LLM倾向于趋同于现有数据中的共识,而不是提出真正具有创新性的想法。文章还提出了一些潜在的解决方案,例如创建包含优质头脑风暴示例的微调数据集,以及使用RLAIF等方法迭代地批判LLM在创造力方面的回应。
未分类
头脑风暴