Meta AI提出COCONUT:连续思想链提升大型语言模型推理能力

2024-12-31
Meta AI提出COCONUT:连续思想链提升大型语言模型推理能力

Meta AI提出了一种名为COCONUT(连续思想链)的新方法,以改进大型语言模型(LLM)的推理能力。不同于传统的基于文本的Chain-of-Thought(CoT)方法,COCONUT允许LLM在连续的潜在空间中进行推理,从而避免了语言表达的限制。研究表明,COCONUT在需要复杂规划的任务中表现出色,展现出类似广度优先搜索(BFS)的推理模式。其多阶段训练过程逐步引导模型学习在潜在空间中进行推理,最终提升了模型的推理准确性和效率。

阅读更多
AI