大型语言模型的无限工具使用范式
2025-05-25
本文提出了一种全新的大型语言模型(LLM)范式:无限工具使用。该范式建议LLM只输出工具调用及其参数,将复杂任务分解为一系列工具调用,从而避免了传统LLM在处理长文本和复杂任务时面临的上下文窗口限制和错误累积问题。通过外部工具(如文本编辑器、CAD软件等),LLM可以进行多层次的文本生成、3D建模等任务,并有效地管理上下文信息。这种方法不仅提高了LLM的效率和准确性,也增强了其安全性,因为模型必须通过清晰的工具调用来完成复杂任务,减少了误导性输出的可能性。训练方面,该范式主要依靠强化学习,并充分利用LLM的“遗忘性”来应对无限上下文长度的挑战。
AI