大型语言模型的无限工具使用范式

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

大型语言模型的无限工具使用范式

2025-05-25

本文提出了一种全新的大型语言模型（LLM）范式：无限工具使用。该范式建议LLM只输出工具调用及其参数，将复杂任务分解为一系列工具调用，从而避免了传统LLM在处理长文本和复杂任务时面临的上下文窗口限制和错误累积问题。通过外部工具（如文本编辑器、CAD软件等），LLM可以进行多层次的文本生成、3D建模等任务，并有效地管理上下文信息。这种方法不仅提高了LLM的效率和准确性，也增强了其安全性，因为模型必须通过清晰的工具调用来完成复杂任务，减少了误导性输出的可能性。训练方面，该范式主要依靠强化学习，并充分利用LLM的“遗忘性”来应对无限上下文长度的挑战。

(snimu.github.io)

希腊海岛Hydra：天堂还是交通地狱？

Unix文件名长度限制的演变史