DynaSaur:超越预定义动作的大语言模型代理

2024-12-01

现有的LLM代理系统通常从固定的预定义动作集中选择动作,这限制了其在复杂环境中的能力。DynaSaur 提出了一种新的LLM代理框架,允许代理动态创建和组合动作。该框架允许代理通过生成和执行用通用编程语言编写的程序来与环境交互,并在后续步骤中重复使用这些生成的程序。在GAIA基准测试中,DynaSaur 表现出更大的灵活性和优于现有方法的性能,并在编写本文时位居GAIA公共排行榜榜首。

6