超越强化学习:基于语言反思的提示优化算法GEPA

2025-07-31
超越强化学习:基于语言反思的提示优化算法GEPA

研究人员提出了一种名为GEPA的新型算法,用于优化复杂的、多模块AI系统中的提示。与传统的强化学习不同,GEPA采用了一种语言驱动的进化方法,通过让大型语言模型(LLM)分析其自身性能(包括推理步骤、工具使用和详细的评估反馈)来诊断错误并提出针对性改进。这种方法比强化学习更高效,在多个任务中超越了现有技术,展示了语言反思在AI系统优化中的巨大潜力。

AI