超越强化学习：基于语言反思的提示优化算法GEPA

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

超越强化学习：基于语言反思的提示优化算法GEPA

2025-07-31

研究人员提出了一种名为GEPA的新型算法，用于优化复杂的、多模块AI系统中的提示。与传统的强化学习不同，GEPA采用了一种语言驱动的进化方法，通过让大型语言模型（LLM）分析其自身性能（包括推理步骤、工具使用和详细的评估反馈）来诊断错误并提出针对性改进。这种方法比强化学习更高效，在多个任务中超越了现有技术，展示了语言反思在AI系统优化中的巨大潜力。

(arxiviq.substack.com)

计算机音乐入门电子书：二十年磨一剑

SUMO交通模拟器：构建你的虚拟交通世界