告别Prompt Engineering,拥抱Context Engineering:AI代理的未来

2025-07-01
告别Prompt Engineering,拥抱Context Engineering:AI代理的未来

Context Engineering(上下文工程)正成为AI领域的热门话题,它超越了简单的Prompt Engineering(提示工程),关注为大型语言模型(LLM)提供充分的上下文信息,使其能够有效解决问题。文章指出,AI代理的成功与否主要取决于上下文质量,而非模型本身。Context Engineering并非简单的指令,而是包含初始指令、用户提示、短期记忆、长期记忆、外部信息检索、可用工具和结构化输出等多个方面。一个成功的AI代理,例如能够根据邮件安排会议,需要整合日历、邮件历史、联系人信息等上下文,才能生成人性化的回复,而非简单的机械式回应。文章强调,Context Engineering 是一个动态系统,需要在正确的时间提供正确的信息和工具,以确保LLM能够完成任务,这才是构建强大可靠AI代理的关键。

阅读更多

DeepSeek R1:开源模型在复杂推理任务中挑战OpenAI

2025-01-31
DeepSeek R1:开源模型在复杂推理任务中挑战OpenAI

DeepSeek R1,一个开源模型,在复杂推理任务中与OpenAI的模型一较高下。它利用群体相对策略优化(GRPO)和强化学习的多阶段训练方法,不仅发布了模型,还发布了相关的研究论文。论文中描述了训练过程中一个“顿悟时刻”:模型学会了通过重新评估初始方法来分配更多思考时间,无需任何人工反馈或数据指导。本文尝试使用GRPO和Countdown游戏来重现DeepSeek R1的“顿悟时刻”,训练一个开源模型,使其自主学习自我验证和搜索能力。文章还提供了一个Jupyter Notebook交互式代码,以及在多GPU节点或SLURM集群上运行训练的脚本和说明,方便读者学习GRPO和TRL的使用方法。

阅读更多
AI