Webtagr - 科技资讯摘要

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

告别Prompt Engineering，拥抱Context Engineering：AI代理的未来

2025-07-01

Context Engineering（上下文工程）正成为AI领域的热门话题，它超越了简单的Prompt Engineering（提示工程），关注为大型语言模型（LLM）提供充分的上下文信息，使其能够有效解决问题。文章指出，AI代理的成功与否主要取决于上下文质量，而非模型本身。Context Engineering并非简单的指令，而是包含初始指令、用户提示、短期记忆、长期记忆、外部信息检索、可用工具和结构化输出等多个方面。一个成功的AI代理，例如能够根据邮件安排会议，需要整合日历、邮件历史、联系人信息等上下文，才能生成人性化的回复，而非简单的机械式回应。文章强调，Context Engineering 是一个动态系统，需要在正确的时间提供正确的信息和工具，以确保LLM能够完成任务，这才是构建强大可靠AI代理的关键。

DeepSeek R1：开源模型在复杂推理任务中挑战OpenAI

2025-01-31

DeepSeek R1，一个开源模型，在复杂推理任务中与OpenAI的模型一较高下。它利用群体相对策略优化（GRPO）和强化学习的多阶段训练方法，不仅发布了模型，还发布了相关的研究论文。论文中描述了训练过程中一个“顿悟时刻”：模型学会了通过重新评估初始方法来分配更多思考时间，无需任何人工反馈或数据指导。本文尝试使用GRPO和Countdown游戏来重现DeepSeek R1的“顿悟时刻”，训练一个开源模型，使其自主学习自我验证和搜索能力。文章还提供了一个Jupyter Notebook交互式代码，以及在多GPU节点或SLURM集群上运行训练的脚本和说明，方便读者学习GRPO和TRL的使用方法。