大型语言模型上下文失效的六种应对策略

2025-08-24
大型语言模型上下文失效的六种应对策略

大型语言模型(LLM)的上下文窗口越来越大,但过长的上下文反而可能导致模型性能下降。本文介绍了六种应对策略:检索增强生成(RAG)用于选择性添加相关信息;工具配置(Tool Loadout)选择最相关的工具;上下文隔离(Context Quarantine)将上下文隔离到独立线程;上下文剪枝(Context Pruning)移除不相关信息;上下文摘要(Context Summarization)将上下文浓缩成摘要;上下文卸载(Context Offloading)将信息存储在LLM上下文之外。研究表明,这些方法能显著提高模型的准确性和效率,尤其是在处理大量工具或复杂任务时。

阅读更多

AI职位头衔速查表:解读AI行业中的各种角色

2025-08-22
AI职位头衔速查表:解读AI行业中的各种角色

AI行业的职位名称五花八门,令人眼花缭乱。本文提供一份AI职位头衔速查表,帮助你理解那些看似神秘的职位名称。通过对职位名称进行拆解,例如“应用AI工程师”、“AI前沿部署工程师”等,本文揭示了这些职位名称的构成模式,并解释了不同修饰词(如“应用”、“前沿部署”)和领域(如“ML”、“Gen AI”)的含义。作者指出,“研究员”这一职位在学术界和工业界的含义有所不同,并建议使用更清晰的职位描述。这份速查表将帮助你更好地理解AI行业中的各种角色,并为职业发展提供参考。

阅读更多

「痛苦教训」:AI发展的悖论与现实

2025-08-02
「痛苦教训」:AI发展的悖论与现实

Rich Sutton提出的“痛苦教训”认为,利用计算的通用方法最终是最有效的。文章探讨了这一观点在围棋、象棋、语音识别和计算机视觉等领域的体现,以及其在企业应用中的挑战。虽然大规模计算在某些领域取得突破,但文章也指出,在数据质量和定义清晰目标方面存在局限性,高效的专用模型有时优于通用模型,计算资源并非总是最佳方案。

阅读更多
AI

AI时代的多模型连接器:重蹈Web 2.0的覆辙?

2025-06-17
AI时代的多模型连接器:重蹈Web 2.0的覆辙?

多模型连接器(MCPs)的出现让人联想起Web 2.0时代。最初,人们憧憬着LLM可以无缝连接所有数据和应用,轻松完成各种任务。然而,Web 2.0的开放API最终演变成由少数赢家控制的封闭系统。类似地,尽管MCPs承诺开放访问,但大型平台可能会限制其访问权限,以防止竞争。这预示着MCPs可能最终沦为受控的工具,而非真正的开放式生态系统。

阅读更多

Anthropic 的 Claude 4.0 系统提示:改进与演进

2025-06-04
Anthropic 的 Claude 4.0 系统提示:改进与演进

Anthropic 发布了 Claude 4.0,其系统提示与 3.7 版本相比进行了细微但重要的调整。这些改动反映了 Anthropic 如何利用系统提示来定义应用程序的用户体验以及提示在其开发周期中的作用。例如,移除了一些旧的临时修复,并添加了新的指令,例如避免使用积极的形容词开头回答以及在必要时立即进行搜索,而不是请求用户许可。这些变化表明 Anthropic 对其搜索工具和模型的应用更有信心,并且观察到用户越来越多地使用 Claude 进行搜索任务。此外,Claude 4.0 的系统提示还反映了用户对更多类型的结构化文档和更短的上下文限制的需求,并增加了对恶意代码使用的限制。总而言之,Claude 4.0 的系统提示改进展示了 Anthropic 基于用户行为观察来优化其聊天机器人行为的迭代开发流程。

阅读更多

DuckDB空间扩展:让地理空间数据触手可及

2025-05-03
DuckDB空间扩展:让地理空间数据触手可及

将地理空间能力嵌入通用数据工具会发生什么?更多人开始使用地理数据!最近的云原生地理空间会议上,一个核心问题是如何扩大地理空间用户群体。DuckDB的空间扩展降低了使用地理数据的门槛,只需简单的两行代码即可安装和加载。这使得非专业人士也能轻松处理地理空间数据,极大地促进了生态系统的增长,Overture Maps Foundation的成功可能也与其密切相关。

阅读更多
开发

Wikidata:一个巨大的交叉引用文件

2024-10-06
Wikidata:一个巨大的交叉引用文件

本文介绍了如何使用 DuckDB 和 Ruby 从 Wikidata 中提取地理实体数据,并构建交叉引用文件。Wikidata 是一个结构化的知识库,包含大量实体和关系数据,其中包括外部标识符,可以链接到其他数据库。作者详细描述了数据下载、预处理、提取和转换的过程,并最终生成了包含地理坐标、Wikidata ID 和外部标识符的交叉引用文件,为地理数据集成和分析提供了便利。

阅读更多

清醒的 AI 已成常态

2024-06-13

本文认为,尽管 OpenAI、谷歌等公司对 AI 大肆宣传,但实际上,大多数 AI 应用都非常“清醒”,开发者将 AI 视为数据管道中的一个组件,用于数据处理、分析和生成 SQL 语句等任务,而非创造超级智能。这种“清醒的 AI”虽然看似平淡无奇,但它能够真正帮助企业利用数据提高效率,实现数据驱动决策的愿景。

阅读更多
未分类

A POI Database in One Line | Drew Breunig

2024-04-19

该网站提供了一个使用一行代码创建位置兴趣点(POI)数据库的简单方法。它介绍了如何使用PostGIS扩展为PostgreSQL数据库创建POI表,包括ID、名称、位置和其他相关详细信息。文章还讨论了使用Python的GeoJSON文件将POI加载到数据库中的过程。

阅读更多
未分类