Webtagr - 科技资讯摘要

大型语言模型的幻象：准确性与实用性之间的博弈

2025-02-25

本文探讨了大型语言模型（LLM）在数据检索方面的局限性。作者以OpenAI的Deep Research为例，指出其在处理需要精确数据的问题时存在错误，即使是其自身宣传材料中展示的数据也存在偏差。作者认为，LLM擅长处理模糊问题，但在精确数据检索方面表现不佳，这与其作为概率模型而非确定性模型的本质有关。虽然LLM在提高效率方面有所帮助，但其错误率难以预测，这使得构建依赖LLM的应用变得复杂。作者最后提出，LLM领域的竞争激烈，缺乏护城河，其未来发展方向仍不明朗。

(www.ben-evans.com)

AI 数据检索

问错了问题

2024-09-08

本文以作者祖父1909年制造滑翔机的故事开始，探讨了科技预测中常犯的错误：我们往往会问错问题，或者基于错误的框架提出问题。作者列举了1964年兰德公司的一项预测，以及1990年TeleGeography关于电话网络未来用途的报告，指出这些预测虽然在某些方面准确，但在更根本的技术变革和结构性动力方面存在误区。作者认为，我们应该关注更深层次的技术平台和开放式创新，而不是局限于具体的应用场景，并以此反思当前对移动互联网之后的技术发展方向的预测。

(www.ben-evans.com)

39

未分类科技预测技术变革

虚拟现实寒冬仍在继续

2024-07-16

尽管生成式人工智能炙手可热，但虚拟现实（VR）和增强现实（AR）市场依然冷淡。Meta 的 VR 设备价格合理但性能不足，苹果的设备性能出色但价格昂贵。市场整体规模较小，用户日活跃率低，缺乏大众市场吸引力。虽然设备会不断改进，但 VR/AR 是否能成为主流仍是未知数。

(www.ben-evans.com)

51

未分类