大型语言模型的幻象:准确性与实用性之间的博弈

2025-02-25
大型语言模型的幻象:准确性与实用性之间的博弈

本文探讨了大型语言模型(LLM)在数据检索方面的局限性。作者以OpenAI的Deep Research为例,指出其在处理需要精确数据的问题时存在错误,即使是其自身宣传材料中展示的数据也存在偏差。作者认为,LLM擅长处理模糊问题,但在精确数据检索方面表现不佳,这与其作为概率模型而非确定性模型的本质有关。虽然LLM在提高效率方面有所帮助,但其错误率难以预测,这使得构建依赖LLM的应用变得复杂。作者最后提出,LLM领域的竞争激烈,缺乏护城河,其未来发展方向仍不明朗。

阅读更多

问错了问题

2024-09-08
问错了问题

本文以作者祖父1909年制造滑翔机的故事开始,探讨了科技预测中常犯的错误:我们往往会问错问题,或者基于错误的框架提出问题。作者列举了1964年兰德公司的一项预测,以及1990年TeleGeography关于电话网络未来用途的报告,指出这些预测虽然在某些方面准确,但在更根本的技术变革和结构性动力方面存在误区。作者认为,我们应该关注更深层次的技术平台和开放式创新,而不是局限于具体的应用场景,并以此反思当前对移动互联网之后的技术发展方向的预测。

阅读更多

虚拟现实寒冬仍在继续

2024-07-16
虚拟现实寒冬仍在继续

尽管生成式人工智能炙手可热,但虚拟现实(VR)和增强现实(AR)市场依然冷淡。Meta 的 VR 设备价格合理但性能不足,苹果的设备性能出色但价格昂贵。市场整体规模较小,用户日活跃率低,缺乏大众市场吸引力。虽然设备会不断改进,但 VR/AR 是否能成为主流仍是未知数。

阅读更多
未分类