Webtagr - 科技资讯摘要

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

苹果揭露大型语言模型推理能力的局限性

2025-06-16

苹果最新发布的论文《思考的幻象》挑战了我们对大型语言模型（LLM）的许多假设。该研究通过精心设计的实验，发现LLM在解决复杂问题时存在一个临界点：超过此点，即使是顶尖模型也会完全失效，其表现并非逐渐下降，而是突然崩溃，甚至放弃尝试。论文指出，这种失败并非资源不足，而是行为上的缺陷，即使提供算法本身也无济于事。更令人不安的是，即使模型完全错误，其输出仍然看似合理，这使得识别错误变得更加困难。该研究强调了构建真正推理系统的重要性，并指出需要更清晰地认识到当前模型的局限性。

(leotsem.com)