苹果揭露大型语言模型推理能力的局限性

2025-06-16
苹果揭露大型语言模型推理能力的局限性

苹果最新发布的论文《思考的幻象》挑战了我们对大型语言模型(LLM)的许多假设。该研究通过精心设计的实验,发现LLM在解决复杂问题时存在一个临界点:超过此点,即使是顶尖模型也会完全失效,其表现并非逐渐下降,而是突然崩溃,甚至放弃尝试。论文指出,这种失败并非资源不足,而是行为上的缺陷,即使提供算法本身也无济于事。更令人不安的是,即使模型完全错误,其输出仍然看似合理,这使得识别错误变得更加困难。该研究强调了构建真正推理系统的重要性,并指出需要更清晰地认识到当前模型的局限性。

阅读更多
AI