爱丽丝梦游仙境：揭示大型语言模型推理崩溃的简单任务

爱丽丝梦游仙境：揭示大型语言模型推理崩溃的简单任务 (arxiv.org)

原文: [2406.02061] Alice in Wonderland: Simple Tasks Showing Complete Reasoning Breakdown in State-Of-the-Art Large Language Models

这篇论文揭示了，尽管大型语言模型（LLM）在许多任务中表现出色，但在面对一些简单的常识推理问题时，即使是最大规模的模型也存在严重的推理崩溃问题。这些模型不仅会给出错误答案，还会表现出过度自信，并编造出看似合理的解释来支持其错误结论。即使采用各种提示或多步骤重新评估等干预措施，也无法让模型给出正确答案。

推理崩溃

常识推理

上一篇: 预览功能的兴衰

下一篇: 德州将建立新证券交易所，监管力度小于纽交所和纳斯达克

评论已经关闭！

返回首页