OpenAI的o3模型:炒作与真相

2024-12-22

OpenAI发布的o3模型在ARC-AGI测试中的表现引发热议,被部分人解读为AGI的突破。然而,专家Gary Marcus指出,该测试存在误导性:o3模型在测试前接受了大量预训练数据,这与人类学习方式差异巨大;OpenAI发布的图表也存在选择性偏差,夸大了o3模型的进步;最终结论是,o3模型的表现并非真正意义上的AGI,媒体的过度炒作也应受到批评。

阅读更多
AI

大型语言模型发展已现瓶颈

2024-11-10

Gary Marcus再次强调大型语言模型(LLM)的扩展效应正在减弱,投资回报率递减。知名风险投资家Marc Andreesen和行业期刊《The Information》的编辑Amir Efrati也证实了这一观点。Marcus认为,单纯依靠扩大数据和算力无法解决LLM的根本缺陷,如“幻觉”和缺乏抽象能力。他警告说,LLM的经济效益可能不佳,因为高昂的训练成本和日益激烈的竞争将导致利润下降。过度依赖LLM的现状也对美国AI政策和投资策略产生了负面影响,其他AI研究方向的资金投入不足。Marcus呼吁重新审视AI发展方向,寻求更可靠、可信的AI解决方案。

阅读更多
未分类 瓶颈

OpenAI 最新 GPT-4o 模型测评

2024-05-15

文章对 OpenAI 最新发布的 GPT-4o 模型进行了分析,作者 Gary Marcus 认为 GPT-4o 的语音合成能力令人印象深刻,但整体性能并没有比 GPT-4 有显著提升,他认为 OpenAI 可能已经转向新功能的开发,因为他们不知道如何实现“指数级改进”的预期能力提升。作者认为,目前还没有出现 GPT-5 级别的模型,这可能意味着我们已经进入了收益递减的阶段。

阅读更多
未分类 GPT-4o