OpenAI 的 o3 系统在 ARC-AGI 基准测试中取得突破性进展

2024-12-20

OpenAI 的新型 o3 系统在 ARC-AGI-1 公开训练集上进行训练,在半私有评估集上取得了 75.7% 的突破性高分,这标志着人工智能能力的显著提升。该系统展现出前所未有的新任务适应能力,挑战了现有大型语言模型的局限性。虽然 o3 系统在一些简单任务上仍然失败,距离通用人工智能(AGI)还有距离,但这项成果为 AGI 的研究提供了宝贵的数据点,也突显了在测试时重新组合知识的重要性。

阅读更多
AI

2024 ARC 奖结果公布,大奖仍无人获得

2024-12-07

2024 ARC 奖竞赛结果公布,大奖仍然无人获得。竞赛发布了官方技术报告,详细介绍了排名靠前的解决方案、技术分析、趋势和重要见解。ARChitects 团队以 53.5% 的得分获得第一名,赢得 2.5 万美元奖金。竞赛还公布了论文奖获奖者,一等奖由“结合归纳和转导进行抽象推理”的论文获得,奖金 5 万美元。2025 年 ARC 奖将继续举办,并计划推出 ARC-AGI-2 基准测试。

阅读更多
未分类

ARC Prize 挑战赛:百万美元奖金,寻求通用人工智能新突破

2024-06-11

由于人工智能,特别是大型语言模型(LLM)的进展局限于记忆和应用模式,真正的通用人工智能(AGI)需要具备像人类一样高效学习新技能的能力。ARC-AGI 评估测试表明,当前 AI 系统远未达到人类水平。ARC Prize 挑战赛应运而生,旨在鼓励开源研究,推动 AGI 发展。该竞赛由 Mike Knoop 和 François Chollet 主办,Infinite Monkey 和 Lab42 支持,提供超过 100 万美元的奖金,鼓励参赛者解决 ARC-AGI 评估,并开源其解决方案。

阅读更多
未分类 ARC Prize