OpenAI 的 o3 系统在 ARC-AGI 基准测试中取得突破性进展

2024-12-20

OpenAI 的新型 o3 系统在 ARC-AGI-1 公开训练集上进行训练,在半私有评估集上取得了 75.7% 的突破性高分,这标志着人工智能能力的显著提升。该系统展现出前所未有的新任务适应能力,挑战了现有大型语言模型的局限性。虽然 o3 系统在一些简单任务上仍然失败,距离通用人工智能(AGI)还有距离,但这项成果为 AGI 的研究提供了宝贵的数据点,也突显了在测试时重新组合知识的重要性。

AI