超越GPT:进化算法攻克ARC-AGI难题,AGI曙光初现?

2025-09-17
超越GPT:进化算法攻克ARC-AGI难题,AGI曙光初现?

近日,一位研究者利用进化算法结合大型语言模型Grok-4,在ARC-AGI基准测试中取得了显著突破,在ARC v1上达到79.6%的准确率,并在更难的ARC v2上取得了29.4%的准确率,刷新了当前最佳水平。该方法的核心在于利用自然语言指令代替Python代码,通过迭代进化生成更有效的解题方案。这项研究表明,强化学习和自然语言指令的结合,有望解决当前大型语言模型在抽象推理方面的局限性,为实现通用人工智能(AGI)指明了方向。

AI