Meta的Llama 4:排名第二的秘密与混乱发布

2025-04-08
Meta的Llama 4:排名第二的秘密与混乱发布

Meta发布了Llama 4的两个新模型:Scout和Maverick。Maverick在LMArena排名第二,超过了GPT-4o和Gemini 2.0 Flash。然而,Meta承认LMArena测试的是一个经过特别优化的“实验性聊天版本”,并非公开版本。此举引发争议,LMArena更新了政策以防止类似情况再次发生。Meta解释称这是为了实验不同版本,但此举也让人质疑其在AI竞赛中的策略,以及Llama 4发布时间的蹊跷选择。最终,事件凸显了AI基准测试的局限性以及大型科技公司在竞争中的策略复杂性。

AI