Meta的Llama 4:喧嚣背后的真相
2025-04-24
Meta发布了备受期待的Llama 4,但其表现却引发了广泛争议。这款号称拥有10M上下文长度的模型,在LM Arena等基准测试中表现不佳,甚至被指责存在作弊行为。其MoE架构虽然在理论上更优,但在实际应用中却面临着内存和效率问题。更令人震惊的是,内部人士爆料称,Meta为了达到预期的效果,采取了不当手段,甚至导致高管辞职。Llama 4的发布,暴露了大型语言模型研发中存在的诸多挑战,也引发了人们对模型评估标准和透明度的思考。
AI