Metas Llama 4: Platz zwei im Ranking und ein chaotischer Launch
Meta hat zwei neue Llama 4-Modelle veröffentlicht: Scout und Maverick. Maverick erreichte den zweiten Platz auf LMArena und übertraf damit GPT-4o und Gemini 2.0 Flash. Meta gab jedoch zu, dass auf LMArena eine speziell optimierte „experimentelle Chat-Version“ getestet wurde, nicht die öffentlich verfügbare Version. Dies führte zu Kontroversen, und LMArena aktualisierte seine Richtlinien, um ähnliche Vorfälle zu verhindern. Meta erklärte, dass es verschiedene Versionen testete, aber dieser Schritt wirft Fragen nach seiner Strategie im KI-Wettbewerb und dem ungewöhnlichen Zeitpunkt der Veröffentlichung von Llama 4 auf. Letztendlich unterstreicht der Vorfall die Grenzen von KI-Benchmarks und die komplexen Strategien großer Technologieunternehmen im Wettbewerb.