Cerebras、Llama 4 Maverick 400Bで推論速度記録を塗り替える
2025-05-31
Cerebras Systemsは、MetaのLlama 4 Maverick 400Bパラメーターモデルにおいて、毎秒2500トークンを超える画期的な推論速度を達成し、Nvidiaの性能を2倍以上上回りました。Artificial Analysisによって独立して検証されたこの記録的な速度は、エージェント、コード生成、複雑な推論などのAIアプリケーションにとって極めて重要であり、待ち時間を大幅に削減し、ユーザーエクスペリエンスを向上させます。利用できないカスタム最適化に依存していたNvidiaのソリューションとは異なり、Cerebrasのパフォーマンスは、Metaの今後のAPIを通じて容易にアクセスでき、開発者や企業のAIユーザーに優れたソリューションを提供します。
AI