Webtagr - テクノロジーニュースダイジェスト

Cerebras、超高速AIコーディングプランを発表：ProとMax

2025-08-02

Cerebrasは、2つの新しいAIコーディングプランを発表しました。Code Pro（月額50ドル）とCode Max（月額200ドル）です。どちらも、アリババの主要なオープンウェイトコーディングモデルであるQwen3-Coderを搭載しています。毎秒最大2000トークン、131,000トークンのコンテキストウィンドウ、独自のIDEへのロックインや週間制限なしで、瞬時のコード生成を実現します。お好みのAI IDEと統合して、シームレスなワークフローを実現できます。Code Proは個人開発者や小規模プロジェクトに最適で、Code Maxは大規模な開発ニーズに対応します。

(www.cerebras.ai)

開発

世界最速の最先端AI推論モデルがCerebras Inference Cloudで利用可能に

2025-07-23

Cerebras Systemsは本日、推論クラウドプラットフォームで完全な131Kコンテキストサポートを備えたQwen3-235Bのリリースを発表しました。このマイルストーンは、最先端の知能と前例のない速度を、クローズドソースモデルの10分の1のコストで組み合わせることで、エンタープライズAIの展開を根本的に変革するAIモデルのパフォーマンスにおけるブレークスルーです。Qwen3-235Bは毎秒1500トークンの速度に達し、レスポンスタイムを1～2分から0.6秒に短縮します。拡張された131Kコンテキストにより、大規模なコードベースと複雑なドキュメントを処理することで、プロダクションレベルのコード生成が可能になります。Clineとのパートナーシップにより、QwenモデルがClineのVS Codeエディターに直接統合され、大幅な速度向上が実現します。

(www.cerebras.ai)

テクノロジー

Cerebras、Llama 4 Maverick 400Bで推論速度記録を塗り替える

2025-05-31

Cerebras Systemsは、MetaのLlama 4 Maverick 400Bパラメーターモデルにおいて、毎秒2500トークンを超える画期的な推論速度を達成し、Nvidiaの性能を2倍以上上回りました。Artificial Analysisによって独立して検証されたこの記録的な速度は、エージェント、コード生成、複雑な推論などのAIアプリケーションにとって極めて重要であり、待ち時間を大幅に削減し、ユーザーエクスペリエンスを向上させます。利用できないカスタム最適化に依存していたNvidiaのソリューションとは異なり、Cerebrasのパフォーマンスは、Metaの今後のAPIを通じて容易にアクセスでき、開発者や企業のAIユーザーに優れたソリューションを提供します。

(www.cerebras.ai)

AI