世界最速の最先端AI推論モデルがCerebras Inference Cloudで利用可能に
2025-07-23

Cerebras Systemsは本日、推論クラウドプラットフォームで完全な131Kコンテキストサポートを備えたQwen3-235Bのリリースを発表しました。このマイルストーンは、最先端の知能と前例のない速度を、クローズドソースモデルの10分の1のコストで組み合わせることで、エンタープライズAIの展開を根本的に変革するAIモデルのパフォーマンスにおけるブレークスルーです。Qwen3-235Bは毎秒1500トークンの速度に達し、レスポンスタイムを1~2分から0.6秒に短縮します。拡張された131Kコンテキストにより、大規模なコードベースと複雑なドキュメントを処理することで、プロダクションレベルのコード生成が可能になります。Clineとのパートナーシップにより、QwenモデルがClineのVS Codeエディターに直接統合され、大幅な速度向上が実現します。
テクノロジー