Cerebras 推出世界最快前沿 AI 推理模型
2025-07-23
Cerebras Systems 今日宣布在其推理云平台上推出支持完整 131K 上下文的 Qwen3-235B 模型。该模型在速度和成本方面均实现了突破,推理速度比封闭源替代方案快 30 倍,成本仅为其十分之一。Qwen3-235B 的推理速度高达每秒 1500 个 token,将响应时间从 1-2 分钟缩短到 0.6 秒。其 131K 上下文支持使其能够处理大型代码库和复杂文档,从而实现生产级代码生成。Cerebras 还与 Cline 建立了战略合作伙伴关系,将 Qwen 模型集成到 Cline 的代码编辑器中。
科技