Cerebras推出超高速AI编码服务:Code Pro和Code Max

2025-08-02
Cerebras推出超高速AI编码服务:Code Pro和Code Max

Cerebras公司推出了两款新的AI编码服务:Code Pro(每月50美元)和Code Max(每月200美元),均基于阿里巴巴的旗舰级编码模型Qwen3-Coder。该模型以高达每秒2000个token的速度运行,拥有131k个token的上下文窗口,并且没有专有IDE限制或每周使用限制。用户可以使用自己喜欢的AI IDE,实现即时、高质量的代码生成,从而显著提升编码效率。Code Pro适合独立开发者和小型项目,而Code Max则满足全职开发者的需求。

阅读更多
开发

Cerebras 推出世界最快前沿 AI 推理模型

2025-07-23
Cerebras 推出世界最快前沿 AI 推理模型

Cerebras Systems 今日宣布在其推理云平台上推出支持完整 131K 上下文的 Qwen3-235B 模型。该模型在速度和成本方面均实现了突破,推理速度比封闭源替代方案快 30 倍,成本仅为其十分之一。Qwen3-235B 的推理速度高达每秒 1500 个 token,将响应时间从 1-2 分钟缩短到 0.6 秒。其 131K 上下文支持使其能够处理大型代码库和复杂文档,从而实现生产级代码生成。Cerebras 还与 Cline 建立了战略合作伙伴关系,将 Qwen 模型集成到 Cline 的代码编辑器中。

阅读更多
科技

Cerebras打破Llama 4 Maverick 400B模型推理速度纪录

2025-05-31
Cerebras打破Llama 4 Maverick 400B模型推理速度纪录

Cerebras Systems近日宣布,其系统在Meta的Llama 4 Maverick 400B参数模型上实现了超过2500个token/秒的推理速度,远超Nvidia的1000个token/秒,创下新的世界纪录。这一速度提升对于需要快速响应的AI应用,例如智能体、代码生成和复杂推理至关重要,能够显著缩短等待时间,提升用户体验。Cerebras的解决方案无需特殊内核优化即可实现这一性能,并即将通过Meta的API服务提供给所有用户。

阅读更多
AI