Webtagr - 科技资讯摘要

Cerebras推出超高速AI编码服务：Code Pro和Code Max

2025-08-02

Cerebras公司推出了两款新的AI编码服务：Code Pro（每月50美元）和Code Max（每月200美元），均基于阿里巴巴的旗舰级编码模型Qwen3-Coder。该模型以高达每秒2000个token的速度运行，拥有131k个token的上下文窗口，并且没有专有IDE限制或每周使用限制。用户可以使用自己喜欢的AI IDE，实现即时、高质量的代码生成，从而显著提升编码效率。Code Pro适合独立开发者和小型项目，而Code Max则满足全职开发者的需求。

(www.cerebras.ai)

开发

Cerebras 推出世界最快前沿 AI 推理模型

2025-07-23

Cerebras Systems 今日宣布在其推理云平台上推出支持完整 131K 上下文的 Qwen3-235B 模型。该模型在速度和成本方面均实现了突破，推理速度比封闭源替代方案快 30 倍，成本仅为其十分之一。Qwen3-235B 的推理速度高达每秒 1500 个 token，将响应时间从 1-2 分钟缩短到 0.6 秒。其 131K 上下文支持使其能够处理大型代码库和复杂文档，从而实现生产级代码生成。Cerebras 还与 Cline 建立了战略合作伙伴关系，将 Qwen 模型集成到 Cline 的代码编辑器中。

(www.cerebras.ai)

科技

Cerebras打破Llama 4 Maverick 400B模型推理速度纪录

2025-05-31

Cerebras Systems近日宣布，其系统在Meta的Llama 4 Maverick 400B参数模型上实现了超过2500个token/秒的推理速度，远超Nvidia的1000个token/秒，创下新的世界纪录。这一速度提升对于需要快速响应的AI应用，例如智能体、代码生成和复杂推理至关重要，能够显著缩短等待时间，提升用户体验。Cerebras的解决方案无需特殊内核优化即可实现这一性能，并即将通过Meta的API服务提供给所有用户。

(www.cerebras.ai)

AI