Webtagr - 기술 뉴스 다이제스트

Cerebras, 초고속 AI 코딩 플랜 출시: Pro와 Max

2025-08-02

Cerebras는 두 가지 새로운 AI 코딩 플랜인 Code Pro(월 50달러)와 Code Max(월 200달러)를 출시했습니다. 두 플랜 모두 알리바바의 주요 오픈웨이트 코딩 모델인 Qwen3-Coder를 기반으로 합니다. 초당 최대 2000토큰의 속도, 131,000토큰의 컨텍스트 창, 독점 IDE 잠금 또는 주간 제한 없이 즉각적인 코드 생성을 제공합니다. 선호하는 AI IDE와 통합하여 원활한 워크플로를 구현할 수 있습니다. Code Pro는 개인 개발자와 소규모 프로젝트에 적합하며, Code Max는 대규모 개발 요구 사항을 충족합니다.

(www.cerebras.ai)

개발

세계에서 가장 빠른 최첨단 AI 추론 모델, Cerebras Inference Cloud에서 이용 가능

2025-07-23

Cerebras Systems는 오늘 자사의 추론 클라우드 플랫폼에서 완벽한 131K 컨텍스트 지원 기능을 갖춘 Qwen3-235B를 출시했습니다. 이는 최첨단 지능과 전례 없는 속도를 기존 폐쇄형 소스 모델의 1/10 비용으로 결합하여 엔터프라이즈 AI 구축을 근본적으로 변화시키는 AI 모델 성능의 획기적인 발전입니다. Qwen3-235B는 초당 1,500토큰의 속도를 달성하여 응답 시간을 1~2분에서 0.6초로 단축합니다. 확장된 131K 컨텍스트를 통해 대규모 코드베이스와 복잡한 문서를 처리하여 프로덕션 수준의 코드 생성이 가능합니다. Cline과의 파트너십을 통해 Qwen 모델이 Cline의 VS Code 에디터에 직접 통합되어 속도가 크게 향상됩니다.

(www.cerebras.ai)

기술

Cerebras, Llama 4 Maverick 400B로 추론 속도 기록 경신

2025-05-31

Cerebras Systems는 Meta의 Llama 4 Maverick 400B 매개변수 모델에서 초당 2,500개 이상 토큰의 획기적인 추론 속도를 달성하여 Nvidia의 성능을 2배 이상 능가했습니다. Artificial Analysis에 의해 독립적으로 검증된 이 기록적인 속도는 에이전트, 코드 생성, 복잡한 추론 등의 AI 애플리케이션에 매우 중요하며, 대기 시간을 크게 줄이고 사용자 경험을 향상시킵니다. 사용할 수 없는 사용자 지정 최적화에 의존했던 Nvidia의 솔루션과 달리 Cerebras의 성능은 Meta의 향후 API를 통해 쉽게 액세스할 수 있으며, 개발자와 기업 AI 사용자에게 우수한 솔루션을 제공합니다.

(www.cerebras.ai)

AI