세계에서 가장 빠른 최첨단 AI 추론 모델, Cerebras Inference Cloud에서 이용 가능

2025-07-23
세계에서 가장 빠른 최첨단 AI 추론 모델, Cerebras Inference Cloud에서 이용 가능

Cerebras Systems는 오늘 자사의 추론 클라우드 플랫폼에서 완벽한 131K 컨텍스트 지원 기능을 갖춘 Qwen3-235B를 출시했습니다. 이는 최첨단 지능과 전례 없는 속도를 기존 폐쇄형 소스 모델의 1/10 비용으로 결합하여 엔터프라이즈 AI 구축을 근본적으로 변화시키는 AI 모델 성능의 획기적인 발전입니다. Qwen3-235B는 초당 1,500토큰의 속도를 달성하여 응답 시간을 1~2분에서 0.6초로 단축합니다. 확장된 131K 컨텍스트를 통해 대규모 코드베이스와 복잡한 문서를 처리하여 프로덕션 수준의 코드 생성이 가능합니다. Cline과의 파트너십을 통해 Qwen 모델이 Cline의 VS Code 에디터에 직접 통합되어 속도가 크게 향상됩니다.

기술