Cerebras, Llama 4 Maverick 400B로 추론 속도 기록 경신

2025-05-31
Cerebras, Llama 4 Maverick 400B로 추론 속도 기록 경신

Cerebras Systems는 Meta의 Llama 4 Maverick 400B 매개변수 모델에서 초당 2,500개 이상 토큰의 획기적인 추론 속도를 달성하여 Nvidia의 성능을 2배 이상 능가했습니다. Artificial Analysis에 의해 독립적으로 검증된 이 기록적인 속도는 에이전트, 코드 생성, 복잡한 추론 등의 AI 애플리케이션에 매우 중요하며, 대기 시간을 크게 줄이고 사용자 경험을 향상시킵니다. 사용할 수 없는 사용자 지정 최적화에 의존했던 Nvidia의 솔루션과 달리 Cerebras의 성능은 Meta의 향후 API를 통해 쉽게 액세스할 수 있으며, 개발자와 기업 AI 사용자에게 우수한 솔루션을 제공합니다.

AI