Cerebras bate el récord de velocidad de inferencia con Llama 4 Maverick 400B

2025-05-31
Cerebras bate el récord de velocidad de inferencia con Llama 4 Maverick 400B

Cerebras Systems ha alcanzado una velocidad de inferencia innovadora de más de 2.500 tokens por segundo (TPS) en el modelo de 400B parámetros Llama 4 Maverick de Meta, más del doble del rendimiento de Nvidia. Esta velocidad récord, verificada de forma independiente por Artificial Analysis, es crucial para aplicaciones de IA como agentes, generación de código y razonamiento complejo, reduciendo significativamente la latencia y mejorando la experiencia del usuario. A diferencia de la solución de Nvidia, que dependía de optimizaciones personalizadas no disponibles, el rendimiento de Cerebras es fácilmente accesible a través de la próxima API de Meta, ofreciendo una solución superior para desarrolladores y usuarios empresariales de IA.

IA