Cerebras bricht Inferenzgeschwindigkeitsrekord mit Llama 4 Maverick 400B

2025-05-31
Cerebras bricht Inferenzgeschwindigkeitsrekord mit Llama 4 Maverick 400B

Cerebras Systems hat eine bahnbrechende Inferenzgeschwindigkeit von über 2.500 Tokens pro Sekunde (TPS) auf Metas Llama 4 Maverick 400B-Parametermodell erreicht, mehr als das Doppelte der Leistung von Nvidia. Diese rekordverdächtige Geschwindigkeit, unabhängig von Artificial Analysis verifiziert, ist entscheidend für KI-Anwendungen wie Agents, Codegenerierung und komplexes Reasoning, wodurch die Latenz deutlich reduziert und die Benutzererfahrung verbessert wird. Im Gegensatz zu Nvidias Lösung, die auf nicht verfügbare benutzerdefinierte Optimierungen angewiesen war, ist die Leistung von Cerebras über die kommende API von Meta leicht zugänglich und bietet Entwicklern und KI-Anwendern im Unternehmen eine überlegene Lösung.

KI