Le modèle de raisonnement IA de pointe le plus rapide au monde désormais disponible sur Cerebras Inference Cloud

Tags populaires：

Virtualisation sécurité DNS vérification formelle analyse d'atteignabilité erreurs du compilateur conflit de macro extension web framework de développement Graphiques bitmap incohérences d'API Tous les tags

2025-07-23

Cerebras Systems a annoncé aujourd'hui le lancement de Qwen3-235B avec un support de contexte complet de 131K sur sa plateforme d'inférence cloud. Cette étape représente une avancée majeure dans les performances des modèles d'IA, combinant une intelligence de pointe avec une vitesse sans précédent à un dixième du coût des modèles propriétaires, transformant fondamentalement le déploiement de l'IA en entreprise. Qwen3-235B atteint des vitesses de 1 500 jetons par seconde, réduisant les temps de réponse de 1 à 2 minutes à 0,6 seconde. Sa longueur de contexte étendue de 131 K permet la génération de code de qualité production, en gérant des bases de code volumineuses et des documents complexes. Un partenariat avec Cline intègre les modèles Qwen directement dans son éditeur VS Code, offrant des améliorations de vitesse significatives.

Technologie