Webtagr - Résumé de news de technologie

Cerebras lance des offres de codage IA ultra-rapides : Pro et Max

2025-08-02

Cerebras présente deux nouvelles offres de codage IA : Code Pro (50 $ par mois) et Code Max (200 $ par mois), toutes deux basées sur Qwen3-Coder d’Alibaba, un modèle de codage open-weight de pointe. Fonctionnant à des vitesses atteignant 2 000 tokens par seconde, avec une fenêtre de contexte de 131 000 tokens, aucun verrouillage IDE propriétaire et aucune limite hebdomadaire, il offre une génération de code instantanée. Les utilisateurs peuvent l’intégrer à leurs IDE IA préférés pour un flux de travail transparent. Code Pro est idéal pour les développeurs indépendants et les petits projets, tandis que Code Max répond aux besoins des développeurs à plein temps ayant un volume élevé.

Lire plus

(www.cerebras.ai)

Développement

Le modèle de raisonnement IA de pointe le plus rapide au monde désormais disponible sur Cerebras Inference Cloud

2025-07-23

Cerebras Systems a annoncé aujourd'hui le lancement de Qwen3-235B avec un support de contexte complet de 131K sur sa plateforme d'inférence cloud. Cette étape représente une avancée majeure dans les performances des modèles d'IA, combinant une intelligence de pointe avec une vitesse sans précédent à un dixième du coût des modèles propriétaires, transformant fondamentalement le déploiement de l'IA en entreprise. Qwen3-235B atteint des vitesses de 1 500 jetons par seconde, réduisant les temps de réponse de 1 à 2 minutes à 0,6 seconde. Sa longueur de contexte étendue de 131 K permet la génération de code de qualité production, en gérant des bases de code volumineuses et des documents complexes. Un partenariat avec Cline intègre les modèles Qwen directement dans son éditeur VS Code, offrant des améliorations de vitesse significatives.

Lire plus

(www.cerebras.ai)

Technologie

Cerebras pulvérise le record de vitesse d'inférence avec Llama 4 Maverick 400B

2025-05-31

Cerebras Systems a atteint une vitesse d'inférence révolutionnaire de plus de 2 500 jetons par seconde (TPS) sur le modèle Llama 4 Maverick 400B paramètres de Meta, plus du double des performances de Nvidia. Cette vitesse record, vérifiée indépendamment par Artificial Analysis, est cruciale pour les applications d'IA telles que les agents, la génération de code et le raisonnement complexe, réduisant considérablement la latence et améliorant l'expérience utilisateur. Contrairement à la solution de Nvidia qui reposait sur des optimisations personnalisées non disponibles, les performances de Cerebras sont facilement accessibles via la prochaine API de Meta, offrant une solution supérieure aux développeurs et aux utilisateurs d'IA d'entreprise.

Lire plus

(www.cerebras.ai)

IA Inférence LLM Accélération IA