Google Cloud dévoile d'importantes mises à jour logicielles pour AI Hypercomputer

Google Cloud a annoncé des mises à jour importantes du logiciel de son AI Hypercomputer, améliorant considérablement l'efficacité de l'entraînement et de l'inférence des modèles d'IA. Pathways on Cloud, un runtime distribué, est désormais disponible sur Google Cloud, permettant un entraînement élastique et une inférence à haut débit. Cluster Director ajoute la prise en charge de Slurm et des fonctionnalités d'observabilité à 360° pour des performances et une fiabilité élevées. GKE intègre Inference Gateway et Inference Quickstart, réduisant considérablement les coûts d'inférence et augmentant le débit. vLLM prend désormais en charge les TPU, accélérant encore l'inférence. Dynamic Workload Scheduler étend la prise en charge des accélérateurs, optimisant l'utilisation des ressources. Ces mises à jour permettent aux développeurs de créer et de déployer des applications d'IA plus rapidement et plus économiquement.