Google Cloud lança atualizações importantes para o software AI Hypercomputer

O Google Cloud anunciou atualizações significativas no software do seu AI Hypercomputer, melhorando drasticamente a eficiência do treinamento e inferência de modelos de IA. O Pathways on Cloud, um tempo de execução distribuído, agora está disponível no Google Cloud, permitindo treinamento elástico e inferência de alto rendimento. O Cluster Director adiciona suporte ao Slurm e recursos de observabilidade 360° para alto desempenho e confiabilidade. O GKE integra o Inference Gateway e o Inference Quickstart, reduzindo significativamente os custos de inferência e aumentando a taxa de transferência. O vLLM agora suporta TPUs, acelerando ainda mais a inferência. O Dynamic Workload Scheduler expande o suporte a aceleradores, otimizando a utilização de recursos. Essas atualizações permitem que os desenvolvedores criem e implantem aplicativos de IA mais rápido e de forma mais econômica.