Queda em massa da API do Google Cloud: efeito cascata de uma exceção de ponteiro nulo

2025-06-14

Em 12 de junho, os produtos Google Cloud e Google Workspace sofreram uma interrupção generalizada devido a um aumento de erros 503 em solicitações de API externas. A causa raiz foi um novo recurso no sistema de Controle de Serviço que carecia de tratamento de erros adequado e proteção de sinalizador de recurso, levando a uma exceção de ponteiro nulo que acionou uma falha em cascata. Uma alteração de política contendo campos inválidos ativou essa falha, resultando em uma interrupção de serviço global. O Google mitigou rapidamente o problema, mas algumas regiões (como us-central-1) experimentaram uma recuperação prolongada devido à sobrecarga de infraestrutura. O incidente destacou problemas no tratamento de erros do Google, uso de sinalizadores de recursos, modularidade da arquitetura do sistema e monitoramento e comunicação, levando a um compromisso de implementar melhorias abrangentes para evitar a recorrência.

Leia mais

Status do Serviço em Nuvem do Google: Monitoramento Abrangente

2025-06-12

O Google Cloud Platform lançou uma página de monitoramento de status em tempo real para todos os seus serviços. A página lista o status operacional de vários serviços, desde o Compute Engine até o AI Platform. Os usuários podem verificar facilmente a disponibilidade de serviços em várias regiões e multi-regiões. Entre em contato com o suporte se você encontrar um problema não listado aqui. Perguntas frequentes sobre informações e interpretação do status do serviço também estão disponíveis.

Leia mais
Tecnologia Status do Serviço