Google Cloud 대규모 API 장애: Null Pointer 예외의 도미노 효과

2025-06-14

6월 12일, Google Cloud와 Google Workspace 제품은 외부 API 요청에서 503 오류가 급증하여 대규모 장애를 겪었습니다. 근본 원인은 서비스 제어 시스템(Service Control)의 새로운 기능에 적절한 오류 처리 및 기능 플래그 보호가 부족하여 Null Pointer 예외가 연쇄 반응을 일으킨 것입니다. 잘못된 필드가 포함된 정책 변경으로 인해 이 결함이 활성화되어 글로벌 서비스 중단으로 이어졌습니다. Google은 신속하게 문제를 해결했지만, 인프라 과부하로 인해 일부 지역(us-central-1 등)에서는 복구 시간이 길어졌습니다. 이번 사건은 Google의 오류 처리, 기능 플래그 사용, 시스템 아키텍처의 모듈성, 모니터링 및 통신에서의 문제점을 드러냈으며, 재발 방지를 위한 포괄적인 개선 조치를 시행할 것을 약속했습니다.

더 보기
기술 API 장애

Google Cloud 서비스 상태: 포괄적인 모니터링

2025-06-12

Google Cloud Platform은 모든 서비스의 실시간 상태 모니터링 페이지를 출시했습니다. 이 페이지는 Compute Engine부터 AI Platform까지 다양한 서비스의 작동 상태를 나열합니다. 사용자는 다양한 지역 및 다중 지역의 서비스 가용성을 쉽게 확인할 수 있습니다. 여기에 나열되지 않은 문제가 발생하면 지원팀에 문의하십시오. 서비스 상태 정보 및 해석 방법에 대한 FAQ도 제공됩니다.

더 보기