Massenausfall der Google Cloud API: Kaskadeneffekt durch Nullzeiger-Ausnahme

2025-06-14

Am 12. Juni erlitten Google Cloud und Google Workspace Produkte einen großflächigen Ausfall aufgrund einer Häufung von 503 Fehlern bei externen API-Anfragen. Die Ursache war ein neues Feature im Service Control System, dem eine angemessene Fehlerbehandlung und Feature-Flag-Protection fehlte, was zu einer Nullzeiger-Ausnahme und einem Kaskadeneffekt führte. Eine Policy-Änderung mit ungültigen Feldern aktivierte diesen Fehler, was zu einer globalen Serviceunterbrechung führte. Google behob das Problem schnell, aber einige Regionen (wie us-central-1) erlebten aufgrund von Überlastung der Infrastruktur eine längere Wiederherstellung. Der Vorfall zeigte Probleme bei Googles Fehlerbehandlung, der Verwendung von Feature-Flags, der Modularität der Systemarchitektur sowie bei der Überwachung und Kommunikation, was zu dem Versprechen führte, umfassende Verbesserungen zu implementieren, um Wiederholungen zu vermeiden.

Mehr lesen

Google Cloud-Dienststatus: Umfassende Überwachung

2025-06-12

Die Google Cloud Platform hat eine Seite zur Echtzeitüberwachung des Status aller ihrer Dienste veröffentlicht. Die Seite listet den Betriebsstatus verschiedener Dienste auf, von Compute Engine bis AI Platform. Benutzer können die Verfügbarkeit von Diensten in verschiedenen Regionen und Multiregionen einfach überprüfen. Wenden Sie sich an den Support, wenn Sie auf ein hier nicht aufgeführtes Problem stoßen. Häufig gestellte Fragen zu Informationen und Interpretation des Dienststatus sind ebenfalls verfügbar.

Mehr lesen
Technologie Dienststatus