Großes Gandi-Ausfall: Eine Kaskade von Fehlern durch SSD-Speicher
2025-05-05
Am 9. März 2025 erlebte Gandi einen erheblichen Dienstausfall aufgrund eines Ausfalls eines SSD-Speichersystems, der zahlreiche Dienste, einschließlich E-Mail, betraf. Der Ausfall dauerte Stunden, wobei einige Mailboxen bis zum nächsten Tag nicht erreichbar blieben. Obwohl keine Daten verloren gingen, zeigte der Vorfall Schwächen in Gandis Redundanz und Fehlertoleranz auf, darunter unzureichende Redundanz in der internen Überwachung, fehlerhafte VM-Architektur und unzureichende Kapazität einiger redundanter Systeme. Gandi hat Verbesserungen an Redundanzmechanismen, Überwachung und Speichersystemen implementiert, um Wiederholungen zu verhindern.