Caída Mayor de Gandi: Una Cascada de Fallos Causada por un Almacenamiento SSD
El 9 de marzo de 2025, Gandi experimentó una interrupción significativa del servicio causada por una falla en un sistema de almacenamiento SSD, afectando numerosos servicios, incluido el correo electrónico. La interrupción duró horas, con algunos buzones de correo permaneciendo inaccesibles hasta el día siguiente. Si bien no se perdieron datos, el incidente puso de manifiesto las debilidades en la redundancia y la tolerancia a fallos de Gandi, incluida la redundancia insuficiente en el monitoreo interno, la arquitectura de VM defectuosa y la capacidad insuficiente en algunos sistemas redundantes. Gandi ha implementado mejoras en los mecanismos de redundancia, ha mejorado el monitoreo y ha actualizado los sistemas de almacenamiento para evitar que se repita.
Leer más