Gandi 대규모 서비스 중단: SSD 스토리지 오류로 인한 연쇄 반응

2025-05-05

2025년 3월 9일, Gandi는 SSD 스토리지 파일 시스템 오류로 인해 대규모 서비스 장애를 경험했으며, 이메일을 포함한 여러 서비스에 영향을 미쳤습니다. 장애는 수 시간 동안 지속되었으며, 일부 메일 박스는 다음 날까지 복구되지 않았습니다. 데이터 손실은 없었지만, 이 사건은 내부 모니터링 시스템의 중복성 부족, 잘못된 VM 아키텍처, 일부 중복 시스템의 용량 부족 등 Gandi 시스템의 중복성 및 내결함성의 취약점을 드러냈습니다. Gandi는 중복 메커니즘 개선, 모니터링 강화, 스토리지 시스템 업그레이드를 통해 유사한 사건의 재발을 방지할 계획입니다.