2014년 페이스북 대규모 장애: 왜 '전시 상황실'이 철저한 조사에 적합하지 않은가
2025-02-23
저자는 사내에서 '경찰에 신고'라고 불렸던 2014년 8월 1일 발생한 페이스북 대규모 장애에 대해 이야기합니다. 좁고 답답한 '전시 상황실'에서는 근본 원인을 효과적으로 조사하는 것이 불가능하다는 것을 알게 되었습니다. 결국 편안한 자신의 작업 공간으로 돌아가 18일간의 조사 끝에 문제의 원인을 밝혀냈습니다. 'fbagent'라는 프로세스가 잘못해서 모든 프로세스에 종료 신호를 보낸 것이 시스템 장애의 원인이었습니다. 이 경험은 비상시 적절한 개인 작업 환경의 중요성과 신속한 수정보다 철저한 조사의 가치를 보여줍니다.