AWS S3: 저렴한 하드 드라이브로 구동되는 초대규모 스토리지 시스템

이 글에서는 Amazon S3의 놀라운 규모와 그 기반 기술을 밝힙니다. S3는 저렴한 HDD를 활용하여 대규모 병렬 처리, 이레이저 코딩, 그리고 정교한 부하 분산 기술(예: '두 개의 무작위 선택의 힘')을 통해 HDD의 느린 랜덤 I/O라는 병목 현상을 극복합니다. 이를 통해 초당 수백만 건의 요청, 초고속 처리량, 그리고 탁월한 가용성을 달성합니다. S3의 데이터 저장 전략에는 무작위 데이터 배치, 지속적인 데이터 재균형, 그리고 규모에 따른 부하 평준화 효과가 포함되어 핫스팟을 방지합니다. 사용자, 클라이언트, 서버의 세 가지 수준에서 병렬 처리를 통해 성능이 더욱 향상됩니다. 궁극적으로 S3는 백업 및 이미지 저장 서비스에서 빅데이터 분석 및 머신 러닝의 중요한 인프라로 발전했습니다.
더 보기