효율적인 클라우드 네이티브 래스터 데이터 액세스: Rasterio/GDAL의 대안

2024-12-15

클라우드 스토리지의 지구 관측 데이터 기하급수적 증가로 인해 위성 이미지에 대한 효율적인 액세스 및 분석이 필수적입니다. 본 논문에서는 Rasterio/GDAL의 대안으로 클라우드 네이티브 래스터 데이터 액세스의 대체 접근 방식을 소개합니다. 기존 GeoTIFF는 비효율적이지만 클라우드 최적화 GeoTIFF(COG)는 타일링 및 다중 해상도 액세스를 통해 효율성을 향상시킵니다. 그러나 COG를 사용하더라도 시계열 NDVI 분석과 같은 작업은 대기 시간의 영향을 받습니다. 따라서 저자들은 미리 계산된 바이트 범위와 결합된 STAC GeoParquet을 활용하여 HTTP 요청을 줄이고 데이터 액세스 속도를 크게 향상시켰습니다. 초기 벤치마크 결과에 따르면 이 접근 방식을 통해 Sentinel-2 데이터의 첫 번째 타일 가져오기 시간이 크게 단축되고 비용도 절감되는 것으로 나타났습니다. 앞으로 “Rasteret”이라는 오픈소스 라이브러리가 이러한 기술을 구현할 예정입니다.