Blosc2 3.0: 메모리 월 돌파, TB급 데이터셋으로 계산

2025-03-31
Blosc2 3.0: 메모리 월 돌파, TB급 데이터셋으로 계산

Blosc2 3.0은 통합된 연산 엔진을 통해 사용 가능한 RAM보다 100배 이상 큰 데이터셋에 대한 고성능 연산을 가능하게 합니다. 압축과 연산을 긴밀하게 통합하고 CPU 캐시를 활용하여 압축된 데이터 청크를 처리함으로써 메모리 월 문제를 효과적으로 해결합니다. 실험 결과, Blosc2는 최대 8TB의 데이터셋에서 높은 성능을 유지하며, 매우 큰 데이터셋의 경우 디스크 스토리지 성능이 메모리 성능을 능가하는 것으로 나타났습니다. 이는 빅데이터 분석과 고성능 컴퓨팅에 있어 중요한 발전입니다.