Blosc2 3.0:メモリウォールを突破、TB規模のデータセットで計算
2025-03-31

Blosc2 3.0は、統合された計算エンジンによって、利用可能なRAMの100倍を超えるサイズのデータセットに対する高性能計算を実現します。圧縮と計算を密接に統合し、CPUキャッシュを活用して圧縮されたデータチャンクを処理することで、メモリウォール問題を効果的に解決します。実験により、Blosc2は最大8TBのデータセットで高いパフォーマンスを維持し、非常に大規模なデータセットでは、ディスクストレージによるパフォーマンスがメモリ上でのパフォーマンスを上回ることが示されました。これは、ビッグデータ分析と高性能コンピューティングにとって重要な進歩です。
開発