Blosc2 3.0: Quebrando a Parede da Memória, Computando com Conjuntos de Dados de TB

2025-03-31
Blosc2 3.0: Quebrando a Parede da Memória, Computando com Conjuntos de Dados de TB

O Blosc2 3.0 apresenta um mecanismo de computação integrado, permitindo computação de alto desempenho em conjuntos de dados mais de 100 vezes maiores do que a RAM disponível. Ao integrar firmemente a compressão e a computação e aproveitar os caches da CPU para processar blocos de dados comprimidos, ele aborda eficazmente o problema da parede da memória. Experimentos demonstram que o Blosc2 mantém alto desempenho com conjuntos de dados de até 8 TB, superando até mesmo o desempenho na memória com armazenamento em disco para conjuntos de dados muito grandes. Este é um avanço significativo para análise de big data e computação de alto desempenho.

Desenvolvimento