Compressão Insana: Reduzindo 10 GB de Dados de Trânsito RATP para 530 KB com Rust

2025-03-03

Este projeto de fim de semana começou navegando no repositório de dados abertos da rede de transporte público de Paris. O autor notou uma seção sobre reutilização de dados, com projetos externos usando esses dados abertos, particularmente o site de status da RATP, que visualiza interrupções históricas. O repositório GitHub contém arquivos JSON consultados a cada 2 minutos por quase um ano, totalizando mais de 10 GB. O autor se perguntou se isso poderia ser melhor comprimido. Esta publicação detalha como eles usaram o padrão de design de interação do Rust para alcançar uma compressão 2000x! As técnicas exploradas incluem otimizar a estrutura do interador, ajustar o esquema de dados e alavancar a interação na serialização. O resultado? Uma redução impressionante de 1,1 GB de arquivos JSON para meros 530 KB.