Apache Iceberg: Um Formato de Tabela Confiável para Análise de Big Data
2025-01-26
O Apache Iceberg é um formato de alto desempenho para tabelas analíticas massivas. Ele permite que mecanismos como Spark, Trino, Flink e outros trabalhem com segurança nas mesmas tabelas concorrentemente. O Iceberg suporta comandos SQL flexíveis para mesclar dados, atualizar linhas e excluir dados específicos, otimizando o desempenho de leitura e gravação por meio de reescrita de arquivos de dados ou atualizações delta. Além disso, ele oferece particionamento oculto, viagens no tempo e recursos de rollback para consultas eficientes e gerenciamento de dados.
Desenvolvimento
formato de tabela