Apache Hudi : Upserts, suppressions et traitement incrémental pour le Big Data
2025-01-23
Apache Hudi est une plateforme de data lakehouse open source, construite sur un format de table ouverte haute performance pour ingérer, indexer, stocker, servir, transformer et gérer vos données sur plusieurs environnements de données cloud. Il prend en charge divers formats et sources de données, offre des validations atomiques avec prise en charge de la restauration/annulation, et dispose de fonctionnalités rapides d'upsert/suppression. Un sous-système d'indexation évolutif accélère les requêtes, tandis que la prise en charge des requêtes instantanées, incrémentales et de retour dans le temps offre de la flexibilité. L'intégration avec des magasins de métadonnées tels qu'Apache Hive Metastore est également incluse.
Développement
traitement incrémental