Apache Hudi:ビッグデータのUpsert、削除、増分処理
2025-01-23
Apache Hudiは、複数のクラウドデータ環境にまたがるデータの取り込み、インデックス作成、保存、提供、変換、管理を行うための、高性能なオープンなテーブル形式に基づいて構築されたオープンソースのデータレイクハウスプラットフォームです。様々なデータ形式とソースをサポートし、ロールバック/復元機能付きの原子的なコミットを提供し、高速なupsert/delete機能を備えています。スケーラブルなインデックスサブシステムはクエリを高速化し、スナップショット、インクリメンタル、タイムトラベルクエリへの対応により柔軟性を高めています。Apache Hive Metastoreなどのメタデータストアとの統合も含まれています。