Apache DataFusion : Un moteur de requête extensible et performant en Rust
2025-01-16
Apache DataFusion est un moteur de requête extensible écrit en Rust qui utilise Apache Arrow comme format mémoire. Il offre des API SQL et DataFrame, des performances excellentes et un support intégré pour CSV, Parquet, JSON et Avro. DataFusion possède un planificateur de requêtes complet, un moteur d'exécution colonnaire, en streaming, multithreadé, vectorisé et des sources de données partitionnées. Il est hautement personnalisable, permettant l'ajout de sources de données, de langages de requête, de fonctions, d'opérateurs personnalisés et plus encore. Des sous-projets connexes incluent DataFusion Python (liaisons Python), DataFusion Ray (version distribuée) et DataFusion Comet (accélérateur Apache Spark).
Développement
Moteur de Requête