Apache DataFusion: Un potente motor de consultas extensible en Rust
2025-01-16
Apache DataFusion es un motor de consultas extensible escrito en Rust que utiliza Apache Arrow como su formato de memoria. Ofrece APIs SQL y DataFrame, cuenta con un excelente rendimiento y soporte integrado para CSV, Parquet, JSON y Avro. DataFusion dispone de un planificador de consultas completo, un motor de ejecución columnar, en streaming, multi-hilo, vectorizado y fuentes de datos particionadas. Es altamente personalizable, permitiendo la adición de fuentes de datos, lenguajes de consulta, funciones, operadores personalizados y mucho más. Subproyectos relacionados incluyen DataFusion Python (enlaces Python), DataFusion Ray (versión distribuida) y DataFusion Comet (acelerador Apache Spark).
Desarrollo
Motor de Consultas