Bruin: Crea pipelines de datos con SQL y Python
2024-12-17
Bruin es una potente herramienta de pipeline de datos que combina la ingestión de datos, la transformación de datos con SQL y Python y las comprobaciones de calidad de datos en un único marco. Funciona con las principales plataformas de datos y se ejecuta en tu máquina local, en una instancia de EC2 o en GitHub Actions. Las características clave incluyen la ingestión de datos, transformaciones SQL y Python, comprobaciones de calidad de datos, plantillas Jinja, validación de extremo a extremo y soporte para varios entornos. Los pipelines se definen fácilmente mediante un simple archivo pipeline.yml.
Desarrollo
pipeline de datos