Bruin: SQL과 Python으로 데이터 파이프라인 구축
2024-12-17
Bruin은 데이터 수집, SQL 및 Python을 사용한 데이터 변환, 데이터 품질 검사를 단일 프레임워크로 통합한 강력한 데이터 파이프라인 도구입니다. 주요 데이터 플랫폼과 호환되며 로컬 머신, EC2 인스턴스 또는 GitHub Actions에서 실행할 수 있습니다. 주요 기능으로는 데이터 수집, SQL 및 Python 변환, 데이터 품질 검사, Jinja 템플릿, 엔드투엔드 검증, 여러 환경 지원 등이 있습니다. 간단한 pipeline.yml 파일을 사용하여 파이프라인을 쉽게 정의할 수 있습니다.
개발
데이터 파이프라인