Stripe 데이터에서 MRR 추출: 함정과 SQL 구현

2025-05-16
Stripe 데이터에서 MRR 추출: 함정과 SQL 구현

이 글에서는 Stripe API에서 데이터를 추출하고 월간 반복 수익(MRR)을 계산하는 방법을 자세히 설명합니다. 저자는 Stripe의 `subscriptions` 객체를 직접 사용하는 것이 신뢰할 수 없다고 강조합니다. 이는 최신 구독 상태만 포함하고 있기 때문입니다. 올바른 방법은 `invoice line items`를 사용하고 할인, 다양한 청구 주기(월별, 분기별, 연간 등) 등을 처리하는 것입니다. 이 글에서는 데이터 정리, 주기 정규화, 최종 MRR 지표 계산(신규 MRR, 이탈 MRR, 확장 MRR, 재활성화 MRR 등)을 포함한 자세한 SQL 코드를 제공합니다. 이 방법은 조정 가능하고 사용자 지정이 가능하며 MRR 계산을 간소화하는 애플리케이션을 소개합니다.

더 보기
개발 MRR 계산

DeepSeek의 smallpond와 3FS: 페타바이트급 DuckDB 확장

2025-03-02
DeepSeek의 smallpond와 3FS: 페타바이트급 DuckDB 확장

DeepSeek AI는 페타바이트 규모의 데이터셋을 처리하기 위해 DuckDB 데이터베이스를 확장하는 smallpond와 3FS를 출시했습니다. smallpond는 경량 분산 데이터 처리 프레임워크로, DuckDB가 여러 노드에서 병렬 처리를 할 수 있도록 합니다. 반면 3FS는 SSD와 RDMA 네트워킹 기술을 활용한 고성능 병렬 파일 시스템입니다. 하지만 이러한 도구의 배포 및 사용은 복잡하며, 전문적인 하드웨어와 DevOps 전문 지식이 필요합니다. 10TB 미만의 데이터셋의 경우 단일 노드 DuckDB 인스턴스나 더 간단한 솔루션이 더 효율적입니다. 페타바이트 규모의 데이터셋을 처리할 때만 smallpond와 3FS가 이점을 제공합니다.

더 보기

DuckDB의 스트리밍 데이터 처리: Arrow Flight를 사용한 동시 쓰기 제한 극복

2025-01-29
DuckDB의 스트리밍 데이터 처리: Arrow Flight를 사용한 동시 쓰기 제한 극복

Definite 블로그 게시물에서는 Apache Arrow Flight를 사용하여 DuckDB의 동시 쓰기 제한을 극복하는 영리한 해결책을 보여줍니다. DuckDB는 단일 머신 분석에서 뛰어나지만, 동시 쓰기 및 읽기 지원이 부족하여 실시간 스트리밍 시나리오에서 사용이 제한됩니다. "Duck Takes Flight"라는 Python 스크립트는 Arrow Flight 서버를 구축하여 DuckDB에 대한 동시 쓰기 및 읽기를 가능하게 합니다. 이 200줄의 코드로 구성된 솔루션은 효율적이며 복잡한 클러스터 설정이 필요 없고, 고성능 스트림 처리를 제공하여 빠른 데이터 이동과 즉석 쿼리가 필요한 애플리케이션에 새로운 접근 방식을 제공합니다.

더 보기
개발