Extraction du MRR à partir des données Stripe : pièges et implémentation SQL

2025-05-16
Extraction du MRR à partir des données Stripe : pièges et implémentation SQL

Cet article détaille comment extraire des données de l’API Stripe et calculer le chiffre d’affaires mensuel récurrent (MRR). L’auteur souligne le manque de fiabilité de l’utilisation directe de l’objet `subscriptions` de Stripe, car il ne contient que le dernier état de l’abonnement. L’approche correcte utilise les `éléments de facture`, en gérant les remises, les cycles de facturation variables (mensuel, trimestriel, annuel), etc. L’article fournit du code SQL détaillé, couvrant le nettoyage des données, la normalisation des cycles et les calculs finaux des mesures MRR, y compris le nouveau MRR, le MRR de désabonnement, le MRR d’expansion et le MRR de réactivation. L’article met l’accent sur l’adaptabilité et la personnalisation de la méthode, et recommande une application pour simplifier les calculs du MRR.

Lire plus
Développement calcul du MRR API Stripe

smallpond et 3FS de DeepSeek : mettre DuckDB à l’échelle du pétaoctet

2025-03-02
smallpond et 3FS de DeepSeek : mettre DuckDB à l’échelle du pétaoctet

DeepSeek AI a publié smallpond et 3FS, conçus pour étendre la base de données DuckDB afin de gérer des ensembles de données à l’échelle du pétaoctet. smallpond est une infrastructure de traitement de données distribuée et légère qui permet à DuckDB de traiter les données en parallèle sur plusieurs nœuds, tandis que 3FS est un système de fichiers parallèle hautes performances utilisant des SSD et une mise en réseau RDMA pour un débit extrêmement élevé. Cependant, le déploiement et l’utilisation de ces outils sont complexes et nécessitent du matériel spécialisé et une expertise DevOps. Pour les ensembles de données inférieurs à 10 To, une instance DuckDB à nœud unique ou des solutions plus simples sont plus efficaces. Ce n’est que lorsqu’on gère des ensembles de données massifs que smallpond et 3FS révèlent leurs avantages.

Lire plus

Flux de données dans DuckDB : surmonter les limitations de concurrence avec Arrow Flight

2025-01-29
Flux de données dans DuckDB : surmonter les limitations de concurrence avec Arrow Flight

Un article de blog de Definite présente une solution astucieuse pour contourner les limitations de concurrence de DuckDB à l'aide d'Apache Arrow Flight. Bien que DuckDB excelle dans l'analyse sur une seule machine, l'absence de prise en charge de la lecture et de l'écriture simultanées limite son utilisation dans les scénarios de diffusion en continu en temps réel. Le script Python « Duck Takes Flight » construit un serveur Arrow Flight, permettant des écritures et des lectures simultanées dans DuckDB. Cette solution de 200 lignes est efficace, ne nécessite pas de configuration de cluster complexe et offre un traitement de flux de données hautes performances, proposant une nouvelle approche pour les applications nécessitant un déplacement rapide des données et des requêtes à la volée.

Lire plus
Développement Traitement de flux