Extracción de MRR de datos de Stripe: Problemas y implementación en SQL

2025-05-16
Extracción de MRR de datos de Stripe: Problemas y  implementación en SQL

Este artículo detalla cómo extraer datos de la API de Stripe y calcular los Ingresos Recurrentes Mensuales (MRR). El autor destaca la poca fiabilidad de usar directamente el objeto `subscriptions` de Stripe, ya que solo contiene el estado más reciente de la suscripción. El enfoque correcto utiliza los `elementos de la factura`, gestionando descuentos, ciclos de facturación variables (mensual, trimestral, anual), etc. El artículo proporciona código SQL detallado, que abarca la limpieza de datos, la normalización de ciclos y los cálculos finales de las métricas de MRR, incluyendo nuevo MRR, MRR de baja, MRR de expansión y MRR de reactivación. El artículo enfatiza la adaptabilidad y la capacidad de personalización del método, y recomienda una aplicación para simplificar los cálculos de MRR.

Leer más
Desarrollo API de Stripe

smallpond y 3FS de DeepSeek: Escalando DuckDB a Petabytes

2025-03-02
smallpond y 3FS de DeepSeek: Escalando DuckDB a Petabytes

DeepSeek AI ha lanzado smallpond y 3FS, diseñados para extender la base de datos DuckDB para manejar conjuntos de datos a escala de petabytes. smallpond es un framework de procesamiento de datos distribuido y ligero que permite a DuckDB procesar datos en paralelo en múltiples nodos, mientras que 3FS es un sistema de archivos paralelo de alto rendimiento que utiliza SSD y redes RDMA para un alto rendimiento. Sin embargo, la implementación y el uso de estas herramientas son complejos, requieren hardware especializado y experiencia en DevOps. Para conjuntos de datos inferiores a 10 TB, una instancia de DuckDB de un solo nodo o soluciones más simples son más eficientes. Solo al manejar conjuntos de datos masivos, smallpond y 3FS muestran sus ventajas.

Leer más

Datos en Streaming en DuckDB: Superando las Limitaciones de Concurrencia con Arrow Flight

2025-01-29
Datos en Streaming en DuckDB: Superando las Limitaciones de Concurrencia con Arrow Flight

Una publicación en el blog de Definite muestra una solución inteligente para superar las limitaciones de concurrencia de DuckDB utilizando Apache Arrow Flight. Si bien DuckDB sobresale en el análisis de una sola máquina, la falta de soporte para escritura y lectura concurrente limita su uso en escenarios de transmisión en tiempo real. El script de Python 'Duck Takes Flight' construye un servidor Arrow Flight, permitiendo escrituras y lecturas concurrentes en DuckDB. Esta solución de 200 líneas es eficiente, no requiere una configuración compleja de clúster y ofrece procesamiento de transmisión de alto rendimiento, ofreciendo un nuevo enfoque para aplicaciones que necesitan un movimiento rápido de datos y consultas sobre la marcha.

Leer más