Webtagr - Sumário de Notícias de Tecnologia

Extraindo MRR de Dados do Stripe: Armadilhas e Implementação em SQL

2025-05-16

Este artigo detalha como extrair dados da API do Stripe e calcular a Receita Mensal Recorrente (MRR). O autor destaca a não confiabilidade do uso direto do objeto `subscriptions` do Stripe, pois ele contém apenas o estado mais recente da assinatura. A abordagem correta utiliza os `itens da fatura`, tratando descontos, ciclos de faturamento variados (mensal, trimestral, anual) e muito mais. O artigo fornece código SQL detalhado, cobrindo a limpeza de dados, normalização de ciclos e os cálculos finais das métricas de MRR, incluindo novo MRR, MRR de churn, MRR de expansão e MRR de reativação. O artigo enfatiza a adaptabilidade e personalização do método e recomenda um aplicativo para simplificar os cálculos de MRR.

smallpond e 3FS da DeepSeek: Escalonando o DuckDB para Petabytes

2025-03-02

A DeepSeek AI lançou o smallpond e o 3FS, projetados para expandir o banco de dados DuckDB para lidar com conjuntos de dados em escala de petabytes. O smallpond é uma estrutura de processamento de dados distribuída e leve que permite que o DuckDB processe dados em paralelo em vários nós, enquanto o 3FS é um sistema de arquivos paralelo de alto desempenho que utiliza SSDs e rede RDMA para alta taxa de transferência. No entanto, a implantação e o uso dessas ferramentas são complexos, exigindo hardware especializado e experiência em DevOps. Para conjuntos de dados abaixo de 10 TB, uma instância de DuckDB de nó único ou soluções mais simples são mais eficientes. Somente ao lidar com conjuntos de dados massivos o smallpond e o 3FS mostram suas vantagens.

Dados em Streaming no DuckDB: Superando Limitações de Concorrência com Arrow Flight

2025-01-29

Um post no blog da Definite apresenta uma solução inteligente para superar as limitações de concorrência do DuckDB usando o Apache Arrow Flight. Embora o DuckDB se destaque na análise de máquina única, a falta de suporte para gravação e leitura concorrentes restringe seu uso em cenários de streaming em tempo real. O script Python 'Duck Takes Flight' constrói um servidor Arrow Flight, permitindo gravações e leituras concorrentes no DuckDB. Essa solução de 200 linhas é eficiente, não requer configuração complexa de cluster e oferece processamento de stream de alto desempenho, oferecendo uma nova abordagem para aplicativos que precisam de movimentação rápida de dados e consultas em tempo real.