Analisando o Conjunto de Dados Completo do Hacker News com DuckDB
2025-04-30

O autor baixou o conjunto de dados completo do Hacker News — um arquivo JSON de 20 GB contendo tudo o que já foi postado no site — e o analisou usando o banco de dados DuckDB. O post detalha o processo de download e usa consultas SQL para calcular médias móveis de 12 semanas da frequência de menções para linguagens de programação específicas (Python, JavaScript, Java, Ruby, Rust). O autor elogia a facilidade de uso e a velocidade do DuckDB, sugerindo humoristicamente possibilidades futuras, como o treinamento de LLMs no conjunto de dados.
Desenvolvimento