Analyse de l'ensemble de données complet de Hacker News avec DuckDB

2025-04-30
Analyse de l'ensemble de données complet de Hacker News avec DuckDB

L'auteur a téléchargé l'ensemble de données complet de Hacker News - un fichier JSON de 20 Go contenant tout ce qui a jamais été publié sur le site - et l'a analysé à l'aide de la base de données DuckDB. L'article détaille le processus de téléchargement et utilise des requêtes SQL pour calculer des moyennes mobiles sur 12 semaines de la fréquence des mentions pour des langages de programmation spécifiques (Python, JavaScript, Java, Ruby, Rust). L'auteur fait l'éloge de la facilité d'utilisation et de la vitesse de DuckDB, suggérant avec humour des possibilités futures telles que l'entraînement de modèles LLM sur l'ensemble de données.

Développement