Serveur MCP pour récupérer le contenu des pages web à l'aide du navigateur headless Playwright

2025-03-20
Serveur MCP pour récupérer le contenu des pages web à l'aide du navigateur headless Playwright

Ce projet propose un serveur MCP qui utilise le navigateur headless Playwright pour récupérer le contenu des pages web. Il prend en charge la récupération d'URL uniques et par lots, extrait intelligemment le contenu principal et le convertit en Markdown. Les utilisateurs peuvent l'exécuter directement avec `npx` et configurer des paramètres tels que le délai d'attente, la stratégie d'attente, l'extraction de contenu, la longueur maximale et s'ils doivent renvoyer du HTML ou du Markdown. Des instructions pour configurer le serveur dans Claude Desktop, installer les navigateurs Playwright et le déboguer sont également fournies.

Développement Serveur MCP Scraping web