Microsoft open-source MarkItDown : un outil de conversion de fichiers en Markdown

2024-12-13

Microsoft a open-sourcé MarkItDown, un outil Python qui convertit divers fichiers (PDF, PowerPoint, Word, Excel, images, audio et HTML) au format Markdown. L'API est simple, il supporte une large gamme de formats de fichiers et intègre la reconnaissance optique de caractères (OCR) et la transcription vocale, ce qui le rend idéal pour l'analyse de texte ou l'indexation. Les contributions sont les bienvenues, et le projet respecte le Code de conduite open source de Microsoft.