微软开源MarkItDown:文件到Markdown转换工具
2024-12-13
微软开源了一个名为MarkItDown的Python工具,可以将各种文件(包括PDF、PowerPoint、Word、Excel、图片、音频和HTML等)转换成Markdown格式。该工具API简洁易用,支持多种文件类型,并包含OCR和语音转录功能,方便用户进行文本分析或索引。项目欢迎贡献,并遵循微软开源行为准则。
微软开源了一个名为MarkItDown的Python工具,可以将各种文件(包括PDF、PowerPoint、Word、Excel、图片、音频和HTML等)转换成Markdown格式。该工具API简洁易用,支持多种文件类型,并包含OCR和语音转录功能,方便用户进行文本分析或索引。项目欢迎贡献,并遵循微软开源行为准则。