MarkItDown 是一个 Python 工具,可以把各种文件格式转换为 Markdown,专为大语言模型和文本分析场景优化。它在输出干净、Token 高效的 Markdown 的同时,会保留文档结构(标题、列表、表格、超链接)。
当用户有以下需求时,使用本 Skill:
将多种文件格式(PDF、Office 文档、图片、网页内容、结构化数据)转换为针对大语言模型优化的 Markdown。适用场景包括:文档转 Markdown、从 PDF / Office 文件中提取文本、图片 OCR 等。