MarkItDown:一款好用的將文件和辦公文檔轉換為Markdown的AI工具!
MarkItDown是什么?
MarkItDown是一款由微軟支持的能夠將多種文件格式(比如 PDF、Word、Excel、PowerPoint、圖像、音頻、網頁等)轉換為 Markdown 格式的開源工具。它還特別針對LLM的應用進行了優化,使輸出的內容不僅適合人工閱讀,也是 LLM 的理想輸入格式。
MarkItDown功能特點
多格式支持:支持轉換 PDF、Word、Excel、ppt、圖片(含 OCR 識別)、音頻(語音轉文字)、HTML、網頁(如 YouTube 鏈接)等格式為結構化 Markdown。并且保留標題層級、表格結構等核心內容,適合 ai 理解與分析。
MCP 協議集成:作為 MCP 服務器,允許 AI 工具(如 Claude Desktop)通過標準協議調用文件轉換功能,無需編程即可實現“語音指令轉文件處理”。例如,用戶說“將這份 PDF 轉成 Markdown”,AI 可自動調用 MarkItDown 完成轉換。
MarkItDown應用場景
學術研究:快速轉換論文、文獻為 Markdown,便于文本分析。
辦公自動化:將會議錄音、PPT 等轉為結構化筆記。
AI 工作流:結合 LLM 實現“語音指令→文件處理→內容總結”全鏈路自動化。
MarkItDown如何安裝使用?
1. 安裝與啟動
命令行模式:
pip install markitdown-mcp markitdown-mcp # 啟動 STDIO 模式 markitdown-mcp --sse --host 127.0.0.1 --port 3001 # 啟動 SSE 服務[2,4,5](@ref)
Docker 部署:
docker build -t markitdown-mcp:latest . docker run -it --rm markitdown-mcp:latest # 默認 STDIO 模式 docker run -it --rm -v /本地目錄:/workdir markitdown-mcp:latest # 掛載本地文件[4,5](@ref)
2. 與 Claude Desktop 配置
在 claude_desktop_config.json 中添加以下配置,啟用 MarkItDown MCP 服務:
{ "mcpServers": { "markitdown": { "command": "docker", "args": ["run", "--rm", "-i", "-v", "/本地目錄:/workdir", "markitdown-mcp:latest"] } } }
配置后,Claude 可直接調用文件轉換功能。
3. Python API 調用
from markitdown import MarkItDown md = MarkItDown(enable_plugins=True) result = md.convert("input.pdf") # 轉換為 Markdown 文本 print(result.text_content)
支持通過 llm_client 參數接入 LLM 模型(如 GPT-4o)優化輸出。
github:https://github.com/microsoft/markitdown/tree/main/packages/markitdown-mcp