MarkItDown:一款好用的將文件和辦公文檔轉(zhuǎn)換為Markdown的AI工具!
MarkItDown是什么?
MarkItDown是一款由微軟支持的能夠?qū)⒍喾N文件格式(比如 PDF、Word、Excel、PowerPoint、圖像、音頻、網(wǎng)頁(yè)等)轉(zhuǎn)換為 Markdown 格式的開(kāi)源工具。它還特別針對(duì)LLM的應(yīng)用進(jìn)行了優(yōu)化,使輸出的內(nèi)容不僅適合人工閱讀,也是 LLM 的理想輸入格式。
MarkItDown功能特點(diǎn)
多格式支持:支持轉(zhuǎn)換 PDF、Word、Excel、ppt、圖片(含 OCR 識(shí)別)、音頻(語(yǔ)音轉(zhuǎn)文字)、HTML、網(wǎng)頁(yè)(如 YouTube 鏈接)等格式為結(jié)構(gòu)化 Markdown。并且保留標(biāo)題層級(jí)、表格結(jié)構(gòu)等核心內(nèi)容,適合 ai 理解與分析。
MCP 協(xié)議集成:作為 MCP 服務(wù)器,允許 AI 工具(如 Claude Desktop)通過(guò)標(biāo)準(zhǔn)協(xié)議調(diào)用文件轉(zhuǎn)換功能,無(wú)需編程即可實(shí)現(xiàn)“語(yǔ)音指令轉(zhuǎn)文件處理”。例如,用戶說(shuō)“將這份 PDF 轉(zhuǎn)成 Markdown”,AI 可自動(dòng)調(diào)用 MarkItDown 完成轉(zhuǎn)換。
MarkItDown應(yīng)用場(chǎng)景
學(xué)術(shù)研究:快速轉(zhuǎn)換論文、文獻(xiàn)為 Markdown,便于文本分析。
辦公自動(dòng)化:將會(huì)議錄音、PPT 等轉(zhuǎn)為結(jié)構(gòu)化筆記。
AI 工作流:結(jié)合 LLM 實(shí)現(xiàn)“語(yǔ)音指令→文件處理→內(nèi)容總結(jié)”全鏈路自動(dòng)化。
MarkItDown如何安裝使用?
1. 安裝與啟動(dòng)
命令行模式:
pip install markitdown-mcp markitdown-mcp # 啟動(dòng) STDIO 模式 markitdown-mcp --sse --host 127.0.0.1 --port 3001 # 啟動(dòng) SSE 服務(wù)[2,4,5](@ref)
Docker 部署:
docker build -t markitdown-mcp:latest . docker run -it --rm markitdown-mcp:latest # 默認(rèn) STDIO 模式 docker run -it --rm -v /本地目錄:/workdir markitdown-mcp:latest # 掛載本地文件[4,5](@ref)
2. 與 Claude Desktop 配置
在 claude_desktop_config.json 中添加以下配置,啟用 MarkItDown MCP 服務(wù):
{ "mcpServers": { "markitdown": { "command": "docker", "args": ["run", "--rm", "-i", "-v", "/本地目錄:/workdir", "markitdown-mcp:latest"] } } }
配置后,Claude 可直接調(diào)用文件轉(zhuǎn)換功能。
3. Python API 調(diào)用
from markitdown import MarkItDown md = MarkItDown(enable_plugins=True) result = md.convert("input.pdf") # 轉(zhuǎn)換為 Markdown 文本 print(result.text_content)
支持通過(guò) llm_client 參數(shù)接入 LLM 模型(如 GPT-4o)優(yōu)化輸出。
github:https://github.com/microsoft/markitdown/tree/main/packages/markitdown-mcp
相關(guān)文章
- 用戶登錄