我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

PDF-Craft:一個掃描書籍PDF文件轉Markdown/EPUB工具

PDF-Craft是什么?

PDF-Craft是一個用于處理PDF文件的開源項目,專注于將掃描書籍的PDF轉換為Markdown或EPUB格式。它通過OCR技術識別文字,并利用ai算法提取文本、過濾頁眉頁腳等元素,生成結構化內容。支持本地計算和LLM輔助功能,適合學術論文、小冊子及長篇書籍的格式轉換。

PDF-Craft:一個掃描書籍PDF文件轉Markdown/EPUB工具.jpg

PDF-Craft功能特征

格式轉換:

  • 支持將PDF轉換為Markdown格式,適合論文或小書本。

  • 超過100頁的,可結合了本地OCR和云端LLM處理,生成帶目錄分章節的EPUB。

智能提取:

  • 使用DocLayout-YOLO和自定義算法提取正文,過濾頁眉、頁腳、腳注、頁碼等元素。

  • 在跨頁時,算法會處理前后文的順接問題。

OCR識別:

  • 使用OnnxOCR進行文字識別,支持插圖、表格和公式的截圖,并直接插入到輸出文件中。

閱讀順序優化:

  • 通過layoutreader確定符合人類閱讀習慣的順序。

LLM輔助:

  • 在EPUB轉換過程中,通過LLM(如DeepSeek)讀取注釋和引用信息,并在EPUB中呈現。

  • LLM還能在一定程度上糾正OCR錯誤。

本地運行:

  • 支持CPU和GPU加速,無需聯網即可完成大部分操作。

PDF-Craft應用場景

  • 學術研究:將掃描的學術論文轉換為Markdown或EPUB格式,便于編輯和閱讀。

  • 電子書制作:將掃描書籍轉換為EPUB格式,生成帶目錄和章節的電子書。

  • 文檔處理:提取PDF中的文字和圖像,用于進一步編輯或歸檔。

PDF-Craft:一個掃描書籍PDF文件轉Markdown/EPUB工具.webp

PDF-Craft使用方法

1. 安裝:需要Python 3.10及以上版本,支持CUDA加速。

2. PDF轉Markdown:

from pdf_craft import PDFPageExtractor, MarkDownWriter
extractor = PDFPageExtractor(device="cpu", model_dir_path="/path/to/model")
with MarkDownWriter(markdown_path, "images", "utf-8") as md:
    for block in extractor.extract(pdf="/path/to/pdf"):
        md.write(block)

3. PDF轉EPUB:

from pdf_craft import PDFPageExtractor, LLM, analyse, generate_epub_file
extractor = PDFPageExtractor(device="cpu", model_dir_path="/path/to/model")
llm = LLM(key="sk-XXXXX", url="https://api.deepseek.com", model="deepseek-chat")
analyse(llm=llm, pdf_page_extractor=extractor, pdf_path="/path/to/pdf", analysing_dir_path="/path/to/analysing", output_dir_path="/path/to/output")
generate_epub_file(from_dir_path="/path/to/output", epub_file_path="/path/to/output.epub")

github項目:https://github.com/oomol-lab/pdf-craft


收藏
最新工具
Quick Prompt
Quick Prompt

一個專注于提示詞(Prompt)的管理和快速輸入的瀏覽器擴展插件...

FoldNFly
FoldNFly

一個專注于紙飛機折疊教程的網站,提供豐富的紙飛機設計資源、制作指...

VoiceCanvas
VoiceCanvas

一款文本轉語音工具,支持 50 多種語言,具備語音克隆功能,僅需...

Loud Fame
Loud Fame

一款AI視頻生成和編輯工具,能夠將普通視頻轉換為具有動漫風格的視...

PPT世界
PPT世界

QIJ鰭跡旗下產品,集PPT模板下載、設計教程、交流社區和定制服...

職達AI簡歷
職達AI簡歷

一個專業的 AI 簡歷優化平臺,提供簡歷&求職一站式服務...

喵記多APP
喵記多APP

快手推出的邊聊天邊記錄的AI筆記,主要功能包括管理筆記,如剪藏、...

暢圖
暢圖

一款由摹客推出的AI原生可視化工具,專為個人和團隊的創意表達、知...

Ztalk ai
Ztalk ai

一個AI驅動的會議實時語音翻譯平臺,可以與 Zoom、Googl...

Supercut
Supercut

一款屏幕錄制工具,能幫你快速錄下屏幕上的內容,錄制的視頻可以自動...

主站蜘蛛池模板: 许昌市| 铅山县| 洛浦县| 依安县| 西峡县| 来宾市| 南丰县| 岳普湖县| 水城县| 白水县| 八宿县| 嘉定区| 沐川县| 托克托县| 黎平县| 藁城市| 商河县| 宁化县| 赣州市| 辉县市| 莱阳市| 伊川县| 辽源市| 盖州市| 正镶白旗| 闻喜县| 靖远县| 河曲县| 白河县| 禹城市| 东乡族自治县| 广安市| 军事| 万全县| 改则县| 炉霍县| 防城港市| 宁河县| 乌恰县| 高雄市| 库尔勒市|