Umi-OCR:免費,開源,可批量的離線OCR工具
Umi-OCR是什么?
Umi-OCR 是一款基于百度的 PaddleOCR 框架開發的開源、免費的離線OCR 工具,支持截屏/批量導入圖片,PDF文檔識別,排除水印/頁眉頁腳,掃描/生成二維碼,內置多國語言庫等功能,具有高精度識別、離線運行、多語言支持、高效批處理等優勢。
Umi-OCR功能特點
離線運行:完全離線使用,無需網絡連接,保護用戶隱私。
多語言支持:內置多國語言庫,支持多種語言的文字識別。
多種識別功能:
截圖 OCR:支持屏幕截圖、粘貼圖片進行文字識別。
批量 OCR:可批量導入圖片進行文字識別,支持多種圖片格式。
PDF 識別:支持從 PDF 文檔中提取文字,可排除頁眉、頁腳等。
二維碼識別:支持掃碼和生成二維碼。
公式識別:支持數學公式識別(測試中)。
文本后處理:支持對識別結果進行排版整理,排除干擾文字。
靈活調用:支持命令行和 HTTP 接口調用,方便開發者集成。
Umi-OCR技術特性
高精度識別:內置多種語言模型,支持簡/繁中文、英文、日文、韓文及常見歐洲語言,兼容混合排版文本識別。
復雜版式解析:精準識別豎排文字、表格和簡單數學公式。
低質量圖像優化:針對模糊、傾斜、低光照圖片進行預處理,提升識別準確率。
高效批處理與靈活輸出:支持拖拽文件夾或批量導入圖片,一鍵完成數百文件的OCR識別。
Umi-OCR使用場景
辦公場景:快速提取掃描版PDF、圖片報告中的文字,轉換為可編輯文檔。
學術研究:識別外文文獻、古籍資料,輔助翻譯與引用。
多媒體處理:為視頻截圖、漫畫翻譯、游戲字幕提供文字提取支持。
自動化流程:通過命令行接口集成到其他工具鏈,實現批量OCR自動化。
Umi-OCR下載與使用
下載鏈接:
藍奏云(國內推薦,免注冊/無限速):https://hiroi-sora.lanzoul.com/s/umi-ocr
GitHub Release:https://github.com/hiroi-sora/Umi-OCR/releases/tag/v2.1.4
安裝方式:解壓即用,無需安裝。支持Windows 7 x64和Linux x64平臺。
命令行安裝:通過Scoop安裝(Windows):
scoop install extras/umi-ocr
未來計劃
重構底層插件機制。
添加在線OCR API插件。
實現獨立的數學公式識別插件。
支持圖片翻譯和離線翻譯。
兼容MacOS和更多Linux發行版
前兩天介紹的一個olmOCR也不錯,只要測重PDF的轉換,也可以試下。