Nanonets-OCR-s:能把圖片里的表格轉(zhuǎn)換成Markdown格式模型
Nanonets-OCR-s是什么?
Nanonets-OCR-s,能把圖片里的表格轉(zhuǎn)換成Markdown格式,而且還能識(shí)別 LaTeX 語(yǔ)法。它還能找到圖片的位置,轉(zhuǎn)換成 <img> 標(biāo)簽。簽名會(huì)被轉(zhuǎn)換成 <signature> 標(biāo)簽,復(fù)選框之類的符號(hào)會(huì)用顏文字表示。它還能處理合并單元格的表格,并輸出為 HTML 格式。這個(gè)模型大小是 3.75B,是基于 Qwen2.5-VL-3B-Instruct 微調(diào)的,所以中文支持得很好。

功能亮點(diǎn)
表格轉(zhuǎn)換:可以精準(zhǔn)提取復(fù)雜表格,并將其轉(zhuǎn)換為清晰的 Markdown 和 HTML 格式。
公式識(shí)別:能夠?qū)⑽臋n中的數(shù)學(xué)公式準(zhǔn)確轉(zhuǎn)換為 LaTeX 語(yǔ)法,無(wú)論是內(nèi)聯(lián)公式還是獨(dú)立公式都能輕松應(yīng)對(duì)。
圖像處理:自動(dòng)識(shí)別文檔中的圖片,并用 <img> 標(biāo)簽進(jìn)行描述,方便后續(xù)處理。
簽名與水印提取:可以檢測(cè)到文檔中的簽名和水印,并分別用 <signature> 和 <watermark> 標(biāo)簽標(biāo)記出來(lái)。
復(fù)選框處理:將文檔中的復(fù)選框和單選按鈕轉(zhuǎn)換為標(biāo)準(zhǔn)的 Unicode 符號(hào),方便閱讀和編輯。
使用方式
通過(guò) Python 庫(kù):
安裝必要的庫(kù)(如 transformers 等)。
加載預(yù)訓(xùn)練模型,然后處理圖像并提取內(nèi)容。
通過(guò)服務(wù)器接口:
啟動(dòng)服務(wù)器,通過(guò) Python 和相關(guān)客戶端發(fā)送請(qǐng)求,獲取轉(zhuǎn)換結(jié)果。
通過(guò)簡(jiǎn)化工具:
使用 docext 等工具,一鍵啟動(dòng)應(yīng)用,簡(jiǎn)化操作流程。
適用場(chǎng)景
學(xué)術(shù)研究:快速將論文中的公式、圖表和表格轉(zhuǎn)換為可編輯的 Markdown 格式,方便整理和進(jìn)一步研究。
商業(yè)辦公:處理合同、報(bào)表等文件,提取關(guān)鍵信息并保持格式一致,提高工作效率。
法律領(lǐng)域:識(shí)別和隔離簽名、水印等重要元素,確保文檔的完整性和準(zhǔn)確性。
優(yōu)勢(shì)
功能強(qiáng)大:能識(shí)別多種文檔元素,滿足不同場(chǎng)景的需求。
智能高效:通過(guò)智能識(shí)別和語(yǔ)義標(biāo)記,讓輸出內(nèi)容更易于處理。
輕量便捷:模型大小適中,基于現(xiàn)有技術(shù)優(yōu)化,支持中文。
項(xiàng)目地址
https://huggingface.co/nanonets/Nanonets-OCR-s
提交您的產(chǎn)品
Ai應(yīng)用
Ai資訊
AI生圖
AI生視頻
開(kāi)源AI應(yīng)用平臺(tái)










