PDFlux是一款智能表格提取的神器,目前有支持macOS、Windows系統(tǒng)、小程序以及瀏覽器插件,可以一鍵識(shí)別、一鍵提取PDF、掃描件、圖片中的表格、文本段落、圖片等要素,讓用戶能夠能夠智能的提取來自PDF的表格,并且還能夠進(jìn)行文件上面的轉(zhuǎn)換,相信這是很多的用戶在辦公或者學(xué)習(xí)當(dāng)中所遇到的問題,pdf當(dāng)中躲避表格提取變成了非常大的問題,使用非常方便。
軟件功能
1、表格識(shí)別
精準(zhǔn)識(shí)別無線框表格。
精準(zhǔn)識(shí)別復(fù)雜排版頁面的表格。
精準(zhǔn)識(shí)別表格內(nèi)部單元格合并。
跨頁表格自動(dòng)合并。
支持掃描件的表格識(shí)別:去除印章、角度矯正。
2、格式轉(zhuǎn)換
將PDF轉(zhuǎn)化為Word、Excel、HTML等格式。
將PDF轉(zhuǎn)化為EPUB、MOBI等電子書格式,可以在手機(jī)或Kindle等電紙書上閱讀。
精準(zhǔn)保留文本段落、表格等內(nèi)容塊信息。
精準(zhǔn)識(shí)別文檔的章節(jié)目錄結(jié)構(gòu)。
支持復(fù)雜排版的PDF文檔的轉(zhuǎn)換。
3、SaaS服務(wù)
提供一套完整易用的REST API,供計(jì)算機(jī)調(diào)用,讓您把PDF復(fù)雜格式拋諸腦后。
將PDF文檔解析為文本段落、表格、圖片等內(nèi)容塊的序列,保留原文檔的閱讀順序。
支持中英文多欄復(fù)雜排版的PDF文檔解析,跨欄和跨頁內(nèi)容塊智能自動(dòng)合并。
智能識(shí)別表格的內(nèi)部結(jié)構(gòu):?jiǎn)卧窈喜?,單元格文字的?duì)齊方式、縮進(jìn)、顏色、加粗、斜體等樣式信息,跨頁和跨欄表格智能合并單元格文字。
智能識(shí)別文檔的目錄結(jié)構(gòu),支持多達(dá)10個(gè)層級(jí),長(zhǎng)文檔信息抽取必不可少。
支撐后續(xù)各類文檔智能的應(yīng)用:PDF文檔全文檢索、文檔級(jí)別信息抽取等。
更新日志
1.增加文檔內(nèi)容收藏功能,支持通過收藏的內(nèi)容找到原文。
2.優(yōu)化登錄后的界面樣式,支持無需打開文件即可使用文檔格式轉(zhuǎn)換和文檔版本對(duì)比功能。
3.優(yōu)化添加表格線相關(guān)邏輯及樣式,支持在已經(jīng)合并的單元格內(nèi)添加新的表格線。
4.修復(fù)在網(wǎng)絡(luò)不暢等情況下使用識(shí)別表格功能后出現(xiàn)的客戶端卡頓等異常。
5.修復(fù)在繪制表格時(shí)偶發(fā)的崩潰問題。