廣東振越智能家具有限公司—主營:密集架,智能密集架,電動密集架,檔案密集架,是一家專注檔案裝具設(shè)備生產(chǎn)廠家。

index_06
ban

檔案密集架紙質(zhì)檔案數(shù)字復(fù)制件光學(xué)字符識別(OCR)工作規(guī)范(三)

文章出處:密集架廠家    人氣:    發(fā)表時間:2021-05-06 11:51:47

8 檔案 OCR質(zhì)量要求

8.1 識別準確率

8.1.1 檔案 OCR對檔案中文、數(shù)字、英文印刷體的識別準確率在95%以上。

8.1.2 檔案 OCR對常用簽名識別準確率達到90%以上,手寫體識別準確率達到80%以上。

8.2 強抗噪能力

8.2.1 檔案 OCR應(yīng)當具備對噪點的強抵抗能力,識別過程中能夠有效屏蔽較大程度的噪點干擾。

8.2.2 檔案 OCR 應(yīng)能準確判別紙質(zhì)檔案數(shù)字復(fù)制件上的污點、污線、黑邊、紙張褪變斑點、水漬、污點、裝訂孔等,提高識別準確率。

8.3 識別速度

8.3.1 識別速度指標與識別準確率指標應(yīng)同時適用。

檔案密集架圖

8.3.2 在主流計算機軟硬件平臺下,A4紙幅面中文識別速度不低于1000字/s,英文識別速度不低于2000字/s。

8.4 版面還原度

8.4.1 應(yīng)實現(xiàn)復(fù)雜版面的精確還原,采用分欄技術(shù),智能分析中文(簡體、繁體)、英文字體,文、表、圖混排文本,識別后無需人工干預(yù),自動還原排版。

8.4.2 識別后的文檔與原導(dǎo)入圖像版面還原度應(yīng)達到90%以上。

9 檔案 OCR成果的管理與應(yīng)用

9.1 成果管理

9.1.1 應(yīng)保持檔案 OCR成果各組成要素對應(yīng)的紙質(zhì)檔案數(shù)字復(fù)制件、檔案目錄、元數(shù)據(jù)之間的邏輯層次和關(guān)聯(lián)關(guān)系。

9.1.2 以純文本形式保存的檔案 OCR成果應(yīng)使用檔號作為文件名,可在存儲載體中以檔號為基礎(chǔ)逐級建立層次文件夾單獨保存,也可與紙質(zhì)檔案數(shù)字復(fù)制件統(tǒng)一保存。

9.1.3 支持全文檢索的雙層 PDF或 OFD文件可與對應(yīng)的紙質(zhì)檔案數(shù)字復(fù)制件統(tǒng)一存儲。數(shù)字檔案館(室)應(yīng)用系統(tǒng)應(yīng)記錄并維護不同文件版本之間的聯(lián)系。

檔案密集架側(cè)面圖

9.1.4 檔案 OCR成果文件管理權(quán)限應(yīng)與紙質(zhì)檔案數(shù)字復(fù)制件相同。

9.1.5 OCR成果應(yīng)與紙質(zhì)檔案數(shù)字復(fù)制件同步開展數(shù)據(jù)備份工作。

9.2 成果應(yīng)用

9.2.1 檔案 OCR成果應(yīng)通過數(shù)字檔案館(室)應(yīng)用系統(tǒng)實現(xiàn)全文檢索,提高檔案信息檢索效率。

9.2.2 可發(fā)揮檔案 OCR成果提取的歸檔信息和黨政機關(guān)公文要素的作用,輔助開展檔案自動著錄、目錄質(zhì)量核查,以及紙質(zhì)檔案數(shù)字復(fù)制件掛接準確性核查等業(yè)務(wù)工作。

9.2.3 可利用檔案 OCR成果,結(jié)合數(shù)據(jù)挖掘技術(shù)開展數(shù)據(jù)分析、知識管理、詞庫建設(shè)等工作。

密集架招標-振越集團
廣東振越智能家具有限公司
振 越 集 團振 越 智 造
源頭廠家一站式服務(wù)
辦公家具定點供應(yīng)商
國家高新技術(shù)企業(yè)
中標率高達90%

添加微信聯(lián)系

138-2629-3157