【廣告】
對(duì)于圖書館、檔案館和博物館,歷史資料的數(shù)字化需要面臨更大的挑戰(zhàn)。在建立和投資一個(gè)合適的數(shù)字化平臺(tái)時(shí),專業(yè)的書刊掃描儀類型的選擇是非常重要的一個(gè)環(huán)節(jié)。該文章的目的是提供一些基礎(chǔ)信息,幫助你理解和判斷數(shù)字化系統(tǒng)的關(guān)鍵功能和質(zhì)量控制,少走一些彎路,做出正確的選擇。目前市場(chǎng)上依據(jù)使用的目的,主要有兩種書刊掃描儀系統(tǒng):由線性掃描CCD傳感器、鏡頭和燈光單元組成的頂置式線形CCD 掃描儀和頂置式拍照掃描儀。
掃描儀分辨率越高,從初始文檔收集的關(guān)鍵點(diǎn)和層級(jí)就越。比照二種種類CCD掃描系統(tǒng)軟件,真正的分辨率是很重要的。掃描儀就是不可以選用手機(jī)軟件插值的方式提升分辨率。整體而言,上百萬(wàn)像素的CCD控制器數(shù)據(jù)信息是用于敘述掃描系統(tǒng)軟件的總分辨率,而實(shí)際上,真正的分辨率顯著小于此。一個(gè)4000萬(wàn)像素集成ic包括了兩千萬(wàn)像素翠綠色信息、一千萬(wàn)像素紅色信息和一千萬(wàn)像素深藍(lán)色信息。
專業(yè)的書刊掃描儀,可以放在桌面上使用,不管你掃描多厚的書籍都沒(méi)有問(wèn)題,掃描效果很好,閱讀體驗(yàn)沒(méi)有問(wèn)題,優(yōu)點(diǎn)是成像效果好,不會(huì)產(chǎn)生書籍陰影,缺點(diǎn)是價(jià)格貴,這是一個(gè)國(guó)內(nèi)很神奇的產(chǎn)品,得益于國(guó)人強(qiáng)大的模仿創(chuàng)新能力,它的原理很簡(jiǎn)單,就是一個(gè)攝像頭拍照的原理,價(jià)格很便宜,優(yōu)點(diǎn)是價(jià)格便宜,體積小巧,方便攜帶。缺點(diǎn)是使用效果對(duì)環(huán)境依賴性很大,就是說(shuō)光線好的地方圖像才能比較清晰。
掃描儀可以將表格識(shí)別直接還原成PDF、TIFF不壓縮、JPEG等格式的文檔??梢詫?duì)圖像嵌入橫排文本和豎排文本,對(duì)表格文本進(jìn)行自動(dòng)排版分析。OCR軟件主要是由圖像處理模塊、版面劃分模塊、文字識(shí)別模塊和文字編輯模塊等4部分組成。圖像處理模塊:主要具有文稿掃描、圖像縮放、圖像旋轉(zhuǎn)等功能。通過(guò)掃描儀輸入后,文稿形成圖像文件,圖像處理模塊可對(duì)圖像進(jìn)行放大,去除污點(diǎn)和劃痕,如果圖像放置不正