-
期刊掃描加工
數(shù)字化正在取代紙質(zhì)本,成為學(xué)術(shù)期刊傳播的主要甚至是唯一渠道。
大型期刊數(shù)據(jù)庫給學(xué)術(shù)傳播帶來的最大變化是讀者(學(xué)者)閱讀學(xué)術(shù)文獻(xiàn)的習(xí)慣發(fā)生了徹底改變:由讀紙本的期刊變?yōu)樽x數(shù)據(jù)庫。 ?
這一變化給以傳統(tǒng)紙本期刊的影響是致命的:社科期刊這一獨(dú)立存在的個體已迷失在網(wǎng)絡(luò)的海洋之中。從傳播效果看,讀者樂意為這樣的數(shù)據(jù)庫而改變自己的閱讀方式。
隨著期刊數(shù)據(jù)庫的風(fēng)行,期刊紙本的發(fā)行量直線下降,且無可挽回。
與數(shù)字化傳播相對應(yīng),數(shù)字化的期刊體系應(yīng)該具備下列特征:
1)更為開放的公共學(xué)術(shù)平臺。
2)大量學(xué)術(shù)信息的聚合。
3)學(xué)科或問題邊界清晰、更加靈活組合的個性化多樣性形式。
1.圖像掃描:
按照客戶要對期刊進(jìn)行掃描。采用高速掃描儀或零邊距平板掃描儀進(jìn)行掃描,生成TIFF、JPG、PDF等圖像文件。
2.圖像處理:
對掃描后的圖像進(jìn)行處理,包括去黑邊、糾偏、去污漬、版心居中、二值化等,有利于提高文字的識別率。
3.文字識別:
豆海采用國際領(lǐng)先的OCR識別技術(shù),既可以識別常見的簡體漢字、繁體漢字、英文,也可以識別日文、韓文、俄文、德文、法文等190多種文字,準(zhǔn)確率99.5%以上。
4.格式轉(zhuǎn)換:
格式轉(zhuǎn)換是將其他格式的文件轉(zhuǎn)換為雙層PDF。文件格式可以是電子文檔,如DOC、S2、S72、PS、WPS等多種文件格式;也可以是經(jīng)過整理順序模塊整理成冊的紙張掃描文件。
5.資源加工:
對文檔的元數(shù)據(jù)進(jìn)行標(biāo)引;制作文檔目錄;在PDF中制作文檔內(nèi)鏈接;對元數(shù)據(jù)標(biāo)引、分類、目錄制作等。
6.數(shù)據(jù)提交:
將制作好的數(shù)據(jù)安全提交給客戶,可刻錄光盤,掛接網(wǎng)絡(luò)等。