隨著計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)在圖書館領(lǐng)域的深入應(yīng)用,數(shù)字圖書館得到了迅速的發(fā)展。圖書館大量館藏文獻(xiàn)的數(shù)字化工作成為目前亟待解決的問題,采用數(shù)字圖像的方式加工保存圖書文獻(xiàn)資料是館藏文獻(xiàn)數(shù)字化工作的有效途徑,其主要優(yōu)點(diǎn)是加工速度快、適合大批量、規(guī)模化加工,并能全面保留紙質(zhì)文獻(xiàn)的原始信息。數(shù)字圖像二值化是處理文獻(xiàn)資料圖像的關(guān)鍵技術(shù),合適的二值化算法不但可以提高數(shù)字館藏的處理效率,而且對于改善數(shù)字文獻(xiàn)的閱讀質(zhì)量,提高OCR系統(tǒng)的識別率都具有重要意義。
數(shù)字圖像二值化又稱為數(shù)字圖像的閾值變換,其核心問題是二值化閾值的選取算法。Ridler和Calvand提出了一種閾值選取的迭代法,但是計(jì)算比較耗時(shí);Trussel對迭代法進(jìn)行了改進(jìn),將任意直方圖劃分為兩部分,并計(jì)算每一部分的平均灰度,然后用兩個(gè)平均灰度級的平均值作為新的分割閾值。日本大津展之提出了最大類間方差法,該算法是根據(jù)最小二乘法將直方圖在某一閾值處分割成兩部分,當(dāng)被分成的兩部分的方差為最大時(shí)即取得最佳分割閾值。文獻(xiàn)[1]提出了一種基于高低通濾波特征的文本圖像快速二值化方法,該方法以圖像灰度統(tǒng)計(jì)特征值為閾值,利用高低通濾波的特征對圖像進(jìn)行閾值分割。文獻(xiàn)[2]提出了一種帶灰度保留的文本圖像二值化方法,解決了當(dāng)文本圖像中包含圖片信息,在二值化處理中圖片信息容易被破壞的問題。圖像二值化方法還包括微分直方圖法、中值濾波法和最大直方圖熵閾值分割法等。
數(shù)字化館藏文獻(xiàn)圖像的數(shù)據(jù)量巨大,圖像之間的灰度直方圖差別較大,這就要求圖像二值化處理速度要快,質(zhì)量要高,即每一圖像的閾值選取計(jì)算速度要快,閾值準(zhǔn)確度要高。以往的閾值選取算法有些計(jì)算速度快,但精度低,圖像質(zhì)量無法保證,有些算法閾值選取精度較高但是計(jì)算速度較慢,圖像處理效率較低。該文基于對文獻(xiàn)圖像直方圖統(tǒng)計(jì)特征的分析,綜合了高低通濾波法處理速度快和最大類間方差法閾值計(jì)算精度高的優(yōu)點(diǎn),研究文獻(xiàn)圖像二值化處理技術(shù),通過實(shí)驗(yàn)分析比較,取得了較好的圖像處理效果。
本文所提出的數(shù)字圖像二值化方法綜合了高低通濾波法處理速度快和最大類間方差法閾值計(jì)算精度高的優(yōu)點(diǎn),對于解決文本圖像的二值化問題有較大的幫助。該算法的優(yōu)點(diǎn)在于:算法簡單、時(shí)間復(fù)雜度較低,比較適合圖像的數(shù)據(jù)量巨大,圖像之間的灰度直方圖差別較大的文獻(xiàn)的數(shù)字化加工處理。
通過多次對比實(shí)驗(yàn)發(fā)現(xiàn),該文所提出的算法效果較好,圖像處理的精度較高,圖像質(zhì)量有保證,取得了較好的圖像處理效果。