薛美貴 陳紅倩 李 慧 魏 華 李 偉
(1.東莞職業(yè)技術(shù)學(xué)院媒體傳播系,廣東東莞,523808;2.北京工商大學(xué)計算機與信息工程學(xué)院,北京,100048;3.北京工商大學(xué)計算機與信息工程學(xué)院,食品安全大數(shù)據(jù)技術(shù)
北京市重點實驗室,北京,100048;4.北京聯(lián)合大學(xué)管理學(xué)院,北京,100101)
紙張的孔隙率是指紙張中未被填充的空間體積與紙張總體積的比值??紫堵适怯绊懠垙埼⒂^結(jié)構(gòu)的一個重要參數(shù),直接影響其力學(xué)性能與物理、化學(xué)性能,如結(jié)構(gòu)強度和對水、油墨、乳濁液、懸濁液等的吸收和過濾性能等,進而影響其在印刷、包裝等相關(guān)領(lǐng)域的使用[1-2]。
目前常用的獲知材料孔隙率的方法分為傳統(tǒng)物理測量法與計算機圖像處理法。傳統(tǒng)物理測量法有壓汞法、金相法、飽和介質(zhì)法等,但這些測量方法存在實驗時間長、實驗條件苛刻、成本高等問題,且存在測量操作誤差;計算機圖像處理法一般是通過對材料使用掃描電子顯微鏡(SEM)或CT 掃描儀拍攝SEM 圖像或CT 圖像,運用圖像處理技術(shù)將圖像中的實體部分與孔隙部分識別出來并用于計算孔隙率。相比傳統(tǒng)物理測量法,計算機圖像處理法分析材料的孔隙率,可以減少大量的物理實驗操作,能有效提高孔隙率檢測的工作效率,降低實驗造成的操作誤差,并減輕實驗造成的環(huán)境污染。
目前已有人將計算機圖像處理法應(yīng)用于多種X射線斷層成像圖像分割[3]、土石混合體材料[4]、網(wǎng)格圈織物[5]、土體結(jié)構(gòu)的顆粒分布[6]、反應(yīng)性粉末混凝土[7]、納米材料孔徑分布[8]、探井的地震阻抗體積[9]、儲層巖石孔隙率等[10]的計算與分析,計算效果良好。
對于紙張SEM 圖像的孔隙率計算目前主要有二維和三維[11]2 種方法。其中,二維方法中一個重要的步驟是二值化,即將紙張表面的SEM 灰度圖像轉(zhuǎn)換為黑白二值化圖像,從而分析計算得到紙張表面的孔隙孔徑分布、個數(shù)頻率以及孔隙率。而二值化過程中,閾值的選取需要使用者具有一定的圖像軟件處理知識,每張圖片孔隙與纖維分割閾值(即像素或是圖片顏色亮度等)的設(shè)定受主觀因素影響較大,具有不確定性,計算結(jié)果波動也較大[12]。另一方面,由于紙張纖維材料的類型多樣,不同類型纖維的表面處理工藝差異大,造成該方法在應(yīng)用過程中出現(xiàn)計算結(jié)果誤差較大的現(xiàn)象。所以,在二值化過程中選擇合適的閾值是非常關(guān)鍵的,閾值的不同會導(dǎo)致二值化后識別的孔隙數(shù)目與大小不同,從而影響結(jié)果的可靠性[13]。
針對上述問題,本研究提出了一種基于閾值回歸的紙張纖維材料SEM 圖像孔隙率分析方法,整個分析方法分為兩個過程:回歸模型建立過程和回歸模型應(yīng)用過程。在回歸模型建立過程中,將小部分樣品同時進行物理實驗和計算機圖像處理,然后將物理實驗結(jié)果和計算機圖像處理結(jié)果組成聯(lián)合數(shù)據(jù)集,依托聯(lián)合數(shù)據(jù)集建立閾值回歸模型。在回歸模型應(yīng)用過程中,使用建立的模型確定圖像的最佳分割閾值,并用于計算機圖像處理過程,從而降低孔隙率的計算誤差。實驗結(jié)果表明,本研究提出的方法能夠有效降低計算機圖像處理法的結(jié)果誤差,并提高了計算機圖像處理法在多種類型材料上的適應(yīng)能力。
在閾值回歸模型建立過程中,選取少量紙張樣品,通過同時進行計算機圖像處理和物理實驗,獲取信息建立模型,閾值回歸模型建立過程如圖1所示。
圖2為一幅典型的非涂布紙SEM 圖,其為高分辨率的類灰度圖片,圖像格式為.tif。圖2 中顯示了紙張的內(nèi)部纖維結(jié)構(gòu),易于研究者們進行觀察、分辨纖維和孔隙結(jié)構(gòu)。以圖2為例,模型建立過程具體描述如下。
針對SEM圖像的初步處理過程,包括以下幾步。
(1)對紙張SEM 圖像進行濾波平滑處理,以降低拍攝過程中產(chǎn)生的噪聲。在本研究實驗中發(fā)現(xiàn),通過“中值濾波法”能夠有效去除圖像中的高斯噪聲和椒鹽噪聲等,平滑效果較好。
(2)對平滑后的圖像進行灰度化處理,即將像素的顏色值轉(zhuǎn)換為灰度值,灰度化處理后的圖像如圖3所示。
紙張SEM 圖像轉(zhuǎn)換為灰度圖像后,將獲取圖像的以下3方面灰度信息。
(1)圖像的全局灰度信息,以此確定圖像拍攝時亮度、對比度的影響,為便于描述,命名第i 幅圖像的全局灰度值為Ai。
圖2 非涂布紙SEM圖(×200)
圖3 紙張SEM圖像平滑和灰度化處理后的結(jié)果圖(×200)
(2)通過點選圖像的多處纖維位置,確定圖像中纖維處的平均灰度值,所點選的纖維位置個數(shù)可以根據(jù)需要自行設(shè)定,本研究實驗表明一般設(shè)定為5個較為穩(wěn)定,為便于描述,命名第i 幅圖像的纖維平均灰度值為Bi。
(3)通過點選圖像的多處孔隙位置,確定圖像中孔隙處的平均灰度值,所點選的孔隙位置個數(shù)可以根據(jù)需要自行設(shè)定,本研究實驗表明一般設(shè)定為5個較為穩(wěn)定,為便于描述,命名第i 幅圖像的孔隙平均灰度值為Ci。
對紙張樣品進行物理實驗,獲取紙張的物理實驗孔隙率,物理實驗獲取的孔隙率結(jié)果一般來說準確度高,且實驗誤差小,可以認為是紙張的真實孔隙率,為便于描述,命名第i 幅圖像對應(yīng)的物理實驗孔隙率值為Pi。針對圖像平滑和灰度化處理后的圖像,根據(jù)圖像對應(yīng)材料的真實孔隙率,獲取其最佳分割閾值。
在圖像分割處理中低于分割閾值的像素點劃分為孔隙,高于分割閾值的像素點劃分為纖維,統(tǒng)計孔隙像素在整個圖像中的占比即為孔隙率。最佳分割閾值是指當分割閾值為Di時,通過對灰度圖像進行處理計算出的孔隙率值最接近于物理實驗孔隙率值Pi。
通過圖像處理過程,可獲得全局灰度值、纖維平均灰度值和孔隙平均灰度值,將每個紙張樣品SEM圖像的這3個變量作為模型的自變量,將每個圖像對應(yīng)的物理實驗孔隙率對應(yīng)的最佳分割閾值作為模型的因變量,建立起自變量與因變量之間的關(guān)系模型,該模型的目的是預(yù)測樣品圖像中能夠分割孔隙和纖維的最佳分割閾值。本研究選取的是多元線性回歸模型,該模型能夠很好地擬合孔隙、纖維處以及全體圖像的平均像素與最佳分割閾值之間的關(guān)系,通過前3個變量實現(xiàn)對最佳分割閾值的預(yù)測。該模型如式(1)所示。該模型中的參數(shù)可以通過Python、R 語言等的算法進行求解。
式中,Di為第i 張圖像的最佳分割閾值;Ai、Bi、Ci分別為圖像全局灰度值、圖像纖維處以及孔隙處平均灰度值。
將數(shù)據(jù)分割為訓(xùn)練集和測試集,通過訓(xùn)練集獲取回歸模型參數(shù)。需要注意的是,回歸模型參數(shù)的計算,需要多組數(shù)據(jù)才能進行計算,數(shù)據(jù)量越大一般來說所獲取的模型越準確。模型訓(xùn)練完后,通過測試集獲取回歸模型誤差,假如誤差范圍符合要求,則模型建立完成。
在閾值回歸模型應(yīng)用過程中,將需要確定孔隙率的樣品,拍攝SEM 圖像后進行平滑處理和灰度化處理;然后依次獲取其全局灰度值、纖維平均灰度值、孔隙平均灰度值;然后將這3個值作為自變量分別代入式(1),即可計算出最佳分割閾值,并統(tǒng)計孔隙像素占比,從而獲得紙張孔隙率。
實驗結(jié)果表明,本研究方法建立的閾值回歸模型,在獲取最佳分割閾值時具備較好的分割性能,且對孔隙率的計算誤差也較小。圖4是通過本研究模型獲取的最佳分割閾值獲得的1 個圖像分割結(jié)果實例(二值化圖像已反轉(zhuǎn))。
本研究已經(jīng)實現(xiàn)了閾值回歸模型的建立和應(yīng)用系統(tǒng),系統(tǒng)能對紙張樣品圖像進行處理,獲得圖像的全局灰度值、纖維平均灰度值、孔隙平均灰度值,在模型建立階段,通過輸入圖像對應(yīng)的物理實驗孔隙率,即可進行模型訓(xùn)練。圖5是本研究應(yīng)用系統(tǒng)建立模型的具體流程。
圖4 閾值回歸模型的圖像分割結(jié)果(反轉(zhuǎn))(×200)
圖5 應(yīng)用系統(tǒng)建立模型的流程圖
模型建立完畢后,使用過程中可根據(jù)單個紙張樣品的圖像計算其孔隙率,使用方法為:輸入紙張樣品圖像,點選若干纖維位置及孔隙位置,即可計算獲得其孔隙率。具體應(yīng)用過程與結(jié)果展示如圖6所示。
本研究針對一組紙張樣品進行基于閾值回歸模型的孔隙率模型建立和應(yīng)用過程,其中紙張樣品的灰度圖像處理結(jié)果如表1所示。
對紙張樣品進行物理實驗,獲得其物理實驗孔隙率值,通過對紙張樣品的灰度圖像調(diào)整分割閾值,獲得最接近于物理實驗孔隙率值的最佳分割閾值及分割閾值為Di時與物理實驗結(jié)果的誤差,結(jié)果見表2。
表1 紙張樣品灰度圖像處理結(jié)果(部分)
圖6 應(yīng)用模型計算的過程與最終結(jié)果展示
表2 樣品的物理實驗孔隙率、物理實驗結(jié)果對應(yīng)的最佳分割閾值及校驗誤差(部分)
通過R語言的運行環(huán)境獲得各自變量的系數(shù)如表3所示。
根據(jù)表3中系數(shù)建立的回歸方程如式(2)所示。
式中,Di為第i 張圖像的最佳分割閾值;Ai、Bi、Ci分別為圖像全局灰度值、圖像纖維處以及孔隙處平均灰度值。
表3 閾值回歸模型的各變量系數(shù)
表4 和表5 分別為本研究模型中所給出的紙張樣品的圖像處理結(jié)果和孔隙率計算結(jié)果,從表中可以看出,本研究提出的模型應(yīng)用于樣品的孔隙率計算誤差率較小。
表4 模型應(yīng)用的紙張樣品圖像處理結(jié)果(部分)
表5 模型應(yīng)用的紙張樣品孔隙率計算結(jié)果 %
針對非涂布紙張孔隙率的計算機圖像處理法中,分割閾值確定受主觀因素影響大的問題,本研究提出了一種使用閾值回歸模型降低處理誤差的方法。本方法通過針對小部分紙張樣品,同步進行物理實驗和圖像處理,使用兩部分實驗數(shù)據(jù)對閾值模型進行訓(xùn)練,從而獲取最佳分割閾值。實驗結(jié)果表明,本研究提出的方法,應(yīng)用于紙張孔隙率計算時,能夠?qū)D像處理過程的最佳分割閾值選取過程客觀化,從而有效降低圖像處理過程的結(jié)果誤差,并使其在多種類型紙張上均具備較高的適應(yīng)能力。