文/李望發(fā)
煤礦井下的人員安全問(wèn)題一直是煤炭科學(xué)關(guān)注的焦點(diǎn),隨著科技的發(fā)展,采掘自動(dòng)化和無(wú)人化是煤炭開(kāi)采技術(shù)的方向。目前有基于物理的雷達(dá)、射線和紅外探測(cè)等方法,但是這類方法識(shí)別不穩(wěn)定,識(shí)別率低?;谝曈X(jué)的煤巖識(shí)別技術(shù)具有實(shí)時(shí)監(jiān)控、非接觸式、易于實(shí)施等優(yōu)點(diǎn),引起眾多學(xué)者關(guān)注。文獻(xiàn)[1]通過(guò)提取煤巖圖像的不同尺度下的小波系數(shù)的均值、方差和角二階矩等信息進(jìn)行級(jí)聯(lián),然后采用SVM分類器進(jìn)行分類,但是計(jì)算量大;文獻(xiàn)[2]提取煤巖圖像曲波變換的不同層的系數(shù)進(jìn)行級(jí)聯(lián),然后采用SVM分類器進(jìn)行識(shí)別,但是識(shí)別率不高;文獻(xiàn)[3]采用自學(xué)習(xí)字典結(jié)合局部約束線性編碼進(jìn)行特征提取,然后用SVM分類器進(jìn)行識(shí)別,提高了識(shí)別率,但是耗時(shí)較長(zhǎng)。SVM分類器是煤巖識(shí)別中常用的分類器,但是SVM分類器存在魯棒性差的問(wèn)題,特別是在多種特征融合的識(shí)別中如果只進(jìn)行特征的平行拼接,會(huì)造成煤巖特征表達(dá)不夠充分。
近年來(lái),多核學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域研究的熱點(diǎn)問(wèn)題之一,在模式識(shí)別、目標(biāo)檢測(cè)等有著廣泛的應(yīng)用。特別是當(dāng)訓(xùn)練樣本數(shù)據(jù)異構(gòu)、樣本分布不均時(shí),用單個(gè)核函數(shù)構(gòu)建的支持向量機(jī)不能有效地解決分類問(wèn)題,而多核學(xué)習(xí)能有效結(jié)合多種核函數(shù)種類和參數(shù)的優(yōu)點(diǎn),提高泛化分類能力。
筆者提出基于多核學(xué)習(xí)的煤巖圖像特征融合與識(shí)別方法,采用不同的核組合對(duì)不同的特征進(jìn)行多核學(xué)習(xí),從而進(jìn)行特征融合,而不是原來(lái)的特征直接級(jí)聯(lián),對(duì)于每個(gè)特征,訓(xùn)練出最佳的SVM核組合以及各自的核權(quán)重,構(gòu)成每個(gè)特征的核矩陣,最后將每個(gè)核矩陣組合起來(lái)再進(jìn)行多核權(quán)重學(xué)習(xí),得到二級(jí)權(quán)重,最后將學(xué)習(xí)得到的權(quán)重與對(duì)應(yīng)的核矩陣相乘再求和,構(gòu)成最終的核矩陣,對(duì)測(cè)試樣本的特征進(jìn)行多核SVM分類。如圖1所示。
圖1:所提出方法的總體框架
多核學(xué)習(xí)(multiple kernel learning)是支持向量機(jī)的的擴(kuò)展,是魯棒性和靈活性更強(qiáng)的基于核的學(xué)習(xí)模型,將數(shù)據(jù)投影到不同的核空間進(jìn)行映射,能使數(shù)據(jù)在新的合成的空間進(jìn)行更好的表達(dá),從而提高分類精度。多核學(xué)習(xí)的重點(diǎn)是如何學(xué)習(xí)到各個(gè)核的權(quán)重系數(shù),一般模型為優(yōu)化分類器中核的線性組合:
其中主要算法有:基于半定規(guī)劃(SPD)的多核學(xué)習(xí)算法、基于二次約束型二次規(guī)劃(QCQP)的多核學(xué)習(xí)算法、基于半無(wú)限線性規(guī)劃(SILP)的多核學(xué)習(xí)算法、基于超核(Hyperkernels)的多核學(xué)習(xí)算法、簡(jiǎn)單的多核學(xué)習(xí)算法(Simple MKL)、基于分組Lasso多核學(xué)習(xí)算法。本文采用簡(jiǎn)單的多核學(xué)習(xí)算法(Simple MKL),因?yàn)槠涫諗靠?,?jì)算復(fù)雜度低和相對(duì)成熟。簡(jiǎn)單的多核學(xué)習(xí)(Simple MKL)將多核學(xué)習(xí)問(wèn)題轉(zhuǎn)化為光滑且凸的優(yōu)化問(wèn)題,然后采用迭代的方法先固定dm然后結(jié)合支持向量機(jī)訓(xùn)練算法構(gòu)建分類超平面,根據(jù)梯度下降方向更新dm。Simple MKL將多核學(xué)習(xí)問(wèn)題轉(zhuǎn)化為如下優(yōu)化問(wèn)題:
圖2:煤巖樣本圖像
式(4)的拉格朗日函數(shù)為:
表1:不同的特征融合方法的正確識(shí)別率
表2:不同煤巖識(shí)別方法的正確識(shí)別率
圖3:傳統(tǒng)MKL方法與傳統(tǒng)SVM方法比較
將(6)代入(5),則對(duì)偶問(wèn)題為:
將(7)代入(2),最終得到的優(yōu)化公式如下:
上面的優(yōu)化問(wèn)題只是針對(duì)單組數(shù)據(jù)進(jìn)行的多核學(xué)習(xí),在多種特征的圖像中,通過(guò)簡(jiǎn)單的級(jí)聯(lián)不能充分表達(dá)煤巖圖像特征,針對(duì)上述問(wèn)題,本文提出基于多核學(xué)習(xí)的煤巖圖像特征融合方法,在第一種特征中用一組核學(xué)習(xí),得到對(duì)應(yīng)的一組權(quán)重參數(shù),在第二種特征值用一組核學(xué)習(xí),得到另一組權(quán)重參數(shù),然后將兩種參數(shù)分別代入到對(duì)應(yīng)的核矩陣組成新的矩陣,再進(jìn)行多核學(xué)習(xí),從而得到第三組權(quán)重,在測(cè)試階段,三組權(quán)重組合成新的多核SVM分類器,進(jìn)行識(shí)別。
其中T為特征種類數(shù),λt為對(duì)應(yīng)特征的核矩陣的權(quán)重,kt為特征t的核矩陣,K*為總的多特征多核SVM的核矩陣。將(1)代入(9),得到:
在訓(xùn)練時(shí),先求出相應(yīng)的dm,使然后令訓(xùn)練出λt, 將dtm、λt代入(10),最后得到多特征融合的多核矩陣K。則由傳統(tǒng)的SVM得到的最后的判決函數(shù)如下:
一般的多核學(xué)習(xí)方法在初始化階段每個(gè)權(quán)重dm的值相等,為保證收斂速度,在開(kāi)始我們隨機(jī)產(chǎn)生和為1的權(quán)重dm,使收斂速度加快。
為驗(yàn)證所提出方法的有效性,以井下常見(jiàn)的煙煤、無(wú)煙煤和頁(yè)巖、砂巖為研究對(duì)象進(jìn)行仿真實(shí)驗(yàn)。本文涉及的方法均在MATLAB R2014a平臺(tái)上進(jìn)行實(shí)驗(yàn)驗(yàn)證,并在配置為Intel Core i5-3210M 、2.50 GHz CPU,4 GB RAM的PC機(jī)下運(yùn)行。
實(shí)驗(yàn)樣本選取不同光照、不同角度的煙煤、無(wú)煙煤、頁(yè)巖和砂巖灰度圖像各60幅,共240幅,分為煤(煙煤、無(wú)煙煤)和巖(頁(yè)巖、砂巖)兩類,圖像大小為180×200,灰度級(jí)為256,圖像格式為jpg格式。部分煤巖樣本圖像如圖2所示。
為了驗(yàn)證本文提出的多核學(xué)習(xí)算法的泛化能力,實(shí)驗(yàn)中采用以下3種底層紋理特征描述子對(duì)煤巖圖像進(jìn)行特征表示:
2.2.1 LBP特征
基本LBP算子特征提取。在3×3窗口內(nèi),以窗口中心像素灰度值為閾值,將相鄰八個(gè)像素的灰度值與其進(jìn)行比較,若某像素的灰度值大于閾值,則將該像素的位置標(biāo)記為1,否則為0。這樣3×3鄰域內(nèi)的8個(gè)像素經(jīng)比較可產(chǎn)生8位二進(jìn)制數(shù),可提取到256維的LBP特征向量。
2.2.2 Gabor特征
Gabor特征是一種可以描述圖像紋理信息的一種圖像特征,選取5個(gè)尺度,6個(gè)方向進(jìn)行特征計(jì)算,得到30維特征向量。
2.2.3 灰度共生矩陣(GLCM)特征原始圖像灰度級(jí)數(shù)256級(jí),為了減少計(jì)算量,壓縮圖像灰度級(jí)到16。步距d=1,分別計(jì)算0°、45°、90°、135°四個(gè)方向上的灰度共生矩陣,求每個(gè)方向灰度共生矩陣的能量、熵、慣性矩和相關(guān),得到最終16維紋理特征。
對(duì)于rbf核與poly核,找到最佳的參數(shù)為σ=0.75和d=2,本次實(shí)驗(yàn)取該兩種核函數(shù)進(jìn)行實(shí)驗(yàn)。
取煤巖樣本的GLCM特征和LBP特征,取一半樣本做訓(xùn)練集,剩下的做測(cè)試集,重復(fù)十次,取結(jié)果的平均值,得到結(jié)果如下:
由圖3可看出,傳統(tǒng)MKL的識(shí)別率優(yōu)于傳統(tǒng)的SVM方法。
傳統(tǒng)的MKL只是SVM的多核擴(kuò)展,本文提出的多特征多核支持向量機(jī)(feature fusion multiple kernel support vector machine)能對(duì)不同特征進(jìn)行加權(quán)融合。然后我們對(duì)GLCM特征+SVM、LBP特征+SVM、本文提出的多特征融合多核SVM進(jìn)行實(shí)驗(yàn),并且兩種特征都用最佳參數(shù)的核系數(shù)(GLCM特征的高斯核系數(shù)σ=[0.75,2],多項(xiàng)式核系數(shù)d=2,LBP特征的高斯核σ=[0.5,2],多項(xiàng)式核d=2),取煤和巖樣本各120張,每次實(shí)驗(yàn)中每種樣本的數(shù)目依次為50、60、70、80、90,并從兩種樣本中取剩下圖片中的30張作為測(cè)試樣本。
從圖4可以看出,在測(cè)試樣本在70之前,多核多特征融合的學(xué)習(xí)方法明顯優(yōu)于單核的SVM方法,在測(cè)試樣本為60個(gè),也就是50%的樣本數(shù)時(shí)識(shí)別率最高,達(dá)到98.33%。隨著測(cè)試樣本的增多,后期可能存在過(guò)擬合的風(fēng)險(xiǎn),因此要控制測(cè)試樣本的比例。
通過(guò)2.1的方式構(gòu)建訓(xùn)練集和測(cè)試集,做了10組實(shí)驗(yàn),對(duì)實(shí)驗(yàn)結(jié)果取平均值。參與比較的是通過(guò)級(jí)聯(lián)的特征融合與分類器融合,圖像特征選擇GLCM、Gabor、LBP。如表1所示。
通過(guò)與簡(jiǎn)單的空間級(jí)聯(lián)方法的比較發(fā)現(xiàn),多特征融合的多核學(xué)習(xí)方法的煤巖識(shí)別率高于通過(guò)級(jí)聯(lián)的方法,表明從煤巖圖像中提取來(lái)的不同特征,經(jīng)過(guò)多核方法的融合,更能從圖像中提取各種異構(gòu)的特征,多核融合發(fā)掘圖像的特征表達(dá)能力更強(qiáng),從而提高識(shí)別率?;诓煌卣鹘M合的識(shí)別率分別提高了11.66%、7.50%、4.17%,說(shuō)明簡(jiǎn)單的級(jí)聯(lián)還不夠充分挖掘煤巖的特征信息,若利用樣本的類別的異構(gòu)信息,則能更好地挖掘特征。
參與比較的其他方法有小波變換各層特征系數(shù)級(jí)聯(lián)SVM識(shí)別方法和基于曲波變換各層特征系數(shù)級(jí)聯(lián)SVM識(shí)別方法。綜合考慮煤巖正確識(shí)別率和時(shí)間復(fù)雜度,LBP+GLCM組合特征的表現(xiàn)最好,在比較時(shí)采用的是基于LBP+GLCM的特征融合的識(shí)別方法。不同煤巖識(shí)別方法的正確識(shí)別率如表2所示。
從表2中數(shù)據(jù)得出,本文提出的多特征融合多核學(xué)習(xí)方法的煤巖識(shí)別率高于其他兩種方法,說(shuō)明了從特征加權(quán)與多核學(xué)習(xí)角度來(lái)改善煤巖圖像的識(shí)別性能是今后提高煤巖正確識(shí)別率的又一條重要的途徑。
圖4:本文提出的多核學(xué)習(xí)方法和傳統(tǒng)的SVM方法比較
(1)本文提出的多特征多核學(xué)習(xí)方法,充分利用單特征的異構(gòu)信息和多類別特征信息進(jìn)行融合,提高了區(qū)分煤巖圖像的能力,使得不同類別的特征能用不同的核表示,提高泛化能力,優(yōu)于傳統(tǒng)的SVM分類,從而達(dá)到更好的分類識(shí)別效果。
(2)與其它特征融合方法相比較,提出的多核學(xué)習(xí)方法具有更高的煤巖正確識(shí)別率,驗(yàn)證了所提出方法的有效性。
(3)另外從多核學(xué)習(xí)和多特征融合角度提高煤巖圖像識(shí)別正確率,為進(jìn)一步研究煤巖界面的自動(dòng)檢測(cè)提供了一種新的思路。