楊恩,王世博,王賽亞,周悅
(中國礦業(yè)大學(xué) 機(jī)電工程學(xué)院, 江蘇 徐州 221116)
受反射光譜技術(shù)在巖礦和煤礦遙感探測識別領(lǐng)域應(yīng)用的啟發(fā),文獻(xiàn)[15-16]分析了各類典型煤巖的近紅外波段反射光譜特征及煤巖反射光譜曲線差異性,并給出了基于反射光譜的煤巖識別計算方法,主要以大量已知類別和成分煤巖樣本某一固定反射方向的反射光譜為訓(xùn)練集,通過有監(jiān)督的機(jī)器學(xué)習(xí)方法建立預(yù)測模型,對未知煤巖樣本同一反射方向的反射光譜進(jìn)行預(yù)測識別[16-17],驗證了反射光譜技術(shù)用于煤巖識別的可行性。在井下綜采工作面煤巖界面處,煤巖反射光譜探測位置的改變將會引起采集光譜反射方向的變化,由于物質(zhì)雙向反射特性的影響[2,18-20],當(dāng)煤巖光譜的反射方向發(fā)生改變時,反射光譜曲線將發(fā)生改變。以某一固定反射方向的煤巖光譜訓(xùn)練集進(jìn)行有監(jiān)督建模來預(yù)測不同反射方向煤巖光譜時,預(yù)測準(zhǔn)確率將會降低。因此,需找到一種不依賴于已知反射光譜數(shù)據(jù)訓(xùn)練集或現(xiàn)有反射光譜數(shù)據(jù)庫訓(xùn)練集的煤巖反射光譜無監(jiān)督自主適應(yīng)性識別方法。
以聚類算法為代表的無監(jiān)督自主分類識別方法已在高光譜遙感領(lǐng)域得到了較多應(yīng)用[21],采用無監(jiān)督分類方法可避免不同條件下獲得的訓(xùn)練集數(shù)據(jù)的影響,具有更好的適應(yīng)性。模糊C均值聚類(Fuzzy C-means Clustering,F(xiàn)CM)為一種典型的無監(jiān)督分類方法[22],其聚類距離常采用歐氏距離,然而在一些應(yīng)用領(lǐng)域,歐氏距離效果較差。Wu Fang等[23]采用相關(guān)性距離代替歐氏距離,采用改進(jìn)的FCM方法對USGS(United States Geological Survey)光譜庫中標(biāo)準(zhǔn)礦物反射光譜和收集的巖石反射光譜進(jìn)行準(zhǔn)確分類。針對現(xiàn)有煤巖反射光譜有監(jiān)督識別方法存在煤巖位置變化時識別效果差的問題,為了基于反射光譜實現(xiàn)不同位置煤巖的自適應(yīng)、精確、快速識別,本文提出了一種典型煤巖反射光譜無監(jiān)督感知方法,基于不同位置煤巖的反射光譜曲線間的相似性進(jìn)行煤巖聚類識別。針對短時間內(nèi)遙測采集的不同位置煤巖的反射光譜數(shù)據(jù),采用聚類距離改進(jìn)型FCM方法將光譜數(shù)據(jù)快速聚類,由最終聚類隸屬度概率矩陣判定光譜數(shù)據(jù)類別,進(jìn)而判定不同位置煤巖類別。
本文對來自山東興隆莊煤礦的氣煤、泥巖、粉砂巖、泥質(zhì)灰?guī)r4種典型煤巖樣品,測定了每種試樣多個背向反射角下的近紅外波段(1 000~2 500 nm)反射光譜曲線,選取了最具差異性的光譜特征波段,獲取了不同聚類距離FCM方法下氣煤-泥巖、氣煤-粉砂巖、氣煤-泥質(zhì)灰?guī)r3種煤巖組合的識別結(jié)果。研究煤巖反射光譜的無監(jiān)督感知方法,將為研究反射光譜技術(shù)應(yīng)用于井下煤巖界面處不同位置煤巖的自主適應(yīng)性判定提供基礎(chǔ)和依據(jù)。
從山東興隆莊煤礦采集了氣煤、泥巖、粉砂巖、泥質(zhì)灰?guī)r4種典型煤巖類型塊狀樣品各1塊,見表1。其中巖來源于頂板煤巖界面處,涵蓋了煤層中常見的泥頁巖、砂巖、灰?guī)r三大沉積巖類型,因受沉積過程影響,含有一定的碳質(zhì)物質(zhì)成分,外觀為黑色或灰黑色,與煤較為接近。
表1 煤巖塊狀樣品
煤巖界面反射光譜探測如圖1所示,在井下綜采煤壁煤巖分界處、煤巖分界兩側(cè)不同位置煤巖采集光譜的反射方向不同,即同一光源照射條件下反射光譜探測傳感器采集不同位置煤巖所獲光譜反射角不同,且入射光線與采集的反射光線位于反射表面法線的同一側(cè),即為背向反射。為快速判定煤巖分界,需采集和識別煤巖分界兩側(cè)不同位置煤巖的反射光譜,即多個角度的背向反射光譜。為了研究不同背向反射角度下煤巖反射光譜的快速無監(jiān)督感知識別,在實驗室采集了以上4塊煤巖試樣表面0~-75°背向反射角范圍內(nèi)的反射光譜,如圖2所示。
每塊試樣平放于黑色背景桌面上,保持上表面平整,采用100 W鹵鎢光源照射試樣上表面,入射角固定為45°,光纖準(zhǔn)直探頭對準(zhǔn)試樣照射區(qū)域中心收集反射光線,光纖準(zhǔn)直探頭通過石英光纖連接Avantes AvaSpec光譜儀,其波段為1 000~2 500 nm,單條光譜曲線采集耗時1 ms。以試樣照射區(qū)域中心為旋轉(zhuǎn)中心,光纖準(zhǔn)直探頭與照射區(qū)域中心保持0.5 m的直線距離,在入射光線所在豎直平面內(nèi),光纖準(zhǔn)直探頭繞照射區(qū)域中心從0轉(zhuǎn)動至-75°,每隔2.5°采集一次反射光譜。從0反射角開始采集,-45°反射角除外,因為此時光纖準(zhǔn)直探頭與中心入射光線在同一直線,探頭遮擋中心入射光線,無法有效采集反射光譜,故每塊試樣在0~-75°背向反射角范圍內(nèi)共采集30條反射光譜曲線。本實驗采用PTFE材料參照白板,以探測距離0.5 m、0反射角為標(biāo)準(zhǔn)。
圖1 煤巖界面反射光譜探測
圖2 煤巖背向反射光譜采集
此外,在同一煤礦收集了以上各樣品相鄰地質(zhì)層位的同類鉆孔巖心試樣,包括煤層中心氣煤和碳質(zhì)物質(zhì)含量較低、色澤為灰色的泥巖、粉砂巖、泥質(zhì)灰?guī)r。將4種鉆孔巖心試樣粉碎至0.5 mm粒度粉末[15],放置在培養(yǎng)皿中,抹平表面,按圖2中0反射角采集抹平表面的反射光譜,作為標(biāo)準(zhǔn)參照光譜。
采用13點Savitzky-Golay(SG)卷積平滑算法對采集到的煤巖反射光譜曲線進(jìn)行濾波去噪處理[17],圖3為表1中氣煤、泥巖、粉砂巖、泥質(zhì)灰?guī)r4種塊狀試樣在45°入射角、0~-75°背向反射角探測幾何情況下,經(jīng)去噪后的各自30條近紅外波段(1 000~2 500 nm)光譜反射率曲線。4種鉆孔巖心0.5 mm粒度粉末試樣的反射光譜曲線如圖4所示。
(a) 氣煤
(b) 泥巖
(c) 粉砂巖
(d) 泥質(zhì)灰?guī)r
由圖3可知,4種塊狀試樣吸收谷主要分布在1 400,1 900,2 150~2 400 nm波長附近,3種巖相對于氣煤均表現(xiàn)出了較為明顯的吸收谷特征,粉砂巖和泥質(zhì)灰?guī)r吸收谷最為明顯。1 400 nm和1 900 nm波長吸收谷受試樣中水分影響較大[15],不同種類試樣影響程度差別較大,粉砂巖在這兩處最為明顯,氣煤、泥巖、泥質(zhì)灰?guī)r在1 900 nm處較明顯,泥質(zhì)灰?guī)r在1 900 nm處的吸收谷還跟其中碳酸鹽礦物有關(guān)[15]。
圖4 煤巖鉆孔巖心試樣反射光譜
2 150~2 400 nm波長范圍內(nèi),4種試樣的吸收谷特征各不相同:氣煤為全波段整體緩慢吸收,與其中有機(jī)成分有關(guān)[5];泥巖集中在2 200 nm波長附近,取決于其中黏土礦物;受黏土礦物和碳酸鹽礦物影響,粉砂巖集中在2 200 nm和2 350 nm波長附近;泥質(zhì)灰?guī)r集中在2 350 nm波長附近,與其中碳酸鹽礦物有關(guān)[15]。
4種塊狀試樣表面的背向光譜反射率均呈現(xiàn)出隨背向反射角增大而先增大后減小的整體趨勢。背向反射角增大時,泥巖、粉砂巖和泥質(zhì)灰?guī)r的各吸收谷深度變化較小,只有微弱的減小,氣煤的各吸收谷深度減小相對明顯。
圖4中的煤巖鉆孔巖心試樣反射光譜與圖3中的煤巖反射光譜相比,碳質(zhì)物質(zhì)含量較低的3種巖塊整體反射率較大,在1 400,1 900,2 150~2 400 nm波長附近吸收谷增強(qiáng),煤層中部氣煤整體反射率較小,此3個波長范圍吸收谷變?nèi)酢?種鉆孔巖心試樣在2 150~2 400 nm波長附近吸收谷特征亦各不相同,差異性更為明顯。
根據(jù)以上分析,為降低光譜數(shù)據(jù)維數(shù),提高光譜識別算法的運行效率,本文選取2 150~2 400 nm波段作為煤巖反射光譜差異性特征波段,進(jìn)行煤巖反射光譜無監(jiān)督識別研究。同時,將4種塊狀試樣0~-75°背向反射角下的2 150~2 400 nm波段光譜反射率數(shù)據(jù)按氣煤-泥巖、氣煤-粉砂巖、氣煤-泥質(zhì)灰?guī)r3種煤巖組合進(jìn)行分組,分別進(jìn)行仿真實驗。每組數(shù)據(jù)含60個特征波段光譜樣本,前30個為氣煤,后30個為巖石。
設(shè)X=[x1,x2,…,x60]為氣煤-泥巖、氣煤-粉砂巖、氣煤-泥質(zhì)灰?guī)r3種組合中1個分組的煤巖特征光譜矩陣,則類別數(shù)為2,yj(j=1,2)為每次迭代開始時2個類別的聚類中心,uij(i=1,2,…,60)為每次迭代時第i個特征光譜樣本xi屬于第j類的所得隸屬度,聚類損失值為[22]
(1)
式中k為加權(quán)指數(shù)。
在每次迭代時,uij計算方法為
(2)
下一次迭代開始時的聚類中心yj為
(3)
以此重復(fù)迭代,按式(1)計算每次迭代的聚類損失值J,直至第n次迭代后的聚類損失值Jn與第n-1次迭代后的聚類損失值Jn-1滿足以下關(guān)系:
|Jn-Jn-1|≤ε
(4)
式中ε為給定任意小閾值,按第n次迭代所得2×60隸屬度矩陣U=[uij]T決定煤巖特征光譜所屬類別。
煤巖特征光譜向量xi與聚類中心向量yj的相關(guān)性距離RDij、余弦距離CDij分別定義為
(5)
(6)
式中r(xi,yj),cos(xi,yj)分別為煤巖特征光譜向量xi與聚類中心向量yj的相關(guān)系數(shù)、夾角余弦。
(7)
(8)
(9)
(10)
式中xit、yjt分別為2 150~2 400 nm波段251維煤巖特征光譜向量xi、聚類中心向量yj的第t(t=1,2,…,251)維元素。
(11)
(12)
(13)
(14)
至此,建立了RFCM、CFCM兩種改進(jìn)型FCM算法。
對氣煤-泥巖、氣煤-粉砂巖、氣煤-泥質(zhì)灰?guī)r3種煤巖光譜差異性特征波段反射率數(shù)據(jù)組合分別采用FCM,RFCM,CFCM進(jìn)行聚類識別。初始聚類中心取圖4中相對應(yīng)煤巖類型鉆孔巖心粉末試樣2 150~2 400 nm波段光譜數(shù)據(jù)組合,設(shè)定加權(quán)指數(shù)k=2,最大迭代次數(shù)為100,閾值ε=0.000 01[22]。3種煤巖組合數(shù)據(jù)最終迭代次數(shù)和聚類損失值迭代過程變化趨勢如圖5所示,3種煤巖組合數(shù)據(jù)聚類中心迭代過程變化趨勢如圖6—圖8所示。
由圖5可知,在同一組煤巖特征波段光譜反射率數(shù)據(jù)中,CFCM方法迭代次數(shù)最少,以上3種組合迭代次數(shù)分別為6,4,4;RFCM方法迭代次數(shù)次之,以上3種組合迭代次數(shù)分別為16,7,7;FCM方法迭代次數(shù)最多,以上3種組合迭代次數(shù)分別為26,11,25。由圖6—圖8可知,在每種組合中,氣煤采用3種聚類方法最終聚類中心波形與氣煤的初始聚類中心光譜波形基本一致。而3種巖石在各自組別采用FCM方法時,其最終聚類中心波形吸收谷特征不明顯,最終聚類中心波形類似于氣煤的最終聚類中心波形,采用RFCM和CFCM方法時,最終聚類中心波形吸收谷特征比較明顯,最終聚類中心波形與各自的初始聚類中心光譜波形一致。由此可推斷,RFCM和CFCM方法對巖特征光譜的聚類效果要優(yōu)于FCM方法。
(a) 氣煤-泥巖聚類損失值變化趨勢
(b) 氣煤-粉砂巖聚類損失值變化趨勢
(c) 氣煤-泥質(zhì)灰?guī)r聚類損失值變化趨勢
(a) 氣煤
(b) 泥巖
(a) 氣煤
(b) 粉砂巖
(a) 氣煤
(b) 泥質(zhì)灰?guī)r
3種煤巖組合光譜數(shù)據(jù)經(jīng)FCM,RFCM,CFCM算法迭代聚類后,每個分組中煤巖特征光譜樣本的最終隸屬度計算結(jié)果如圖9所示。
由圖9可知,RFCM和CFCM方法對每組試樣中的絕大多數(shù)或全部特征光譜樣本的聚類隸屬度大于0.5。而FCM方法對每組試樣中前30個氣煤特征光譜樣本的聚類隸屬度大部分大于0.5,但對后30個巖石特征光譜樣本的聚類隸屬度大部分小于0.5。由此可見,以上3個分組試樣的最終隸屬度結(jié)果與圖6—圖8中的最終聚類中心波形是一致的。從圖9中隸屬度所反映的識別率來看,基于相關(guān)性距離和余弦距離聚類的RFCM和CFCM方法均適用于基于反射光譜的煤巖無監(jiān)督分類。
(a) 氣煤-泥巖識別結(jié)果
(b) 氣煤-粉砂巖識別結(jié)果
(c) 氣煤-泥質(zhì)灰?guī)r識別結(jié)果
式(1)、式(3)、式(11)、式(13)表明,加權(quán)指數(shù)k控制著不同類隸屬度的分享程度[22],不同的加權(quán)指數(shù)會影響最終的迭代次數(shù)和隸屬度矩陣[23]。為選擇最優(yōu)的加權(quán)指數(shù),保持最大迭代次數(shù)100,閾值ε=0.000 01,加權(quán)指數(shù)k從1.1到10以0.1的步長增加,計算隨加權(quán)指數(shù)變化每個煤巖特征光譜分組在FCM、RFCM、CFCM 3種算法下的聚類識別率,結(jié)果如圖10所示。
由圖10可知,加權(quán)指數(shù)在1.1到10變化時,RFCM和CFCM方法在每個加權(quán)指數(shù)處的識別率值均大于90%,而FCM方法在每個加權(quán)指數(shù)處的識別率值均小于60%。在選取最優(yōu)加權(quán)指數(shù)時,以最大識別率為依據(jù),當(dāng)最大識別率的加權(quán)指數(shù)包括2.0時優(yōu)先選擇2.0,不包括2.0時優(yōu)先選擇最小加權(quán)指數(shù)。此外,還計算了最優(yōu)加權(quán)指數(shù)時每組所有光譜樣本用3種方法識別的總耗時。選用最優(yōu)加權(quán)指數(shù)時,每組煤巖聚類識別效果評估見表2。
(a) 氣煤-泥巖
(b) 氣煤-粉砂巖
(c) 氣煤-泥質(zhì)灰?guī)r
由表2可知,選用最優(yōu)加權(quán)指數(shù)時,F(xiàn)CM方法對每組煤巖特征光譜的整體識別率仍舊較低,即基于歐氏距離聚類的FCM方法不適用于基于反射光譜的煤巖無監(jiān)督分類。選用最優(yōu)加權(quán)指數(shù)時,RFCM和CFCM方法對每組煤巖特征光譜的整體識別率較高,均大于90%,2種方法對氣煤-泥巖組合整體識別率低于其他2個組合。在識別耗時方面,CFCM方法迭代次數(shù)最少,對每組60個特征光譜樣本識別總耗時均小于0.1 s,而RFCM方法迭代次數(shù)相對最多,對每組光譜樣本識別總耗時均大于0.1 s。根據(jù)以上分析,選擇煤巖2 150~2 400 nm波段不同背向反射角反射光譜進(jìn)行模糊C均值聚類識別煤巖時,優(yōu)先選擇CFCM方法,此時,識別氣煤-泥巖、氣煤-粉砂巖、氣煤-泥質(zhì)灰?guī)r3種煤巖特征光譜組合的加權(quán)指數(shù)分別優(yōu)先選擇2.0,2.0,1.1。
表2 最優(yōu)加權(quán)指數(shù)時煤巖聚類識別效果評估
(1) 興隆莊煤礦氣煤、泥巖、粉砂巖、泥質(zhì)灰?guī)r4種塊狀煤巖表面近紅外波段(1 000~2 500 nm) 0~-75°背向反射光譜反射率曲線最具差異性波段為2 150~2 400 nm。
(2) 對于興隆莊煤礦氣煤、泥巖、粉砂巖、泥質(zhì)灰?guī)r4種塊狀煤巖,選擇其2 150~2 400 nm波段不同背向反射角反射光譜進(jìn)行模糊C均值聚類識別煤巖時,F(xiàn)CM對氣煤-泥巖、氣煤-粉砂巖、氣煤-泥質(zhì)灰?guī)r3種煤巖光譜組合均不能有效識別,RFCM和CFCM對此3種煤巖光譜組合均能有效識別,且對每組整體識別率均大于90%,其中CFCM方法迭代次數(shù)最少,每組總耗時均小于0.1 s,為優(yōu)先選擇方法。
(3) 選取煤巖的最具差異性反射光譜特征波段并研究其無監(jiān)督識別方法,為反射光譜技術(shù)應(yīng)用于煤巖界面不同位置煤巖的高效適應(yīng)性判定提供了參考。