郭永存何 磊劉普壯王 希
(1.安徽理工大學(xué) 深部煤礦采動響應(yīng)與災(zāi)害防控國家重點(diǎn)實(shí)驗(yàn)室,安徽 淮南 232001; 2.安徽理工大學(xué) 礦山智能裝備與技術(shù)安徽省重點(diǎn)實(shí)驗(yàn)室,安徽 淮南 232001; 3.礦山智能技術(shù)與裝備省部共建協(xié)同創(chuàng)新中心,安徽 淮南 232001; 4.安徽理工大學(xué) 機(jī)械工程學(xué)院,安徽 淮南232001)
傳統(tǒng)的機(jī)械化選煤方式如跳汰法、浮選法和重介淺槽法等,均會造成不可逆轉(zhuǎn)的空氣污染、水質(zhì)污染和地質(zhì)污染?,F(xiàn)存的人工選矸方式,成本高,工人工作環(huán)境差,分揀效率低[1-2]。隨著計算機(jī)計算能力和高速電路的發(fā)展,基于傳感器的煤矸光電分選技術(shù)廣受關(guān)注。光電分選技術(shù)不僅不消耗水資源和化學(xué)試劑,而且能耗低、效益大,在工業(yè)生產(chǎn)中逐漸應(yīng)用[3-4]。目前,光電分選主要有2 種技術(shù)手段:①基于可見光成像的圖像識別技術(shù),即采用線陣相機(jī)對輸送帶上原煤流進(jìn)行成像;②基于透射成像的圖像識別技術(shù),即采用高能射線(如γ射線、X 射線)對輸送帶上原煤流進(jìn)行透射成像[5-6]。
基于可見光成像的圖像識別技術(shù),DOU Dongyang等通過建立Relief-SVM 分類器,分析了煤和矸石表面干、濕2 種情況的識別效果[7]。王家臣等討論了不同光照強(qiáng)度下煤和矸石的分類識別[8]。SUN Zhiyuan 等提出一種紋理融合超像素算法,以解決煤和矸石成像背景與前景難以分割問題[9]。LI Man 等以LS-SVM為分類器,發(fā)現(xiàn)聯(lián)合煤和矸石圖像偏斜度、對比度特征識別效果較好[10]。徐志強(qiáng)等通過對比多種深度卷積神經(jīng)網(wǎng)絡(luò)框架下模型對煤和矸石識別情況,發(fā)現(xiàn)SqueezeNet 網(wǎng)絡(luò)綜合能力最優(yōu)[11]。上述采用可見光成像的識別方法,易受光源、粉塵、成像背景和物料表面等不確定因素影響,在面向不同場景時,往往需要建立復(fù)雜的識別模型,導(dǎo)致決策能力受限。
最初采用的煤矸γ射線的透射識別技術(shù),因輻射難以控制問題,未被推廣使用。相較于γ射線,X 射線輻射可控性較高,且基于X 射線透射成像的圖像識別技術(shù)對環(huán)境敏感性較弱,目前被工業(yè)界普遍接受[12]。針對X 射線透射識別技術(shù),筆者通過建立NP-FSVM 分類器,融合單能X 射線圖像灰度、紋理特征對煤矸進(jìn)行識別,獲得較高識別率[13]。但采用單能X 射線,完全忽視了厚度效應(yīng)影響,易將較厚的煤識別為矸石、 較薄的矸石識別為煤。VON Ketelhodt L 等采用雙能X 射線獲取煤和矸石的等效原子序數(shù),依據(jù)等效原子序數(shù)差異來設(shè)定閾值分離煤和矸石[14]。KUERTEN Ariane Salvador 采用等效原子序數(shù)分割圖像,計算了煤和矸石圖像中矸石像素面積占比,以此對煤和矸石進(jìn)行分類[15]。由于射源放射的X 射線為連續(xù)能譜,而簡化計算中將連續(xù)能譜等效為單一能譜,所以余暉效應(yīng)、厚度效應(yīng)和射束硬化效應(yīng)仍然存在,導(dǎo)致煤和矸石的等效原子序數(shù)特征存在波動和交叉重疊。為了增強(qiáng)特征可分性,李振華等通過聯(lián)合礦石高能圖像灰度均值I,將礦石一維物質(zhì)屬性R值特征,擴(kuò)展至二維R-I平面對厚度進(jìn)行矯正[16]。徐明剛等提出采用二維隸屬度分割方法用于安檢系統(tǒng)物質(zhì)鑒別,矯正厚度影響,可基本區(qū)分開不同物質(zhì)R值重疊區(qū)域[17]。由此可見,對煤和矸石X射線圖像識別,消除厚度效應(yīng)的同時,還應(yīng)考慮融入高、低能圖像特征,并引入通過閾值分割后計算得到的矸石面積占比特征,進(jìn)行多維度分析。
筆者通過研究雙能X 射線圖像目標(biāo)區(qū)域R值均值與密度和灰分的關(guān)系,以此確定物質(zhì)屬性R值閾值。采用R值閾值和灰度均值對R值圖像和高、低能圖像進(jìn)行分割,進(jìn)而計算出不同物質(zhì)在單個目標(biāo)中的面積比例,即矸石含量特征。進(jìn)一步地,度量R值均值、矸石含量特征、高低能級圖像灰度特征、紋理特征的重要性,建立多維度分析識別模型,設(shè)計分類試驗(yàn),并通過試驗(yàn)驗(yàn)證不同煤種:肥煤、焦煤和氣煤分別混合矸石的識別情況。最終得到多維度特征中的最優(yōu)特征組合,同時實(shí)現(xiàn)一個模型識別多個環(huán)境場景下的差異煤質(zhì)。
本文研究所用的煤和矸石分別取自于臨渙選煤廠變質(zhì)程度較高的焦煤、許疃煤礦變質(zhì)程度中等的肥煤以及來自顧橋煤礦變質(zhì)程度較低、揮發(fā)程度較高的氣煤。所選用的煤和矸石粒徑分布在30~100 mm,厚度分布在5~45 mm,密度分布在1.3~(+)1.8 kg/L((+)表征密度大于1.8 kg/L)。依據(jù)煤炭與矸石分類標(biāo)準(zhǔn),將其中密度大于1.8 kg/L 的樣本歸為矸石[18-20]。
獲取煤和矸石X 射線透射圖像的試驗(yàn)平臺隸屬于安徽中科光電色選機(jī)械有限公司與安徽理工大學(xué)產(chǎn)學(xué)研合作項(xiàng)目。核心部件包括:偉杰科技有限公司型號CISSY16 的雙能X 射線源和DT 北京有限公司型號CISTCQ16 的探測器。其中,X 射線源與安檢機(jī)同規(guī)格,電壓160 kV,電流2 mA,探測器的分辨率為1.5 mm。試驗(yàn)平臺外殼內(nèi)部貼附鉛板層,厚度5 mm,用于阻隔X 射線輻射。在距離平臺外殼2~200 cm 測定輻射劑量,檢測值均小于1 μSv,遠(yuǎn)低于國家射線輻射劑量標(biāo)準(zhǔn)要求[21]。圖像獲取過程,如圖1所示。
射源正下方排列有16 個探測卡,每個探測模塊可以采集64 個數(shù)據(jù),一次可采集2 048 個數(shù)據(jù)。所采數(shù)據(jù)中有1 024 個數(shù)據(jù)為低能X 射線圖像數(shù)據(jù),余下為高能X 射線圖像數(shù)據(jù)。每采集1 000 組射線強(qiáng)度信號,便在上位機(jī)中形成一張圖像,圖像像素為1 000×1 024。
1.2.1 厚度效應(yīng)及射束硬化效應(yīng)
由Lambert-Beer 定律可知[13],單一能量的高、低能X 射線穿透煤和矸石時:
式中,I為透射后X 射線探測器檢測到的信號強(qiáng)度;I0為入射的高、低能X 射線強(qiáng)度;μ為高、低能X 射線下同一個物質(zhì)的衰減系數(shù);h為被檢測物料厚度;ρ為被檢測物質(zhì)的密度。
將式(1)變換:
式(2)表明物質(zhì)衰減系數(shù)μ與物質(zhì)密度ρ以及物質(zhì)厚度h三個因素相互關(guān)聯(lián)。其中物質(zhì)衰減系數(shù)μ與物質(zhì)密度ρ為相關(guān)參數(shù),而物質(zhì)厚度h則為自由參數(shù)。
目前,雙能X 射線透射技術(shù)常通過提取物質(zhì)屬性R值來識別物質(zhì),即首先獲取高、低2 種不同能量的信號,然后采用比值法消除厚度和密度的影響。具體原理如下,假設(shè)低能區(qū)X 射線未透射煤和矸石前強(qiáng)度為Il0,透射后強(qiáng)度Il。高能區(qū)X 射線未透射煤和矸石前強(qiáng)度為Ih0,透射后強(qiáng)度Ih,代入Lambert-Beer 公式:
由式(3),(4)可得
式中,μl為低能區(qū)的物質(zhì)衰減系數(shù);μh為高能區(qū)的物質(zhì)衰減系數(shù)。
物質(zhì)屬性R值[20]表示為
然而,X 射線源產(chǎn)生的是連續(xù)能譜的X 射線,此時物質(zhì)衰減系數(shù)μ不是一個固定的參數(shù),而是與X射線能量相關(guān)的函數(shù)μ(E)。那么,對任意能量為E的X 射線[22],有
式中,I0(E)為入射前的高、低能X 射線強(qiáng)度;I(E)為入射后的高、低能X 射線強(qiáng)度。
此外,X 射線探測器對不同能量的X 射線探測效率不同,且不具有能量分辨能力。因而最終探測器獲取的數(shù)據(jù)信號是關(guān)于X 射線的能量進(jìn)行積分后得到的結(jié)果[22]:
式中,Tj為探測器接收到的信號;I(E)為能量為E時的X 射線強(qiáng)度;Em為X 射線的能量譜上限;Pd(E)為探測器對能量為E的X 射線探測效率。
由式(8)可知,物質(zhì)厚度信息以指數(shù)形式包含在積分項(xiàng)內(nèi),無法通過比值法消除,進(jìn)而引發(fā)了厚度效應(yīng)。而不同能量的X 射線在同樣物質(zhì)中的衰減系數(shù)也不相同,由此引發(fā)了射束硬化作用[22]。厚度效應(yīng)與射束硬化效應(yīng)產(chǎn)生的直接影響是通過計算獲取的不同物質(zhì)的物質(zhì)屬性R值存在波動,甚至交叉,如圖2(a)所示。
1.2.2 余暉效應(yīng)
當(dāng)煤或矸石隨膠帶運(yùn)送至X 射線透射區(qū)域時,采集到的透射信號強(qiáng)度并不會突然衰減,而是在緩慢的減小,隨后趨于穩(wěn)定,這種衰減延遲現(xiàn)象稱為X 射線探測器的余暉效應(yīng)。如圖2(b)所示,余暉效應(yīng)主要體現(xiàn)在煤和矸石低能X 射線圖像單列像素灰度值變化。余暉效應(yīng)一方面會導(dǎo)致圖像灰度信息偏差,致使分割時無法精確提取物體邊緣信息,另一方面導(dǎo)致計算的物質(zhì)屬性R值出現(xiàn)偏差。
上述3 種缺陷,可通過一定方法進(jìn)行矯正,但不能完全消除,而且矯正算法較為復(fù)雜。鑒于此,筆者將選擇保留缺陷影響,采用多個維度的特征來對煤和矸石進(jìn)行識別,以求降低缺陷對識別率的影響。
將連續(xù)能譜X 射線等效為單一能譜X 射線,因?yàn)閄 射線透射前后信號強(qiáng)度可由圖像灰度值近似表達(dá)[23],所以計算物質(zhì)屬性R值前首先需要獲得空膠帶運(yùn)轉(zhuǎn)下的X 射線高、低能透射圖像,作為入射前射線強(qiáng)度信號。由式(5),(6)可知R值圖像的計算表達(dá)又可表示為
式中,fl0(x,y)為空膠帶高能X 射線灰度值低能區(qū)圖像;fl(x,y)為物料在膠帶上高能X 射線灰度值低能區(qū)圖像;fh0(x,y)為空膠帶低能X 射線灰度值高能區(qū)圖像;fh(x,y)為物料在膠帶上低能X 射線灰度值高能區(qū)圖像;R(x,y)為計算得到的R值圖像。
定義Rk(x,y)為R(x,y)被分割后單個目標(biāo)區(qū)域子圖像。那么,R值均值Ra特征計算式為
式中,Ra為Rk(x,y)圖像矩陣元素均值;T為Rk(x,y)圖像矩陣元素不為0 的個數(shù);a(i,j)為Rk(x,y)圖像矩陣元素值;p,q分別為Rk(x,y)圖像長度和寬度。
雙能X 射線透射煤矸時,物質(zhì)屬性R值僅與物質(zhì)密度與厚度有關(guān),利用雙能X 射線可以減小厚度效應(yīng)影響,因此在一定粒級范圍內(nèi)可通過物質(zhì)密度來確定R值閾值。通過對不同密度級下的肥煤、焦煤和氣煤進(jìn)行分析,提取其R值均值,得到R值均值與密度關(guān)系,如圖3(a)所示。同理,對不同密度級的肥煤、焦煤和氣煤進(jìn)行灰分檢測,得到3 種煤不同密度級下對應(yīng)灰分含量,如圖3(b)所示。
由圖3(a)可知,密度與R值均值呈正相關(guān);由圖3(b)可知,密度與灰分含量也呈正相關(guān)。原煤灰分含量越高,其發(fā)熱量越低,并且燃燒時產(chǎn)生污染物越多。中國國標(biāo)規(guī)定:煤炭洗選利用中,灰分小于5%,稱為特低灰煤;灰分介于5.01%~10%稱為低灰煤;灰分介于10.01%~20% 稱為低中灰煤;灰分介于20.01%~30% 稱為中灰煤;灰分介于30.01%~40%稱為中高灰煤;灰分介于40.01%~50%稱為高灰煤。并且冶煉用煉焦精煤灰分一般小于12%,其他煉焦精煤灰分一般介于12.5%~16.0%[24]。從圖3(b)中可知,當(dāng)3 種煤灰分約為16%時,平均密度約為1.48 kg/L,其對應(yīng)R值均值約為1.3;當(dāng)3 種煤灰分約為50%時,平均密度約為1.74 kg/L,其對應(yīng)R值均值約為1.42。
選擇肥煤、焦煤和氣煤100 塊,并選擇矸石100塊,提取其R值均值,R值分割閾值選取如圖4所示。利用R值均值閾值對R值圖像進(jìn)行劃分,并進(jìn)行偽色彩處理。結(jié)果如圖5所示,綠色表示煤,紅色表示矸石。
圖3 密度與R 值和灰分之間關(guān)系Fig.3 Relationship between density and R-value and ash
圖4 R 值分割閾值選取Fig.4 R-value segmentation threshold selection
由圖5可知,針對R值圖像5(a),當(dāng)劃定R值閾值為1.3 時,有較多的煤被判定為矸石,如圖5(b)所示(右2 列為煤);而劃定R值閾值為1.42 時,只有少量煤被判定為矸石,如圖5(c)所示。表現(xiàn)在圖像像素上,即圖5(c)綠色面積域相對圖5(b)明顯增加。增加的部分R值分布在1.30~1.42,表示密度分布在1.48~1.74 kg/L 的高灰分煤或由厚度效應(yīng)和射束硬化效應(yīng)影響產(chǎn)生的錯誤信息,如圖5(d)藍(lán)色區(qū)域所示。
圖5 R 值閾值圖像分割結(jié)果Fig.5 R-value image threshold segmentation results
為了更大程度的提取原煤中的煤塊,避免資源浪費(fèi),必須要求R值閾值盡可能的大,以至于將高灰分煤圖像像素面積域劃分為低灰煤的面積域。因此筆者將選取1.42 為閾值對R值圖像進(jìn)行分割。
圖像分割后經(jīng)偽色彩處理,進(jìn)行連通域檢測和連通域分離;將分離連通域后的圖像與偽色彩處理前圖像掩膜處理,得到單個目標(biāo)區(qū)域子圖像。統(tǒng)計提取各目標(biāo)矸石像素占比Rc,表達(dá)式為
式中,r為單個目標(biāo)區(qū)域圖像中紅色像素個數(shù);v為綠色像素個數(shù)。
煤和矸石X 射線透射成像時,2 者灰度均值區(qū)分度最大[13],即灰度均值作為輸入特征分類表現(xiàn)較好。對消除背景后的灰度圖像進(jìn)行連通域檢測與連通域分離,得到每張僅含有一個目標(biāo)區(qū)域的子圖像。灰度均值計算公式為
式中,G為灰度均值;T為子圖像像素灰度值不為0的個數(shù);b(i,j)為子圖像像素灰度值。
選取肥煤、焦煤和氣煤100 塊,矸石100 塊,提取其高、低能圖像灰度均值,并以3 種煤和矸石均值之和的1/2 作為灰度分割閾值。對于高能圖像,其分割閾值為66.438, 對于低能圖像, 其分割閾值為48.728?;叶染捣植寂c劃分閾值如圖6所示。
圖7為高低能圖像灰度閾值分割結(jié)果。同理,求取偽色彩處理后單個目標(biāo)圖像紅素面積占據(jù)整個目標(biāo)的比例。記高、低能圖像矸石含量特征為Glc,Ghc。
綜上,對煤和矸石的圖像共提取8 組特征,此多維度特征組合形成一種強(qiáng)特征向量。一方面等效消除、矯正了煤和矸石的厚度效應(yīng);另一方面結(jié)合了不同能級下的圖像特征,進(jìn)而弱化了余暉效應(yīng)和射束硬化效應(yīng)的影響。
由于圖像特征提取過程消耗大量時間,而且并不是每一個特征都對分類起到關(guān)鍵作用,因此所提取特征中勢必存在冗余或?qū)Ψ诸惤Y(jié)果影響不明顯的特征。基于Relief 的過濾式特征選擇方法,根據(jù)各特征和類別的相關(guān)統(tǒng)計量賦予特征不同的權(quán)重,能夠很好的去除冗余[7]。給定訓(xùn)練集{(x1,y1),(x2,y2),…,(xi,yi)},Relief 首先隨機(jī)選擇D個樣本,然后對樣本內(nèi)每個xi,先在其同類樣本尋找一個最近鄰xi,nh,稱為猜中近鄰(Near-Hit);從xi異類樣本中尋找一個最近鄰樣本xi,nm,稱為猜錯近鄰(Near-Miss)。相關(guān)統(tǒng)計量對應(yīng)屬性j上的分量[25]為
其中,δj為相關(guān)統(tǒng)計量對應(yīng)屬性j上的分量;xji為屬性j上的樣本;xji,nh為屬性j同類樣本尋找的1 個最近鄰樣本;xji,nm為異類樣本尋找的一個最近鄰樣本;diff 為一種函數(shù)運(yùn)算表示,煤矸數(shù)據(jù)集屬性j為數(shù)值變量,則,表征曼哈頓距離,即取差的絕對值,xj a,xjb歸一化在[0,1]內(nèi),為樣本xa在屬性j上的取值,取決于屬性j的類型。
圖6 高、低能圖像灰度閾值選取Fig.6 High and low energy image gray value threshold selection
圖7 高、低能圖像灰度閾值分割結(jié)果Fig.7 High and low energy image gray threshold segmentation results
根據(jù)下述規(guī)則更新特征的權(quán)重。若xi和Near-Hit(xi,nh)在屬性j上的距離小于xi和Near-Miss(xi,nm)上的距離,則該屬性j對區(qū)分同類和異類樣本是有益的,即增加該屬性j對應(yīng)統(tǒng)計分量的權(quán)重;反之亦然。重復(fù)以上過程L次,最后得到每個特征的平均權(quán)重。特征的權(quán)重越大,表示該特征的可分性越強(qiáng)。Relief 算法的運(yùn)行時間隨樣本抽樣次數(shù)M和原始特征數(shù)的增加線性增加,運(yùn)行效率非常高[25]。
3.2.1 SVM(Support Vector Machines)
3.評估關(guān)系,權(quán)衡規(guī)避成本和展望未來。由于蘇南道達(dá)爾區(qū)塊綜合完井服務(wù)總包的重要性,因此我公司格外重視和甲方的合作關(guān)系。按照《哈佛管理導(dǎo)師》課程所講,遇到溝通難題時,評估關(guān)系非常必要。因?yàn)楹图追接兄绱酥匾拈L期合作關(guān)系,所以沖突必須要解決,如果解決不好,必定影響未來的合作和發(fā)展。
支持向量機(jī)是一種以監(jiān)督學(xué)習(xí)方式對數(shù)據(jù)進(jìn)行二元分類的廣義線性分類器,其依據(jù)樣本學(xué)習(xí)建立最大邊距超平面決策邊界。SVM 分類方法能很好地解決煤和矸石這種非線性、小樣本分類問題。本文建立的支持向量機(jī)分類超平面判別函數(shù)與核函數(shù)[26-28]分別表示為
式中,sgn 為符號函數(shù);K為高斯徑向基核函數(shù);SV 為支持向量,為1 個集合;g為高斯徑向基核函數(shù)寬度。
3.2.2 PSO(Particle Swarm Optimization)
支持向量機(jī)分類模型建立過程中,超參數(shù)懲罰因子c和高斯徑向基核函數(shù)寬度g的選取直接影響到模型分類準(zhǔn)確率和模型泛化能力。對參數(shù)c,g常見的選擇方法有試湊法、網(wǎng)格搜索法和交叉法等,這些方法均存在運(yùn)算復(fù)雜、結(jié)果收斂性差等問題。而粒子群算法基于進(jìn)化計算,通過群體中個體之間的協(xié)作與信息共享尋優(yōu),在參數(shù)選取、收斂速度具有很大優(yōu)勢[13]。
因此本文使用粒子群算法尋找超參數(shù)c,g的組合。PSO-SVM 模型優(yōu)化過程中,PSO 參數(shù)初始設(shè)置見表1。
獲取密度分布在1.3~1.8 kg/L 的肥煤、焦煤和氣煤的單個目標(biāo)圖像270 張,同時獲取矸石單個目標(biāo)圖像270 張,密度大于1.8 kg/L。提取圖像8 組特征,給定煤的標(biāo)簽為1,矸石標(biāo)簽為2,組成數(shù)據(jù)集為540×9 的特征矩陣。部分特征提取結(jié)果見表2。
基于Relief 算法,對8 組特征賦予不同權(quán)重,設(shè)定抽樣次數(shù)為M=80,取L=20 次重復(fù)運(yùn)行,計算權(quán)重平均值并繪制各特征權(quán)重曲線,如圖8所示。
表2 部分目標(biāo)特征提取結(jié)果Table 2 Partial target feature extraction results
圖8 Relief 特征選擇結(jié)果Fig.8 Relief feature selection result
由圖8可知,權(quán)重的大小排列順序?yàn)?Rc>Glc>Gl>Ra>Ghc>Gh>Tl>Th。矸石含量Rc,Glc,Ghc作為煤和矸石分選時的統(tǒng)計特征,權(quán)重系數(shù)較高,也即對煤和矸石的區(qū)分程度最好。R值圖像特征與高、低能圖像特征Rc,Glc,Gl,Ra,Ghc在總體特征上權(quán)重較高,而高、低能圖像特征Gh,Tl,Th在總體特征上權(quán)重系數(shù)較小??梢?對煤和矸石采用雙能X 射線識別,應(yīng)重點(diǎn)關(guān)注R值圖像特征與高能圖像特征。
將數(shù)據(jù)集進(jìn)行隨機(jī)排序,為驗(yàn)證數(shù)據(jù)集的穩(wěn)定性,將其分為10 組,采用10 折交叉驗(yàn)證方法,對數(shù)據(jù)集訓(xùn)練并測試。以10 次試驗(yàn)測試集分類準(zhǔn)確率均值作為最終測試結(jié)果。每次試驗(yàn)剔除一個權(quán)重較低的特征量。以多組機(jī)器學(xué)習(xí)中常用分類器模型,如邏輯回歸(LRC)、判別分析法(DAC)、 集成學(xué)習(xí)法(ELRF)、K 最近鄰(KNN)、決策樹(TREES)、BP 神經(jīng)網(wǎng)絡(luò)(BP)為參照,對比分析剔除權(quán)重較低特征后分類模型分類準(zhǔn)確率變化趨勢。
試驗(yàn)過程中,記錄每組分類器訓(xùn)練時間,將統(tǒng)計結(jié)果繪制為折線圖用于趨勢分析,如圖9所示。
圖9表明,隨著每次剔除一個權(quán)重系數(shù)較低的特征,不同的分類器識別率均先增加,后趨于穩(wěn)定。輸入特征較多時,在高維空間中,一些權(quán)重較低的特征存在交叉,可分性弱,因此識別率較低。伴隨權(quán)重較低的特征被剔除,高維空間統(tǒng)計特征交叉減輕,可分性增強(qiáng),因此識別率增加。但隨著特征數(shù)量進(jìn)一步減少,受余暉效應(yīng)、厚度效應(yīng)以及射束硬化效應(yīng)影響,煤和矸石的統(tǒng)計特征在低維空間再次出現(xiàn)交叉,因此分類器識別率又大幅降低。
輸入特征的減少與分類器消耗時間總體呈負(fù)相關(guān)。其中PSO-SVM,LRC,KNN,BP 分類器對肥煤、焦煤和氣煤混合矸石識別效果較好。本文建立的PSO- SVM 分類模型識別準(zhǔn)確率最高,可達(dá)到99.4%,同時耗時最短。其中最優(yōu)特征組合為[Rc,Glc,Gl,Ra],分類模型的最佳超參數(shù)組合為:c=99.063 6,g=0.01。
圖9 分類測試結(jié)果Fig.9 Classification test results
將本文提出多維度分析方法與其他4 種方法進(jìn)行比較,例如:采用單能X 射線圖像特征中灰度特征(灰度均值、灰度方差)聯(lián)合紋理特征(對比度、相關(guān)性、能量、熵)的識別方法[13];基于等效原子序數(shù)的煤和矸石識別方法[14];基于等效原子序數(shù)分割圖像,提取目標(biāo)區(qū)矸石像素面積占比的方法[15];基于物質(zhì)屬性R值聯(lián)合高能圖像灰度均值特征I的識別方法[16-17],結(jié)果見表3。
表3 不同方法對比Table 3 Comparison of different methods
由表3可知,本文提出方法對煤和矸石的識別率高于上述4 種方法,且具有以下優(yōu)勢:①采用雙能X射線消除、矯正了厚度效應(yīng)影響;②通過多維度分析判斷,降低了余暉效應(yīng)和射束硬化效應(yīng)影響;③建立了基于機(jī)器學(xué)習(xí)算法的分類識別模型,提高了識別效率。
在中國境內(nèi),不同礦區(qū)煤變質(zhì)程度不一,因此其品質(zhì)均存在差異。例如:在中國河北開灤庒煤礦、山東棗莊山家林煤礦和山西古交鎮(zhèn)城底煤礦等多產(chǎn)肥煤;河北峰峰二礦、安徽淮北張莊礦和四川攀枝花的大寶頂煤礦等多產(chǎn)焦煤;而淮南望峰崗等礦區(qū)多產(chǎn)出氣煤。在第4.1 節(jié)試驗(yàn)中,以3 種不同品質(zhì)的煤和矸石訓(xùn)練模型分類器,然后對3 種煤混合矸石進(jìn)行識別,取得較好效果。若對某一處產(chǎn)煤品質(zhì)較為單一的礦區(qū),例如某礦區(qū)煤的品質(zhì)趨于肥煤、焦煤或氣煤中的一種,那么還要測試模型對單一品質(zhì)煤矸混合識別效果。
基于PSO-SVM 模型分類器,采用最優(yōu)特征組合[Rc,Glc,Gl,Ra]對單一品質(zhì)的煤和矸石進(jìn)行分類識別。試驗(yàn)分別獲取肥煤、焦煤和氣煤子圖像各90 張,矸石圖像各90 張。以第4 章節(jié)試驗(yàn)中訓(xùn)練好的PSO-SVM 模型對驗(yàn)證數(shù)據(jù)進(jìn)行分類,每組驗(yàn)證數(shù)據(jù)包含90 組煤和90 組矸石特征信息,結(jié)果見表4。
表4 單一品質(zhì)煤混合矸石識別結(jié)果Table 4 Single-quality coal mixed gangue identification results
驗(yàn)證結(jié)果顯示,分類模型對肥煤混合矸石識別率為98.89%,焦煤混合矸石的識別率為100%,氣煤混合矸石的識別率為99.44%。實(shí)際工程應(yīng)用中,依據(jù)文中方法預(yù)調(diào)整參數(shù)后,可基本保持參數(shù)統(tǒng)一不變。
(1)聯(lián)合R值圖像特征與高、低能圖像特征對煤和矸石進(jìn)行多維度分析,降低了圖像識別過程余暉效應(yīng)、厚度效應(yīng)和射束硬化效應(yīng)帶來的誤判影響。PSO-SVM 分類模型聯(lián)合最優(yōu)特征組合[Rc,Glc,Gl,Ra],應(yīng)對單一品質(zhì)煤塊混合矸石分類準(zhǔn)確率均在98%以上;應(yīng)對多種煤質(zhì)混合并混合矸石的識別率可達(dá)99.4%。
(2)R值圖像與高能圖像特征,在煤和矸石之間的可區(qū)分性較強(qiáng),尤其涉及基于R值圖像與高能圖像提取的矸石含量特征。
(3)雙能X 射線物質(zhì)識別技術(shù),對不同產(chǎn)地、不同種類的煤敏感性低,結(jié)合多維度分析方法,減少了工程應(yīng)用中根據(jù)礦區(qū)煤質(zhì)差異進(jìn)行參數(shù)調(diào)整的頻次。