王培珍,任 將,杜存鈴,張代林
(安徽工業(yè)大學a.電氣與信息工程學院;b.煤的潔凈轉化與綜合利用安徽省重點實驗室;c.冶金減排與資源綜合利用教育部重點實驗室,安徽馬鞍山 243032)
煤巖不同顯微組分的構成與其性質直接相關,因此實現(xiàn)煤巖顯微組分的自動分類與識別對煤巖工藝性質的界定具有重要意義。煤巖的顯微組分來源多樣,在漫長的形成過程中受多種因素干擾,其形態(tài)結構各異且較為復雜[1]。目前,已有學者對煤顯微圖像分類問題進行研究,并取得一定進展。如阮曉東等[2]通過提取煤巖顯微圖像中區(qū)域的輪廓,根據(jù)輪廓的交點判斷有重疊的圓形顆粒,分析煤巖顯微組分的形貌;尹文花[3]通過顯微組分灰度值的分布測算煤巖顯微圖像中相應組分含量,由于灰度值僅為煤巖顯微組分的特征之一,且存在不同組分灰度值相近甚至相同的情況,致使測定的準確性不高;王素婷等[4]提取煤巖顯微圖像的局部二值模式(LBP)和灰度共生矩陣(GLCM)特征,采用支持向量機對煤巖顯微組分大類別進行分類,但分類正確率有待提高。王培珍等[5-7]對于煤巖顯微圖像分析與識別進行了較為系統(tǒng)的研究,如采用改進的圓形LBP均勻模式對煤顯微圖像的紋理特征進行分析;采用小波變換將煤巖惰質組顯微圖像進行分解,提取不同尺度下的紋理特征并對其進行有效分類;采用主成分分析法對由灰度分布特征量和基于灰度共生矩陣的紋理特征量構成的煤巖鏡質組初始特征量集進行抽取,并構建支持向量機對其分類,取得了一定的效果。殼質組是煤巖三大顯微組分之一,主要來源于高等植物的角質層、木栓層等穩(wěn)定成分或藻類等微生物的降解物[1],形貌復雜多樣,本課題組[8]通過改進傳統(tǒng)的SUSAN(Univalue Segment Assimilating Nuclues)算法,對其顯微組分之一的析出瀝青體的銳角角點進行檢測,該方法可將析出瀝青體從其它組分中分離出來。殼質組中其它組分的有效分類還鮮見報道。殼質組顯微組分存在明顯的紋理特征(隨機紋理),且不同組分間紋理存在一定差異。鑒于Tamura紋理與人類視覺感知相吻合[9-10],在表征隨機紋理時有其獨特的特點,本文采用Tamura紋理描述方法對殼質組顯微圖像中典型組分特征量進行提取,并構建支持向量機分類器對其進行分類,以探索對煤巖殼質組顯微組分進行有效分類的新方法。
殼質組顯微組分類別較多,包括孢子體、角質體、木栓質體、樹皮體、樹脂體、藻類體、瀝青質體、滲出瀝青質體、熒光體、碎屑體等[11]。但某些組分較少出現(xiàn),因此文中選擇較為典型的角質體、藻類體、樹皮體3類顯微組分為對象,其顯微圖像如圖1。
形成角質體植物的葉、枝、莖等表皮組織會產生分泌物(角質),這些分泌物經煤化作用后形成較為穩(wěn)定的組分[12],其顯微圖像在垂直層理的切面中呈長條狀,且外緣平滑內緣呈鋸齒狀,如圖1(a);藻類體來源于藻類,其形狀亦類似于藻類,呈鋸齒狀、海綿狀或其它不規(guī)則形狀,如圖1(b)中顏色較亮的不規(guī)則區(qū)域;樹皮體由植物的莖和根等外部栓質化組織形成,大多呈扁平的長方形或磚形,排列比較規(guī)則,如圖1(c)。綜合圖1可看出,煤巖殼質組顯微組分的自然形貌具明顯的紋理結構,且不同組分間紋理具一定的差異。
圖1 3類典型殼質組顯微圖像Fig.1 Microscopic images of three kinds of typical macerals of exinite
基于人類對紋理視覺感知的心理學研究,Tamura等[9]提出一種紋理特征的描述方法,其中定義了6個用于描述紋理的特征量,分別為粗糙度(coarseness)、對比度(contrast)、方向度(directionality)、線像度(linelikeness)、規(guī)則度(regularity)和粗略度(roughness)。粗略度是粗糙度和對比度兩個屬性的合成。故文中采用粗糙度、對比度、方向度、線像度和規(guī)則度等5個特征量對殼質組顯微組分進行描述與分析。
2.1.1 粗糙度
粗糙度反映圖像灰度變化的劇烈程度,紋理基元尺寸越大則感覺越粗糙,其定義如下。
計算圖像中以坐標(x,y)為中心、大小為2k×2k的活動窗口(如1×1,2×2,…,32×32,窗口以中每個像元的灰度均值Ak(x,y),
其中:(i,j)表示鄰域中像元的位置;g(i,j)表示位于(i,j)處像元的灰度值;k確定參與均值計算的像素范圍。
對于每個像元,分別計算其在水平及垂直方向上互不重疊的活動窗口之間的平均灰度差Ek,v,Ek,h,
對于每一個像元,尋找最優(yōu)的尺寸Skbest=2k,使其平均灰度值E值達到最大Ekbest。
粗糙度Fcrs定義為整幅圖像中各像元最優(yōu)尺寸Skbest的平均值,
其中M和N分別表示圖像寬度和高度。
2.1.2 對比度
對比度反映灰度圖像中最暗和最亮灰度的層級,其差異范圍的大小決定對比度的大小,此外灰度級的動態(tài)范圍、邊緣的尖銳程度、模式的重復周期等也會影響對比度。對比度Fcon定義為
其中:σ表示圖像灰度值的均方差;α4表示圖像灰度統(tǒng)計量的峰態(tài),α4=μ4/σ4;μ4表示四階矩均值。
2.1.3 方向度
方向度描述紋理沿某方向集中的強度。方向度的計算基于每個像素點的梯度向量,該向量的模和方向分別定義為
其中Δh和Δv分別為(x,y)處水平與垂直方向灰度差分,分別如下所示的2個3×3的模板計算。
量化各像素點的方向角θ值,統(tǒng)計其相應方向角上邊緣像素數(shù)量Nθ(i),挑選出邊緣強度(模)大于預定閾值的邊緣像素點,設其數(shù)量為Nθ(φ),則相應方向上的直方圖HD(φ)為
其中φ=0,1,2,…,n-1。則方向度定義為
其中:np為峰的數(shù)量;wp為圍繞該角度峰值與谷值之間的范圍;r為與角度θ量化水平相關的歸一化因子;φp為第p個峰值的位置。
2.1.4 線像度
線像度Flin表示圖像紋理是否具有線性結構,定義如下
其中:Pd(i,j)表示相距為d的一組元素、方向編碼分別為i,j時出現(xiàn)的次數(shù);m表示劃分角度的數(shù)目,文中取16。
2.1.5 規(guī)則度
紋理具有重復排列的自然景象,其規(guī)則度往往難以用數(shù)學公式表示。若圖像中存在與整幅圖像紋理特征不一致的局部區(qū)域紋理特征,則圖像的規(guī)則度減弱。所以可通過對原圖像分區(qū)后每個子圖像屬性方差來測度紋理的規(guī)則度,這里考慮子圖像的4個特征來衡量紋理的規(guī)則度Freg。
其中:η為標準化因子;σcrs,σcon,σdir,σlin分別為Fcrs,F(xiàn)con,F(xiàn)dir,F(xiàn)lin的標準方差。
殼質組顯微圖像樣本由光度計在油浸反光下獲取。分別選取角質體、藻類體、樹皮體80幅顯微圖像,按照2.1中關于Tamura紋理的定義分別計算上述3類殼質組典型顯微組分的5個特征量。由于篇幅所限,表1僅給出其中5組典型樣本數(shù)據(jù)。
為直觀分析樣本數(shù)據(jù)的分布特點及特征量的可區(qū)分性,對于每類組分選取30個樣本繪制其特征量的分布,結果如圖2。由圖2可看出:粗糙度作為特征量具有一定的可區(qū)分性,從小到大排序依次是角質體、樹皮體、藻類體,主要原因在于角質體線性紋理比較細密,粗糙度較小,樹皮體存在塊狀的紋理區(qū)域,相比于角質體粗糙度要大一些,而藻類體圖像中有大量的藻類狀區(qū)域,粗糙度最大;藻類體與角質體的對比度特征數(shù)據(jù)間有較多的交錯;角質體由于紋理具明顯的方向性,其方向度值較大,與其它兩類組分具有明顯的可區(qū)分性;線像度對于3個類別組分具有較好的區(qū)分性;對于3類組分來說,規(guī)則度分布相互交錯,可區(qū)分性較差。綜上所述,采用Tamura方法對煤巖殼質組紋理特征進行描述時,粗糙度、線像度對3類組分具有較好的可區(qū)分性;對比度、方向度次之;而規(guī)則度的可區(qū)分性較差,本文的后續(xù)工作中舍棄該特征量。
表1 殼質組典型顯微組分特征量Tab.1 Texture features of typical macerals of exinite
圖2 殼質組顯微組分紋理特征分布Fig.2 Distribution of texture features of macerals of exinite
支持向量機(Support Vector Machine,SVM)分類器以訓練誤差作為優(yōu)化問題的條件,是目前解決小樣本問題的最優(yōu)分類方法之一,已在多領域的分類與預測問題中得到應用[13-14]。針對文中研究對象,構建支持向量機分類器對3類典型殼質組顯微組分進行分類。
設有訓練樣本集{(xi,yi),i=1,2,...,l},xi∈RK表示樣本數(shù)據(jù),l表示集合中包含的樣本個數(shù),K為xi的維數(shù),yi為xi的類別編號。最優(yōu)超平面為ωTxi+b=0 (i=1,...,l),ω和b分別為權重向量和偏置量。對于線性不可分問題,需滿足
其中ζi為松弛變量,表示線性可分問題的偏離程度。為尋找可使訓練樣本錯誤分類誤差最小的超平面,得以下優(yōu)化問題
即尋找合適的權值向量ω,使φ(ω,ζ)最小,其中C為懲罰系數(shù),表示對錯分樣本的懲罰程度。求解中,為實現(xiàn)非線性問題向線性問題的轉化,引入核函數(shù)k(xi,x),則上述二次型優(yōu)化問題最終可表示為
其中λi為拉格朗日乘子。鑒于徑向基函數(shù)(RBF)所需參數(shù)較少及對于缺少先驗知識時所具備的良好性能,文中選擇RBF核函數(shù),形式為
其中γ為核參數(shù),控制函數(shù)的徑向作用范圍。
實驗過程中,選取殼質組3類典型顯微組分樣本各80幅,其中訓練樣本各50幅,測試樣本各30幅,樣本圖像大小為100×100。
采用單個特征量進行分類,結果如表2。由表2可看出:粗糙度對于3類組分的分類準確率均達83%以上,其中角質體的分類準確率96.7%,這是因為角質體的粗糙度較小,其特征量與樹皮體只有少量重疊,而樹皮體粗糙度特征量分布介于角質體與藻類體之間,且與兩者都有交錯,故分類準確率較低;采用對比度特征量進行分類時,分類效果均不理想,主要原因在于3類組分對比度特征分布相互交織,可區(qū)分性差;采用方向度進行分類時,角質體與藻類體可有效區(qū)分出來,樹皮體的特征值分布與其它兩類都有重疊,分類效果較差;線像度對于3類組分的分類準確率均達82%以上,尤其是藻類體和樹皮體均達96.7%,具有良好的區(qū)分度;采用規(guī)則度作為分類特征時,幾乎不能進行有效區(qū)分,這與3類組分中規(guī)則度的分布相互交錯有關。上述分類結果與2.2關于特征量分析結果相映襯。
分析表2知,僅用單特征量對3類組分進行分類,整體分類效果不理想。為此,采用特征量的組合對其進行分類實驗。根據(jù)前述分析及單特征分類結果,線像度對3類組分具有較好的可區(qū)分性,故將線像度作為第一特征量與其它特征組合,組合特征量分類結果如表3。由表3可看出,采用多特征量進行分類時,分類的準確率明顯提高。其中線像度、方向度兩個特征量組合后分類效果最好,平均分類準確率達98.9%,這是因為3類典型組分中,線像度具有較好的可區(qū)分性,且方向度對于角質體、藻類體兩類具有較強的可區(qū)分性,兩個特征量組合后相得益彰,分類準確率大為提高。
表2 基于單個特征量分類結果Tab.2 Results of classification with single feature
表3 基于組合特征量分類結果Tab.3 Results of classification with joint features
在分析殼質組中角質體、樹皮體、藻類體等組分顯微圖像特點的基礎上,采用Tamura紋理分析方法提取上述3類顯微組分的特征量,分析各特征量的可區(qū)分性,并構建RBF支持向量機進行分類實驗,得如下主要結論:
1)基于Tamura紋理的5個特征量中,線像度具有較好的可區(qū)分性,方向度、粗糙度次之,規(guī)則度可區(qū)分性最差;
2)采用單特征量進行分類時,線像度整體效果較好,方向度和粗糙度次之,但方向度對樹皮體的分類效果較差;采用單特征量進行分類的整體效果不理想;
3)將特征量進行組合后,分類的準確率大為提高,其中線像度與方向度組合所得分類效果最好。
本文僅對殼質組中角質體、樹皮體、藻類體3類組分進行了較為有效的分類,當添加其它組分至分類器時,其特征量間可區(qū)分性會減弱,分類的準確率會下降,但本文的分類方法具有一定的通用性,可推廣至殼質組其它組分和煤巖其它組別顯微組分的分類與識別中。