張澤琳 胡 齊 章智偉 王 黎
(1.冶金礦產(chǎn)資源高效利用與造塊湖北省重點(diǎn)實(shí)驗(yàn)室,湖北省武漢市,430081;2.武漢科技大學(xué)資源與環(huán)境工程學(xué)院,湖北省武漢市,430081)
目前,常見(jiàn)的選煤方法為水洗工藝和干選工藝,水洗工藝主要包括跳汰、重介和浮選等,占比達(dá)到了80%以上,而基于風(fēng)選的復(fù)合干選、空氣重介、碎選等工藝應(yīng)用不多,主要集中于新疆、內(nèi)蒙等干旱缺水的地方,然而這些地方的原煤儲(chǔ)量巨大,是我國(guó)將來(lái)煤炭重要供給源。從保護(hù)環(huán)境、節(jié)約水資源以及我國(guó)煤炭開(kāi)發(fā)的前景考慮,干法選煤意義重大,是未來(lái)選煤行業(yè)的發(fā)展方向。近年來(lái),基于γ射線、X射線成像光電以及機(jī)器視覺(jué)的煤炭智能干選機(jī)的相關(guān)研究和應(yīng)用日益增多,其節(jié)能、降耗、無(wú)水、性價(jià)比高等優(yōu)勢(shì)使其具有較大的市場(chǎng)應(yīng)用前景,這類技術(shù)是煤炭干選領(lǐng)域的一個(gè)重大技術(shù)突破,為我國(guó)干旱缺水地區(qū)的煤炭分選提供了一種全新的思路。
智能干選技術(shù)是將原煤平鋪后,基于傳感器和人工智能算法對(duì)煤與矸石或多產(chǎn)品進(jìn)行智能化識(shí)別,進(jìn)而通過(guò)高壓風(fēng)或擊打裝置將產(chǎn)品分開(kāi)。目前,智能干選機(jī)多以γ射線、X射線成像識(shí)別為主,機(jī)器視覺(jué)識(shí)別研究較少。選煤廠有經(jīng)驗(yàn)的工人均能夠通過(guò)肉眼觀察煤料質(zhì)量并指導(dǎo)相關(guān)設(shè)備生產(chǎn),而機(jī)器視覺(jué)中圖像分析技術(shù)能夠代替人眼來(lái)捕捉目標(biāo)的相關(guān)信息,進(jìn)而實(shí)現(xiàn)對(duì)礦流的識(shí)別與判斷。圖像分析技術(shù)已經(jīng)被廣泛應(yīng)用于選礦行業(yè),并受到了業(yè)內(nèi)學(xué)者的高度重視。
張國(guó)英等研究人員提出了一種基于圖像分析的原礦石粒度在線檢測(cè)與分析方法,建立了礦石群中的粒度組成與分布的預(yù)測(cè)模型;Kistner和Perez等研究人員利用圖像分析技術(shù),提取了與礦石粒度高度相關(guān)的特征參數(shù),并建立礦石粒度預(yù)測(cè)模型,實(shí)現(xiàn)了礦石粒度的在線檢測(cè);Patel等研究人員提取了石灰石基于RGB顏色模型各分量上的加權(quán)平均值、偏度和和峰度等9個(gè)統(tǒng)計(jì)特征,對(duì)PNN分類器進(jìn)行驗(yàn)證,發(fā)現(xiàn)模型的錯(cuò)誤率低于6%,證明了提出的基于圖像分析的模型可以很好地對(duì)石灰石進(jìn)行分類;Ebrahimi等研究人員通過(guò)獲取礦石表面圖像,提取出顏色、光澤、形狀、紋理等表觀物理特征,用層次分析法(AHP)對(duì)提取出的所有特征進(jìn)行篩選,保留了權(quán)重較大的7個(gè)特征,并用人工神經(jīng)網(wǎng)絡(luò)(ANN)建立了礦石類型預(yù)測(cè)模型;王團(tuán)鋒等研究人員采用X射線熒光分析法對(duì)金礦石進(jìn)行了在線識(shí)別與監(jiān)測(cè),設(shè)計(jì)了合適的金礦石分揀平臺(tái),成功實(shí)現(xiàn)了礦石預(yù)分選階段的拋尾工作,大幅度提高了入選礦石的品質(zhì);楊沫等研究人員以煤與矸石表面的灰度信息作為主要的特征參數(shù),設(shè)計(jì)了一種基于圖像分析的煤與矸石自動(dòng)分類系統(tǒng),大幅度降低了選煤廠的經(jīng)濟(jì)和人力成本。
因此,本文針對(duì)無(wú)煙煤三產(chǎn)品提出了一種基于圖像分析技術(shù)的分類方法。首先,通過(guò)顯微煤巖組分與表面特征分析,從微觀到宏觀揭示了精煤、中煤和矸石三產(chǎn)品的表觀差異性,為無(wú)煙煤三產(chǎn)品圖像識(shí)別與分類奠定理論基礎(chǔ);其次,通過(guò)圖像預(yù)處理、特征提取和篩選以及分類模型的建立對(duì)無(wú)煙煤三產(chǎn)品進(jìn)行分類預(yù)測(cè)。該方法為煤料智能干選設(shè)備的開(kāi)發(fā)提供了一定的理論基礎(chǔ)和技術(shù)支撐。
試驗(yàn)煤樣為寧夏太西無(wú)煙煤精煤、中煤和矸石三產(chǎn)品,粒級(jí)為13~40 mm。通過(guò)灼燒稱重法,3個(gè)密度級(jí)產(chǎn)品的灰分分別為7.12%、20.55%和50.32%。
圖像采集系統(tǒng)由計(jì)算機(jī)、工業(yè)相機(jī)和光源3部分組成,圖像像素大小為1280×1024 pixel,試驗(yàn)共獲取了1226張煤粒圖像,其中精煤612張、中煤302張、矸石312張。圖像采集系統(tǒng)和煤粒圖像如圖1所示。
圖1 圖像采集系統(tǒng)和煤粒圖像
對(duì)試驗(yàn)中精煤、中煤和矸石三產(chǎn)品進(jìn)行顯微與宏觀煤巖組分分析,結(jié)果見(jiàn)表1。
表1 顯微與宏觀煤巖組分分析結(jié)果 %
由表1可以看出,不同密度級(jí)無(wú)煙煤之間顯微組分含量、宏觀煤巖組分含量均有顯著差異,使其從光亮型煤向暗淡型煤轉(zhuǎn)變,導(dǎo)致其顏色、光澤、紋理等物理表觀特性的不同。
為了進(jìn)一步觀察和對(duì)比精煤、中煤和矸石煤樣表觀特性的差異,拍攝了20 μm尺度下三產(chǎn)品的SEM表面形貌圖像如圖2所示,工業(yè)相機(jī)下拍攝的照片如圖3所示。
圖2 三產(chǎn)品煤樣20 μm尺度下SEM圖像
圖3 工業(yè)相機(jī)下拍攝的三產(chǎn)品煤粒圖像
由圖2可以看出,精煤表面以薄層狀結(jié)構(gòu)為主,質(zhì)地均一光滑,斷口較為平整;中煤表面以細(xì)條帶碎片為主,裂隙增多,斷口參差不齊,無(wú)規(guī)則;矸石表面以致密纖維狀和線理狀結(jié)構(gòu)為主,磨砂般平滑,內(nèi)生裂隙不發(fā)達(dá)。圖3中工業(yè)相機(jī)拍攝圖像在表面形貌上與圖2中的SEM圖像一致,由于煤巖組成的不同導(dǎo)致三產(chǎn)品煤樣在顏色和光澤上也呈現(xiàn)出較大的差異性。精煤煤樣偏黑色,表面光澤很強(qiáng),質(zhì)地均一且易于反光,導(dǎo)致表面偏亮;中煤絲炭和暗煤含量較高,反光性差、表面暗淡且偏黑;矸石主要成分為礦物質(zhì),灰分較高,表面平滑致密,質(zhì)地堅(jiān)硬,幾乎不反光,表面偏灰色。
顯微和宏觀煤巖組分分析揭示了精煤、中煤和矸石三產(chǎn)品表觀差異性的根源,而SEM圖像分析和工業(yè)相機(jī)圖像分析更加直觀反映了三產(chǎn)品煤粒表面在顏色、光澤和紋理上的差異。上述分析不僅為精煤、中煤和矸石三產(chǎn)品圖像分析奠定了理論基礎(chǔ),而且為后續(xù)煤粒表面特征量化指明了方向。
為了方便量化煤粒表面特征,需對(duì)獲取的圖像進(jìn)行預(yù)處理,如圖4所示。
(1)灰度圖與二值圖像轉(zhuǎn)化。將RGB彩色原圖轉(zhuǎn)化為灰度圖,并采用大津法進(jìn)一步轉(zhuǎn)化為二值圖像,將目標(biāo)區(qū)域與背景區(qū)域分離。
(2)面積閾值法與孔洞填充。設(shè)定面積閾值去除圖像區(qū)域內(nèi)小于面積閾值的雜點(diǎn)和細(xì)小顆粒,消除后續(xù)目標(biāo)區(qū)域識(shí)別的誤差,進(jìn)而將目標(biāo)區(qū)域內(nèi)容的孔洞進(jìn)行填充。
圖4 圖像預(yù)處理結(jié)果
(3)形態(tài)學(xué)腐蝕處理。試驗(yàn)過(guò)程中發(fā)現(xiàn)目標(biāo)區(qū)域與背景交接處存在異常亮點(diǎn),對(duì)后續(xù)特征參數(shù)的提取會(huì)產(chǎn)生誤差,因此采用10×10 pixel圓形結(jié)構(gòu)體對(duì)各目標(biāo)區(qū)域邊緣進(jìn)行腐蝕操作,消除亮點(diǎn)區(qū)域。
(4)目標(biāo)區(qū)域標(biāo)記和截取。在二值圖像中對(duì)各目標(biāo)區(qū)域進(jìn)行標(biāo)記,進(jìn)而分別提取原圖中R、G、B三分量矩陣中對(duì)應(yīng)的目標(biāo)區(qū)域,重建優(yōu)化后的煤粒彩色圖像,最終采用垂直方向上的外接矩形截取各目標(biāo)區(qū)域。
根據(jù)煤巖分析與表面特征分析,精煤、中煤和矸石三產(chǎn)品煤粒表面的顏色、光澤和紋理存在較大差異性。最常用的顏色、光澤特征量化方法是基于RGB顏色模型、灰度模型和HSV顏色模型。
選取頻率直方圖的常用統(tǒng)計(jì)特征來(lái)量化煤粒表面顏色和光澤信息。Kistner等研究人員指出用基于圖像像素的二階統(tǒng)計(jì)特征作為目標(biāo)的特征參數(shù)已經(jīng)占據(jù)了主導(dǎo)地位;Patel等研究人員提取了石灰石基于RGB顏色模型各分量上的加權(quán)平均值、偏度和峰度等9個(gè)統(tǒng)計(jì)特征,建立了石灰石的類型預(yù)測(cè)模型,并取得了良好的試驗(yàn)效果。因此本文選擇頻率直方圖的均值、標(biāo)準(zhǔn)差、偏度和峰度來(lái)量化煤粒表面的顏色和光澤特征。根據(jù)前期研究,R分量和B分量、G分量和灰度圖像的相關(guān)統(tǒng)計(jì)特征基本一致,在進(jìn)行顏色和光澤特征提取時(shí)各選其一即可,即提取R分量和灰度圖像的均值、標(biāo)準(zhǔn)差、偏度和峰度即可。
本文對(duì)比分析了三產(chǎn)品煤粒R、G、B三分量偽彩色圖和頻率直方圖,三產(chǎn)品煤粒原圖及R分量偽彩色圖和頻率直方圖如圖5所示。
圖5 三產(chǎn)品煤粒原圖及其R分量偽彩色圖和頻率直方圖
通過(guò)觀察三產(chǎn)品煤粒H、S、V三分量的偽彩色圖和頻率直方圖,三產(chǎn)品煤粒H分量的偽彩色圖和頻率直方圖如圖6所示。
圖6 三產(chǎn)品煤粒H分量偽彩色圖和頻率直方圖
針對(duì)不同產(chǎn)品煤粒、不同HSV分量之間的顯著差異,選擇在HSV分量間提取灰度差分統(tǒng)計(jì)法、小波紋理、Gabor小波紋理以及灰度共生矩陣紋理特征進(jìn)行分析對(duì)比,最終共提取65個(gè)顏色、光澤和紋理特征參數(shù)如圖7所示。
圖7 65個(gè)顏色、光澤和紋理特征參數(shù)
采用箱線圖對(duì)三產(chǎn)品煤粒每個(gè)特征參數(shù)進(jìn)行對(duì)比分析,去除幾乎不變的特征參數(shù),篩選出變化較大的特征參數(shù)。若部分特征參數(shù)變化趨勢(shì)基本一致,則通過(guò)計(jì)算其相關(guān)性系數(shù),保留閾值以下的特征參數(shù)。特征篩選的目的在于減少三產(chǎn)品煤粒分類模型的冗余特征參數(shù),在保留分類精度的前提下提高模型運(yùn)算速度和魯棒性。
通過(guò)對(duì)三產(chǎn)品煤樣表面特征的箱線圖進(jìn)行分析,發(fā)現(xiàn)共有6種變化趨勢(shì)(以每一類典型的變化趨勢(shì)為例),如圖8所示。不同變化趨勢(shì)下的特征參數(shù)見(jiàn)表2。
圖8 特征參數(shù)的6種變化趨勢(shì)
表2 不同變化趨勢(shì)下的特征參數(shù)
除去基本不變的特征參數(shù)外,對(duì)每個(gè)變化趨勢(shì)下的特征參數(shù)進(jìn)行相關(guān)性系數(shù)分析。設(shè)定相關(guān)系數(shù)閾值R為0.4、0.5、0.6、0.7、0.8和0.9,對(duì)比分析不同R篩選出來(lái)的特征參數(shù)集相對(duì)應(yīng)的分類預(yù)測(cè)模型精度。當(dāng)相關(guān)性系數(shù)大于R時(shí),則判定兩特征參數(shù)之間很相似,保留其一;反之,兩特征全部留下。R值越小則特征參數(shù)越少,反之則特征參數(shù)越多。通過(guò)不同R值的設(shè)定,確定最終保留的特征參數(shù),通過(guò)對(duì)比三產(chǎn)品分類模型的精度,確定最佳的R值和最合適的特征參數(shù)集。增大變化趨勢(shì)中特征參數(shù)之間的相關(guān)性系數(shù)分析圖如圖9所示,圖中可根據(jù)顏色和橢圓形狀直觀顯示特征之間的相關(guān)性大小。系數(shù)閾值條件下篩選出的特征參數(shù)見(jiàn)表3。
圖9 增大變化趨勢(shì)中特征參數(shù)相關(guān)性系數(shù)分析
本文采用箱線圖中的異常點(diǎn)檢測(cè)標(biāo)準(zhǔn),這種方法不需要事先假定數(shù)據(jù)服從特定的分布形式,沒(méi)有對(duì)數(shù)據(jù)作任何限制性要求,在識(shí)別異常值方面有一定的優(yōu)越性。取Nl-3IQR~Nu+3IQR為特征參數(shù)的正常變化范圍,
選用支持向量機(jī)(SVM)作為三產(chǎn)品煤粒分類建模方法,其中主要調(diào)整的兩個(gè)參數(shù)為懲罰參數(shù)c和核函數(shù)參數(shù)g。在實(shí)際應(yīng)用中,常用交叉驗(yàn)證法優(yōu)化這兩個(gè)參數(shù)。交叉驗(yàn)證的基本思想是將原始數(shù)據(jù)分為若干份,其中一份作為測(cè)試集,其余作為訓(xùn)練集,循環(huán)建立分類模型,選出平均精度最高的c值和g值,即Bestc和Bestg。其中訓(xùn)練集的數(shù)據(jù)越多,關(guān)于對(duì)象的描述就越準(zhǔn)確,模型的識(shí)別精確度就越高;而測(cè)試集用于檢測(cè)模型的泛化能力,即采用非訓(xùn)練集數(shù)據(jù)作為模型的輸入,輸出的分類精確度越高說(shuō)明模型的泛化能力越強(qiáng)。
分別選用R值條件下篩選出的有效特征參數(shù),對(duì)其進(jìn)行異常點(diǎn)檢測(cè)后,去除帶有異常點(diǎn)數(shù)據(jù)的煤粒特征,剩余1189組數(shù)據(jù)。隨機(jī)選取精煤、中煤和矸石三產(chǎn)品煤粒數(shù)據(jù)的2/3作為訓(xùn)練集,1/3作為測(cè)試集對(duì)模型進(jìn)行訓(xùn)練與測(cè)試,每次測(cè)試均采用交叉驗(yàn)證方法得到Bestc和Bestg,重復(fù)10次取其平均值,并對(duì)其預(yù)測(cè)時(shí)間進(jìn)行對(duì)比分析(指煤粒圖像預(yù)處理、特征參數(shù)提取以及分類預(yù)測(cè)在內(nèi)的總時(shí)間),不同閾值R的訓(xùn)練集和測(cè)試集分類準(zhǔn)確率見(jiàn)表4。
表4 不同閾值R的訓(xùn)練集和測(cè)試集分類準(zhǔn)確率
分類測(cè)試結(jié)果表明,隨著R閾值的增加,特征參數(shù)個(gè)數(shù)增多,無(wú)煙煤三產(chǎn)品分類精度隨之增高,預(yù)測(cè)時(shí)間也隨之增加。然而,當(dāng)R大于0.6時(shí),其訓(xùn)練集和測(cè)試集分類準(zhǔn)確率相差不大,但特征參數(shù)個(gè)數(shù)差異較大,說(shuō)明冗余特征增多,對(duì)于無(wú)煙煤三產(chǎn)品分類模型的實(shí)時(shí)性和穩(wěn)定性不利。綜合考慮特征參數(shù)個(gè)數(shù)、分類精度以及預(yù)測(cè)時(shí)間,確定R為0.6時(shí)的特征參數(shù)集及其分類模型最合適,其訓(xùn)練集和測(cè)試集的分類準(zhǔn)確率分別為92.66%和88.50%。
以無(wú)煙煤精煤、中煤和矸石三產(chǎn)品為試驗(yàn)樣本,提出了一種基于圖像分析的三產(chǎn)品分類預(yù)測(cè)方法,并得出以下結(jié)論:
(1)無(wú)煙煤煤巖分析和煤粒表面圖像分析可以有效證明煤粒表面顏色、光澤以及紋理等表觀特征與其密度級(jí)之間存在緊密聯(lián)系,為無(wú)煙煤精煤、中煤和矸石三產(chǎn)品圖像分析奠定了理論基礎(chǔ),并為煤粒表面特征的量化指明了方向。
(2)通過(guò)圖像預(yù)處理后,有針對(duì)性地提取了8個(gè)顏色和光澤特征以及57個(gè)紋理特征;采用箱線圖對(duì)比分析不同密度級(jí)煤粒表面特征參數(shù)的變化趨勢(shì),結(jié)合相關(guān)性系數(shù)提出了特征參數(shù)篩選的策略。
(3)采用支持向量機(jī)(SVM)建立了煤粒密度級(jí)預(yù)測(cè)模型,利用不同閾值R條件下篩選出的有效特征參數(shù)對(duì)模型進(jìn)行訓(xùn)練和測(cè)試。綜合考慮三產(chǎn)品分類模型的實(shí)時(shí)性、穩(wěn)定性和準(zhǔn)確性,R為0.6時(shí)的特征參數(shù)集及其分類模型最佳,其訓(xùn)練集和測(cè)試集的分類準(zhǔn)確率分別為92.66%和88.50%,具備作為基于圖像分析的煤炭智能干選機(jī)在線分類方法的潛力。