摘要:煤矸石篩選是煤礦生產中一個重要的環(huán)節(jié),目前的人工撿矸法、機械濕選法以及射線分選法無法兼顧選矸過程中的高效性、清潔性和無害性。針對上述選矸過程中存在的問題,提出了一種基于卷積神經網絡的煤矸石識別方法,以顏色和紋理作為煤和矸石圖像的類別特征,結合遷移學習方法,構建了VGG-16深度學習模型。實驗結果表明,其識別準確率可以達到99.18%,可以有效地實現(xiàn)對煤和矸石的識別。
關鍵詞:煤矸石識別;卷積神經網絡;圖像分類;遷移學習
中圖分類號:TP391 文獻標識碼:A
文章編號:1009-3044(2020)21-0016-03
開放科學(資源服務)標識碼(OSID):
煤炭在我國能源中占有舉足輕重的地位,其能源量占化石能源儲量的94%,遠遠超過石油和天然氣;其消費約占總能源消費量的64%左右[1-2]。但是產出的原煤中會包含大量的矸石,矸石含量占原煤產量的15%-20%c3],如果不對矸石加以剔除,不僅會降低煤炭的燃燒率,而且其燃燒產物還會造成環(huán)境污染。因此,在煤炭使用之前實現(xiàn)對矸石的分揀成為一個必不可少的環(huán)節(jié)。目前,常用的矸石分揀技術包括人工撿矸法、機械濕選法和射線分選法[4-6]。人工選矸存在著勞動強度大、工作環(huán)境差、選矸效率低的問題;機械濕選法存在水資源浪費,其產生的污水容易對環(huán)境造成污染等問題;射線篩選法容易對工作者的身體造成危害。因此,尋找一種高效、清潔且對人體無害的選矸方法有重要意義。
近年來,隨著深度學習中的卷積神經網絡的迅速發(fā)展,其在計算機視覺領域已有廣泛應用。相較于傳統(tǒng)的計算機視覺技術,卷積神經網絡不需要對圖像做預處理、圖像分割和人工設計圖像特征等方面工作,不僅減少了圖像預處理的復雜度同時也降低了人為因素對特征提取的影響。目前已有不少學者將卷積神經網絡應用于圖像識別中。呂軍等設計了一種基于AlexNet卷積神經網絡模型,將其應用于茶葉嫩芽狀態(tài)識別[7];白林等通過采集6種不同類型的巖石薄片,結合VGG模型進行識別[8],均取得了較好的識別率。因此,本文通過搭建VGG-16模型[9],對采集的煤矸石圖像上進行識別,從而達到煤矸分選的效果。
1 相關理論分析
典型的卷積神經網絡一般由卷積層、池化層、扁平層和全連接層構成,具體結構如圖1所示。卷積層主要由卷積核組成,其作用就是提取圖像局部特征,常用的卷積核大小有3x3、SX5、7x7和11X1I。池化層一般設置于卷積層之后,常見的池化層一般有最大池化和平均池化兩種,具體池化過程如圖2所示。池化操作在降低特征圖維度減少了計算量的同時,可以保證特征圖的平移不變性和旋轉不變性。扁平層在所有卷積層和池化層之后,把經過卷積和池化之后的矩陣向量轉化成長向量,主要作用是從卷積層到全連接層的過渡。全連接層一般由三個全連接操作構成,最后一個采用softmax激活函數,來實現(xiàn)目標的分類。
1.1 VGG卷積神經網絡
VGG是目前較為經典的卷積神經網絡之一,其是在AlexNet[10]網絡的基礎上改進而來,在2014年的ILSVRC (Ima-geNet Large Scale Visual Recognition Challenge)取得分類項目第2名和定位項目第1名的成績。相較于AlexNet模型,VGG使用了更多的小卷積核代替了其原來的大卷積核,在加深了網絡的同時,保證了感受野不變,而且多個小的卷積核比一個大的卷積核有更少的參數。隨著卷積核的增多,其使用的激活函數的次數也相應增加,這使其學習能力進一步增強。VGG總共有6個不同結構的網絡模型,本文選用穩(wěn)定且性能較高的VGG-16作為煤矸石圖像識別實驗的模型。
VGG-16模型由13個卷積層、5個池化層和3個全連接層構成。其中13個卷積層被分為5組且每組的卷積層參數不盡相同,在每組卷積層后連接一個最大池化層。通過5組卷積層和池化層最終將224x224x3大小的圖像壓縮至7x7x512的特征矩陣。而后通過扁平層將壓縮后的多維特征矩陣轉化成一維向量。最后將生成的一維向量進行全連接操作,前兩層全連接含有4096個隱含節(jié)點,最后一層的全連接隱藏節(jié)點個數為要識別的圖像類別數C,并采用softmax激活函數完成分類。
1.2基于遷移學習的VGG-16模型
采集和標注樣本圖像是一件極其費時費力的事情,而且煤矸石圖像目前還沒有公開的數據集,故采用遷移學習可以解決樣本不足的問題。遷移學習是基于一個已經在大數據集上訓練過的模型,在其基礎上進行參數和知識的遷移。遷移學習不僅可以有效的解決樣本缺乏的問題,同時也降低了深度學習模型對硬件的需求以及模型的訓練時間。本文采用基于ImageN-et預訓練的VGG-16模型參數(不包含全連接層部分參數)進行初始化,并結合微調技術對模型進行調整使其可以更好地應用在煤矸石圖像的分類任務中。基于遷移學習的VGG-16模型的煤矸石特征提取過程如表1所示。
2 識別實驗與結果分析
2.1 樣本采集
本實驗使用佳能800D相機按照煤和矸石1:1的比例采集1300多張煤矸石圖像,剔除部分不合適圖像,使用1200多張進行實驗。按照通常80%/10%/10%的訓練集、測試集和驗證集比例對采集的圖像進行劃分。圖3為煤和矸石樣本圖像。
2.2 樣本預處理和樣本擴充
采集到的圖像樣本是三通道且長寬不盡相同。因此,首先需要對樣本進行預處理,將其縮放為224x224大小的圖像,并且對圖像矩陣進行歸一化處理,將樣本中像素值調整為0-1的浮點數。
在深度學習中通常會需要充足的樣本用于訓練。一般來說,樣本越是充足訓練的模型效果越好,其泛化能力也就越強。為了進一步擴充樣本,本實驗對采集的圖像數據集進行了數據增強,且增強后的數據并不會影響樣本的類別。常用的增強方法有水平和垂直翻轉、平移、縮放、旋轉等,本文使用Keras自帶的方法ImageDataGenerator對樣本進行增強,且按照通常做法只對訓練集樣本進行增強。增強參數如下:水平和垂直翻轉為True,水平和垂直方向上移動0.25個圖像長度和寬度,縮放比例為0.2,隨機旋轉角度為40度。圖4為對樣本進行增強后的效果。
2.3 模型超參數
模型的優(yōu)劣不單單取決于模型通過自身學習得到的權重和偏差參數,還取決于人為設定的超參數。卷積層和全連接層的激活函數設置為目前較為優(yōu)秀的Relu函數,分類層使用soft-max激活函數實現(xiàn)對煤和矸石圖像的分類,批尺寸為32。學習率初始化為0.001并且設置迭代學習率衰減系數decay為0.00001。對模型進行兩次實驗,一次采用遷移學習,另一次不采用進行對比實驗。
2.4 結果分析
通過繪制訓練過程的損失函數和準確率折線圖可以得知,隨著迭代次數的增加訓練集的準確率不斷提高,驗證集的準確率雖然在訓練的過程中不斷震蕩,但是最后趨于穩(wěn)定,未采用遷移學習模型準確率達到95.93%,采用遷移學習之后模型準確率可以達到99. 18%。分析圖5和圖6實驗結果,可以明顯看出采用遷移學習之后,模型可以實現(xiàn)快速收斂,且模型更加穩(wěn)定識別率更高。由于在訓練過程中對只對訓練集使用了數據增強,此時驗證集樣本相較于訓練集來說是簡單樣本,所以在模型訓練初期驗證集識別率會偶爾略高于訓練集。
3 結束語
本文針對煤矸石識別問題,提出了一種基于卷積神經網絡的方法,并采用遷移學習的策略實現(xiàn)了對煤矸石圖像的識別。對采集的圖像進行歸一化和擴充處理后,采用VGG-16模型進行訓練學習,未采用的模型準確率達到了95.93%,采用遷移學習策略之后的模型準確率可以達到99.18%,有效地實現(xiàn)了對煤和矸石圖像的識別。為進一步提高網絡模型的泛化能力和準確率,還需要做以下兩方面工作:1、采集更多實際生產狀態(tài)下的煤和矸石圖像,使樣本更具代表性;2、對VGG-16模型進行進一步的改進和優(yōu)化,為煤矸石分揀提供有效的理論基礎。
參考文獻:
[1]謝和平,王金華.煤炭革命新理念與煤炭科技發(fā)展構想[Jl.煤炭學報,2018,43(5):1187-1197.
[2]石煥,程宏志,劉萬超.我國選煤技術現(xiàn)狀及發(fā)展趨勢[J].煤炭科學技術,2016,44(06):169-174.
[3]張佳佳,姜浩,胡正偉.煤矸石井下分選研究[J].機電工程技術,2011,40(8):61-63,202.
[4]朱喜玲.選煤廠人工手選輸送機集控系統(tǒng)設計應用[J].煤礦機電,2019,40(2):82-84.
[5]張勇.選煤工藝現(xiàn)狀及發(fā)展趨勢淺析[J].科技經濟導刊,2018, 26(21):107.
[6]馮岸岸.智能分選過程中煤矸X射線識別技術的研究[D].淮南:安徽理工大學,2019.
[7]呂軍,夏華鹍,方夢瑞,等.基于AlexNet的茶葉嫩芽狀態(tài)智能識別研究[J].黑龍江八一農墾大學學報,2019,31(2):72-78.
[8白林,魏昕,劉禹等?;赩GG模型的巖石薄片圖像識別[J].地質通報,2019,38(12):2053-2058.
[9] Simonyan K, Zisserman A.Very Deep Convolutional Net-works for Large-Scale Image Recognition[J]. Computer ence,2014.
[10] Krizhevsky A,Sutskever I,Hinton G.ImageNet Classifi-cation with Deep Convolutional Neural Networks[Jl. Advancesin neural information processing systems, 2012, 25(2).
【通聯(lián)編輯:梁書】
作者簡介:孫立新(1993-),男,河北工程大學信息與電氣工程學院碩士研究生,研究方向為煤矸石圖像識別。