阮志國(guó),周 敏,文喆皓,高 強(qiáng)
(1.武漢科技大學(xué) 冶金裝備及其控制教育部重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430081;2.武漢科技大學(xué) 機(jī)械傳動(dòng)與制造工程湖北省重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430081)
燒結(jié)機(jī)是冶金燒結(jié)工作中重要的供用設(shè)備之一,其燒結(jié)工作是一個(gè)非線性、強(qiáng)耦合性的過程,機(jī)尾斷面的燒結(jié)狀態(tài)難以建立完整準(zhǔn)確的模型[1,2]。燒結(jié)機(jī)機(jī)尾斷面是反映燒結(jié)終點(diǎn)與燒結(jié)過程動(dòng)態(tài)信息最直觀有效的方式,其狀態(tài)的實(shí)時(shí)監(jiān)測(cè)和在線識(shí)別對(duì)提高燒結(jié)質(zhì)量、工藝參數(shù)調(diào)優(yōu)等起著重要作用。宋寶宇等人[3]應(yīng)用電荷耦合器件(charge coupled device,CCD)攝像機(jī)采集燒結(jié)機(jī)尾斷面圖像,經(jīng)特征提取后使用反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)對(duì)圖像分類識(shí)別,在一定程度上改善了燒結(jié)生產(chǎn)方法。劉征建等人[4]利用一種新的特征斷面圖像采集算法,在判斷區(qū)域設(shè)定邊界閾值,提高了不同燒結(jié)條件下截面采集圖像的準(zhǔn)確率,但此種方法耗時(shí)較長(zhǎng),實(shí)時(shí)監(jiān)測(cè)效果差。Chen Z K等人[5]提出一種識(shí)別燒結(jié)礦尾部的火焰圖像特征來確定燒結(jié)斷面狀態(tài)的方法,使用基于粒子對(duì)優(yōu)化器的模糊C均值(fuzzy C-means,FCM)聚類對(duì)圖像分割,取得較好效果,但對(duì)燒結(jié)狀態(tài)判斷需要大量數(shù)據(jù)。Wang F等人[6]提出了一種自適應(yīng)模糊增強(qiáng)的方法,對(duì)燒結(jié)斷面在火焰圖像增強(qiáng)、亮度特征、幾何特征方面進(jìn)行分析,得到各特征之間的相關(guān)性關(guān)系,該方法可有效判別燒結(jié)終點(diǎn)狀態(tài),但對(duì)圖像質(zhì)量要求較高。
在結(jié)合前人研究的基礎(chǔ)上,提出了一種基于深度學(xué)習(xí)的機(jī)尾斷面識(shí)別分類方法。首先,在圖像預(yù)處理環(huán)節(jié)增加YCbCr色彩轉(zhuǎn)換模型,有效減弱光暈影響;接著,使用粒子群優(yōu)化(particle swarm optimization,PSO)算法優(yōu)化Canny算子,提高斷面圖像邊緣檢測(cè)連續(xù)性;最后,建立LetNet—5卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行識(shí)別分類。
通過工業(yè)面陣相機(jī)獲取燒結(jié)斷面圖像,根據(jù)武漢某企業(yè)燒結(jié)機(jī)機(jī)尾燒結(jié)斷面監(jiān)測(cè)數(shù)據(jù)并結(jié)合專家經(jīng)驗(yàn)判斷,燒結(jié)斷面可分為以下3種狀態(tài):燒結(jié)均勻、欠燒、過燒。分別如圖1(a)~(c)所示。
圖1 3種燒結(jié)狀態(tài)
工業(yè)相機(jī)在采集燒結(jié)斷面圖像時(shí),會(huì)受到灰塵、振動(dòng)和光線等外界因素的影響,導(dǎo)致紅火層區(qū)域和背景區(qū)域之間的邊界模糊且不連續(xù),圖像附帶噪聲并出現(xiàn)光暈[7]。相機(jī)采集到的圖像屬于由 R(紅色)、G(綠色)、B(藍(lán)色)3種色彩分量組成的RGB彩色圖像,RGB顏色空間受亮度影響大,其中一種分量變化會(huì)同時(shí)影響另外兩種分量,適用于系統(tǒng)顯示,對(duì)圖像處理效果差。當(dāng)實(shí)物亮度相差比較大或者受光線因素影響區(qū)域模糊時(shí),工業(yè)相機(jī)難以獲取到理想的圖像,且光暈的出現(xiàn)會(huì)導(dǎo)致紅火層區(qū)域面積擴(kuò)增,后續(xù)的識(shí)別分類不準(zhǔn)確,所以,必須先對(duì)斷面圖像預(yù)處理。一般的圖像平滑處理對(duì)消除光暈現(xiàn)象效果不明顯,對(duì)RGB圖像而言,轉(zhuǎn)換色彩空間可以濾除圖像中不必要顏色分量,提取有效分量,保留高頻信號(hào)的邊緣信息。YCbCr顏色空間亮度通道穩(wěn)定,對(duì)抑制噪音,增加圖像細(xì)節(jié)有較好的效果[8]。圖像RGB顏色空間轉(zhuǎn)換到Y(jié)CbCr顏色空間公式如下
(1)
式中Y為亮度分量,Cb為藍(lán)色色度分量,Cr為紅色色度分量。由RGB顏色空間轉(zhuǎn)換到Y(jié)CbCr顏色空間效果如圖2(a)所示,斷面灰度化實(shí)現(xiàn)需提取Y分量,效果如圖2(b)所示。
圖2 RGB到Y(jié)CbCr轉(zhuǎn)換
由圖2(b)看出,燒結(jié)斷面圖像光暈得到部分消除,為保證后續(xù)識(shí)別分類工作的有效進(jìn)行,使用中值濾波算法對(duì)轉(zhuǎn)換后的圖像進(jìn)一步處理。中值濾波是一種非線性濾波算法,核心理論為排序統(tǒng)計(jì),對(duì)抑制噪聲、保留圖像邊緣細(xì)節(jié)效果好[9]。中值濾波定義如下
H(x,y)=Median(G(x,y)),(x,y)∈A
(2)
式中G(x,y),H(x,y)分別為輸入圖像和輸出圖像的灰度值,A為大小為m×n的選取窗口,Median為像素總值的平均函數(shù)。選取m=n=3時(shí)的中值濾波效果如圖3所示,可以看出,通過YCbCr顏色空間轉(zhuǎn)換并進(jìn)行中值濾波過濾后,燒結(jié)斷面圖像光暈得到有效減弱,圖像細(xì)節(jié)更加清晰。
圖3 中值濾波處理
邊緣檢測(cè)是圖像識(shí)別的重要步驟,從邊緣中能夠得到有關(guān)圖像細(xì)節(jié)的許多基本信息,是圖像深度學(xué)習(xí)領(lǐng)域的重要環(huán)節(jié)[10]。Canny邊緣檢測(cè)算子充分利用了圖像梯度幅值和梯度方向的極大值來確定邊緣,并引入滯后閾值方法尋找合適閾值,邊緣點(diǎn)能夠很好地被定位并且接近真實(shí)邊緣。在Canny算子中,如果邊緣像素小于低閾值則被丟棄,邊緣像素大于高閾值則保留真實(shí)邊緣,這種檢測(cè)方法在抑制噪聲方面更好,更容易檢測(cè)到圖像中的強(qiáng)弱邊緣[11]。Canny算子檢測(cè)到的邊緣如圖4所示。
圖4 Canny算子邊緣檢測(cè)結(jié)果
圖4所示Canny算子檢測(cè)出一些錯(cuò)誤邊緣,邊緣較為雜亂且連續(xù)性差。這是因?yàn)镃anny算子在運(yùn)算處理時(shí),需要保留的邊緣細(xì)節(jié)較多,閾值的設(shè)定和檢測(cè)結(jié)果受到圖像及其應(yīng)用情況影響。粒子群算法是一種全局智能尋優(yōu)算法,通過搜尋粒子解空間和粒子間相互作用找到全局最優(yōu)解[12]。使用PSO算法選擇Canny算子最佳閾值,實(shí)現(xiàn)非線性復(fù)雜閾值的自適應(yīng)確定。
PSO算法優(yōu)化Canny算子步驟如下:
1)輸入圖像數(shù)據(jù)集。
2)高斯濾波:是一種線性低通濾波器,允許某一頻率以下的信號(hào)分量通過,而抑制該頻率以上的信號(hào)分量,平滑效果柔和,邊緣保留較好。Canny算子先設(shè)計(jì)一個(gè)濾波器并同時(shí)計(jì)算合適的掩模,然后將原始圖像與掩模卷積在一起。用σ表示標(biāo)準(zhǔn)差,則高斯濾波函數(shù)可表示為
(3)
3)確定圖像梯度:通過確定梯度來識(shí)別圖像的變化強(qiáng)度進(jìn)而查找邊緣。梯度幅值、方向定義如下式
(4)
θ(i,j)=arctan[py(i,j)/px(i,j)]
(5)
式中px(i,j)和py(i,j)分別為一階x方向和y方向上的偏導(dǎo)數(shù)。
4)非極大值抑制:梯度圖像具有模糊邊緣,通過保留所有局部極大值并消除圖像中的其他像素,將其轉(zhuǎn)換為強(qiáng)邊緣。
5)雙閾值確定和邊緣連接:此時(shí)的圖像仍可能包含噪聲或不相關(guān)的值,Canny算子使用雙閾值進(jìn)一步抑制噪聲并保留真實(shí)圖像。假定邊緣像素為T、高閾值為H、低閾值為L(zhǎng);若T>H,則T被定義為強(qiáng)像素;若T Step1 斷面圖像灰度化并識(shí)別圖像直方圖,像素值概率表示公式為 (6) 式中Pb,Pt分別為背景像素和對(duì)象像素的先驗(yàn)概率;μb,μt為均值;σb,σt為分布標(biāo)準(zhǔn)差。若用Rb為背景像素概率分布,Rt為對(duì)象像素概率分布,則背景像素誤分類為對(duì)象像素概率可用式(7)表示,對(duì)象像素誤分類背景像素概率可用式(8)表示 (7) (8) Step2 若圖像灰度等級(jí)為G,則閾值選擇如式(9)所示 T=min(Eb(T)+Et(T)),T∈[0,1,…,G-1] (9) Step3 設(shè)定迭代次數(shù)并初始化PSO算法中粒子位置Xi和速度Vi; Step4 粒子適應(yīng)度評(píng)估; Step5 以適應(yīng)度最小值作為每次迭代時(shí)粒子個(gè)體極值Pi,并找出全局極值Pg; Step6 由下式更新粒子速度和位置 (10) 6)使用滯后閾值對(duì)圖像進(jìn)行邊緣跟蹤,去除虛假邊緣并將有效邊緣進(jìn)行連接,獲得最終分割圖像。 PSO算法優(yōu)化Canny算子后的檢測(cè)結(jié)果如圖5所示,對(duì)比圖4可以看出,引入PSO尋優(yōu)的閾值,Canny算子濾除了一些雜亂線條,邊緣輪廓清晰且連續(xù),細(xì)節(jié)更好。 圖5 PSO算法優(yōu)化Canny算子邊緣檢測(cè)結(jié)果 此時(shí)機(jī)尾斷面燒結(jié)圖像輪廓已經(jīng)被較好地分割出來,建立的圖像庫可用深度學(xué)習(xí)的方法進(jìn)行分類。卷積神經(jīng)網(wǎng)絡(luò)以其在圖像識(shí)別中的高性能得到許多學(xué)者青睞,是深度學(xué)習(xí)中常用的方法之一,該方法中圖像本身直接用于學(xué)習(xí)過程中,重要特征自動(dòng)學(xué)習(xí)并提取,能夠提取淺層特征和深層復(fù)雜的高階特征[13,14]。 本文數(shù)據(jù)來自于武漢某企業(yè)燒結(jié)機(jī)斷面燒結(jié)圖像庫。燒結(jié)機(jī)機(jī)尾安裝振動(dòng)傳感器在收集到振動(dòng)信號(hào)后觸發(fā)工業(yè)相機(jī)進(jìn)行連續(xù)拍照,所有的圖片通過數(shù)據(jù)采集卡上傳計(jì)算機(jī)圖像庫。由于本文數(shù)據(jù)集中圖片數(shù)量不大,若采用太過復(fù)雜的網(wǎng)絡(luò)模型容易出現(xiàn)過擬合現(xiàn)象,LeNet—5模型能很好適應(yīng)該情況。基于LeNet—5燒結(jié)圖像分類模型結(jié)構(gòu)如圖6所示。其中,輸入層圖像尺寸統(tǒng)一歸一化為64×64。輸出層設(shè)為全連接層,包含3個(gè)神經(jīng)元節(jié)點(diǎn)對(duì)應(yīng)燒結(jié)狀態(tài)3種類別,激活函數(shù)為SoftMax。 圖6 基于LeNet—5燒結(jié)圖像分類模型結(jié)構(gòu) 本文卷積神經(jīng)網(wǎng)絡(luò)模型主要在Keras框架[15]下實(shí)現(xiàn),使用Python3.6編寫。實(shí)驗(yàn)在Windows10 64位平臺(tái)中運(yùn)行,CPU型號(hào)為i5—10300H,內(nèi)存為8 G,GPU型號(hào)為GTX 1650Ti。具體實(shí)驗(yàn)步驟如下: 1)數(shù)據(jù)預(yù)處理:將分割提取后的斷面圖像進(jìn)行劃分,即作為訓(xùn)練集的樣本圖像每類360張,共計(jì)1 080張,驗(yàn)證集樣本圖像每類120張,共計(jì)360張,測(cè)試集樣本圖像每類60張,共計(jì)180張;2)參數(shù)設(shè)置:設(shè)置訓(xùn)練的輪數(shù)為50,初始學(xué)習(xí)率0.001,批量的大小設(shè)置為32。梯度下降優(yōu)化器選擇Adam[16],設(shè)置所有的圖像尺寸統(tǒng)一為64×64;3)確定損失函數(shù)和評(píng)價(jià)指標(biāo):圖像分類識(shí)別屬于多分類任務(wù),由于圖像樣本數(shù)量均衡,可采用準(zhǔn)確率作為網(wǎng)絡(luò)模型的評(píng)價(jià)指標(biāo)。模型采用交叉熵?fù)p失函數(shù),計(jì)算公式為 (11) 式中p為模型的預(yù)測(cè)值,t為真實(shí)值,i為對(duì)應(yīng)的數(shù)據(jù)點(diǎn),j為對(duì)應(yīng)的類別;4)訓(xùn)練網(wǎng)絡(luò):將劃分好的樣本輸入給構(gòu)建的LeNet—5模型進(jìn)行訓(xùn)練,模型訓(xùn)練結(jié)果如圖7所示。 圖7 模型訓(xùn)練結(jié)果 實(shí)驗(yàn)結(jié)果得出,該模型測(cè)試準(zhǔn)確率達(dá)到92.7 %,具有良好的分類效果。將該模型與BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行比較。設(shè)定BP神經(jīng)網(wǎng)絡(luò)輸入節(jié)點(diǎn)數(shù)為3,隱含層節(jié)點(diǎn)數(shù)為10,輸出節(jié)點(diǎn)數(shù)為3,1 080個(gè)訓(xùn)練樣本,最終分類結(jié)果比較如表1所示。可以看出,基于LeNet—5模型的燒結(jié)圖像分類識(shí)別效果優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型。 表1 BP神經(jīng)網(wǎng)絡(luò)、LeNet—5模型分類結(jié)果比較 由于傳統(tǒng)燒結(jié)斷面識(shí)別工況復(fù)雜,難以建立準(zhǔn)確有效的分類識(shí)別模型,且人工控制效率低、成本高。基于此提出一種基于深度學(xué)習(xí)的燒結(jié)斷面識(shí)別分類方法,預(yù)處理環(huán)節(jié)利用YCbCr色彩轉(zhuǎn)換結(jié)合中值濾波的方法減弱光暈現(xiàn)象,增強(qiáng)圖像質(zhì)量;針對(duì)Canny算子閾值難以設(shè)定問題,采用PSO算法優(yōu)化Canny算子閾值參數(shù),提高了邊緣提取精度;最后建立基于LeNet—5卷積神經(jīng)網(wǎng)絡(luò)的燒結(jié)斷面分類模型,分類精度達(dá)到92.7 %。對(duì)比BP神經(jīng)網(wǎng)絡(luò)模型,LeNet—5模型分類精度更好。在未來工作中,將進(jìn)一步考慮復(fù)雜環(huán)境下的燒結(jié)狀態(tài)的分類識(shí)別,實(shí)現(xiàn)多參數(shù)下的工藝自動(dòng)調(diào)優(yōu)。4 模型訓(xùn)練
4.1 基于LeNet—5模型的斷面圖像分類
4.2 實(shí)驗(yàn)與結(jié)果分析
5 結(jié)束語