馮 瑤,儲茂祥,鄧 鑫,齊新雨
(遼寧科技大學 電子與信息工程學院,遼寧 鞍山 114051)
鋼板表面在生產(chǎn)過程中受設(shè)備、工藝、環(huán)境等因素影響,出現(xiàn)多種類型的缺陷[1],如麻點、劃傷等.為此,鋼鐵企業(yè)采用表面檢測系統(tǒng)[2]來監(jiān)控鋼板的表面缺陷.機器學習模型已用于數(shù)字圖像的處理[3]及工業(yè)產(chǎn)品的檢查、預(yù)測和識別[4-7].在鋼板表面檢測領(lǐng)域,支持向量機(support vector machine, 簡稱SVM)[5-7]的模型廣泛應(yīng)用于缺陷分類識別,取得了良好的效果.文獻[6]雖然在缺陷分類精度方面有一定的效果,但其分類是針對理想化的缺陷樣本集的,忽略了集合中存在的標簽和特征噪聲.文獻[7]通過引入權(quán)重抑制了遠離缺陷樣本區(qū)域的標簽噪聲,但忽略了靠近缺陷樣本區(qū)域的特征噪聲對分類結(jié)果的影響.在模式識別領(lǐng)域,提出了孿生超球體支持向量機(twin-hypersphere support vector machine, 簡稱THSVM)[8-9]分類模型,該模型具有分類速度快、精度高、無矩陣求逆、泛化性能好的優(yōu)點.
為解決鋼板表面缺陷的標簽和特征噪聲問題,筆者在THSVM的基礎(chǔ)上提出一種抗噪聲的超球體支持向量機(anti-noise hypersphere support vector machine, 簡稱AHSVM)分類模型.為提高鋼板表面缺陷的分類效果,提出AHSVM與鯨魚優(yōu)化算法(whale optimization algorithm, 簡稱WOA)[10]結(jié)合的AHSVM-WOA算法.
使得
(1)
AHSVM分類模型具有如下屬性:
(1) THSVM是一個2分類模型,需要結(jié)合多分類技術(shù)實現(xiàn)分類. AHSVM分類模型針對N種類型的缺陷構(gòu)造了N個超球體,其自身就是一個多分類模型.
(2) THSVM通過少量邊界缺陷樣本構(gòu)造超球體,特征噪聲主要分布在缺陷樣本集合區(qū)域附近,很容易成為邊界缺陷樣本,從而影響THSVM,而AHSVM構(gòu)造的超球體改變了THSVM僅依賴少量邊界缺陷樣本的策略.對于AHSVM,約束條件第1項使超球體外部的缺陷樣本被用,約束條件第2項使超球體內(nèi)部的缺陷樣本被用,這意味著AHSVM構(gòu)造的超球體使用了所有的缺陷樣本,特征噪聲對依賴所有缺陷樣本的AHSVM難以產(chǎn)生影響.
(2)
為了求解式(1),引入拉格朗日函數(shù)
(3)
根據(jù)庫恩-塔克(Karush-Kuhn-Tucker, 簡稱KKT)條件,可得
(4)
使得
(5)
(6)
根據(jù)優(yōu)化結(jié)果,得到超球體的參數(shù)為
(7)
其中:|Ωn|為邊界上缺陷樣本的數(shù)量.
給定一個缺陷樣本x,其決策函數(shù)可表示為
(8)
AHSVM分類模型中的ν1,ν2,σ2通常采用網(wǎng)格搜索法進行選擇,但網(wǎng)格搜索法速度慢,運行時間長.文獻[11]將粒子群優(yōu)化算法與SVM結(jié)合選擇參數(shù),加快了搜索速度,但粒子群優(yōu)化算法易陷入局部最優(yōu).為了解決此問題,筆者將AHSVM與WOA結(jié)合優(yōu)化參數(shù),可有效避免局部最優(yōu),且搜索速度更快.
WOA是文獻[10]提出的模仿座頭鯨捕食行為的一種新型優(yōu)化算法.在捕食過程中,座頭鯨通過收縮包圍及螺旋機制,不斷更新自身位置,實現(xiàn)快速捕食.座頭鯨捕食機制的數(shù)學模型為:
當p<0.5,|A|<1時,有
(9)
當p<0.5,|A|≥1時,有
(10)
當p≥0.5時,有
(11)
其中:p為[0,1]中的隨機數(shù),p<0.5對應(yīng)收縮包圍機制,p≥0.5對應(yīng)螺旋機制;A=2as1-a,B=2s2,a=2-2t/Tmax,t為當前迭代次數(shù),Tmax為最大迭代次數(shù),s1和s2為(0,1)中的隨機數(shù);當A<1時,鯨魚對目標發(fā)起攻擊;當A≥1時,隨機選擇一頭鯨魚位置作為最優(yōu)解來更新其他鯨魚的位置;D為收縮包圍機制下鯨魚與目標間的距離;Y(t)為鯨魚的當前位置,Y*(t)為鯨魚當前的最好位置,Y(t)rand為隨機選擇的鯨魚位置;Dp表示螺旋機制下鯨魚與目標間的距離;l為(-1,1)中的隨機數(shù);b=1.
分類精度通過適應(yīng)度描述,適應(yīng)度的表達式為
(12)
AHSVM-WOA算法的步驟如下:
(1) 參數(shù)初始化,ν1∈[1,100],ν2∈[0,1],σ2∈[1,150],種群維度d=3,最大迭代次數(shù)Tmax=10,種群規(guī)模設(shè)為20,鯨魚的初始位置隨機產(chǎn)生;
(2) 將初始位置代入AHSVM分類模型,通過訓(xùn)練和測試得到適應(yīng)度;
(3) 隨機選擇p,r1,r2,根據(jù)位置更新策略,對種群位置進行更新;
(4) 位置更新后,重新計算適應(yīng)度,并與上次適應(yīng)度進行比較,如果當前更優(yōu),則保留當前適應(yīng)度;
(5) 如果達到最大迭代次數(shù),則輸出當前最優(yōu)適應(yīng)度,否則,返回(3)繼續(xù)迭代,直到滿足最大迭代次數(shù).
為了驗證AHSVM-WOA算法的抗噪性能,該文采用文獻[12]中的熱軋鋼表面缺陷數(shù)據(jù)庫進行實驗.該數(shù)據(jù)庫有6類的缺陷圖像,它們?yōu)椋毫鸭y、夾雜、斑塊、麻點、氧化鐵皮、劃傷,如圖1所示.
圖1 熱軋鋼板的6類表面缺陷圖像
通過缺陷分割提取和特征描述,共獲缺陷樣本3 718個,裂紋、夾雜、斑塊、麻點、氧化鐵皮、劃傷缺陷樣本數(shù)分別為 672,699,726,473,611,537.特征類型有: 3種幾何特征、7種不變矩特征、9種灰度特征、16種紋理特征[13],每個缺陷樣本均為1個35維的向量.缺陷樣本被劃分為訓(xùn)練集和測試集,用于分類的訓(xùn)練和測試. 從分類精度角度,比較AHSVM-WOA、SVM、TSVM、THSVM算法的抗噪性能.針對原始缺陷樣本集,4種算法的分類精度如表1所示.
表1 4種算法對原始缺陷樣本集的分類精度 %
從表1可知:對斑塊、麻點和氧化鐵皮缺陷,AHSVM-WOA分類精度均達到了100%,SVM,TSVM,THSVM分類精度均小于100%;對于裂紋和夾雜缺陷類型,AHSVM-WOA分類精度分別達到了98.52%和97.14%,僅次于TSVM;對于劃傷缺陷類型,AHSVM-WOA分類精度達到了93.46%,僅次于THSVM.
表2展示了分別加入5%標簽噪聲后缺陷樣本集的分類精度與表1對應(yīng)分類精度的差.
表2 4種算法對有標簽噪聲的缺陷樣本集的分類精度差 %
從表2可知:對裂紋、夾雜和斑塊缺陷,AHSVM-WOA分類精度分別降低了0.01%,1.43%,2.74%,相對于SVM,TSVM,THSVM,AHSVM-WOA分類精度降低最少;對氧化鐵皮缺陷,AHSVM-WOA分類精度降低了8.42%,而SVM,TSVM,THSVM分別降低了5.64%,7.81%,4.68%;對劃傷缺陷,AHSVM-WOA的分類精度無變化,而SVM,TSVM,THSVM分別降低了1.44%,2.325%,5.09%.
表3展示了分別加入5%特征噪聲后缺陷樣本集的分類精度與表1對應(yīng)分類精度的差.
表3 4種算法對有特征噪聲的缺陷樣本集的分類精度差 %
從表3可知:對裂紋、斑塊和氧化鐵皮缺陷,AHSVM-WOA分類精度分別降低了2.71%,2.45%,2.92%,相對于SVM,TSVM,THSVM,AHSVM-WOA分類精度降低最少;對夾雜缺陷,AHSVM-WOA分類精度無變化,而SVM,TSVM,THSVM分別降低了4.69%,8.90%,3.13%;對劃傷缺陷,AHSVM-WOA分類精度降低了0.26%,而SVM,TSVM,THSVM分別降低了2.05%,0.24%,0.74%,僅次于TSVM.
表4為混合加入4%標簽和4%特征噪聲后缺陷樣本集的分類精度與表1中分類精度的差.
表4 4種算法對有標簽和特征噪聲的缺陷樣本集的分類精度差 %
由表4可看出:對氧化鐵皮缺陷,受噪聲影響最小的還是AHSVM-WOA,分類精度只降低了4.92%,而SVM,TSVM,THSVM分別降低了6.91%,12.61%,13.92%;對裂紋、夾雜和斑塊缺陷,AHSVM-WOA受噪聲影響最??;對麻點缺陷,AHSVM-WOA受噪聲影響不是最小但也不是最大,僅次于TSVM.
圖2展示了SVM,TSVM,THSVM,AHSVM-WOA的總分類精度.由圖2可以看出,與其他算法相比,AHSVM-WOA的分類效果最優(yōu)且波動最小.
圖2 4種算法對有不同噪聲的缺陷樣本集的總分類精度
圖3展示了AHSVM結(jié)合網(wǎng)格搜索、粒子群優(yōu)化及鯨魚優(yōu)化選擇參數(shù)時的分類精度、迭代次數(shù)和運行時間.由圖3可看出:在分類精度上,鯨魚優(yōu)化與網(wǎng)格搜索幾乎相同,粒子群優(yōu)化效果最差;在迭代次數(shù)上,鯨魚優(yōu)化最少;在運行時間上,網(wǎng)格搜索是鯨魚優(yōu)化的4.8倍,粒子群優(yōu)化是鯨魚優(yōu)化的2.2倍.
圖3 AHSVM結(jié)合網(wǎng)格搜索、粒子群優(yōu)化及鯨魚優(yōu)化選擇參數(shù)時的分類精度、迭代次數(shù)及運行時間
綜上,與SVM、TSVM和THSVM相比較,AHSVM-WOA分類算法具有好的分類效果,且有良好的抗噪聲能力.同時,AHSVM-WOA算法選擇參數(shù)縮短了運行時間,提高了效率.
筆者提出的AHSVM分類模型通過引入核密度估計信息,能抑制標簽噪聲.同時,AHSVM改變了依靠少量邊界缺陷樣本的策略,利用所有樣本生成超球體,能抑制特征噪聲.將AHSVM與WOA結(jié)合,避免了陷入局部最優(yōu),提高了計算效率.將AHSVM-WOA算法應(yīng)用于6類鋼板表面缺陷分類,獲得了較好的分類結(jié)果,說明該算法具有有效性.后續(xù)研究應(yīng)考慮對缺陷樣本進行稀疏處理,節(jié)省存儲空間,進一步提高運行效率,實現(xiàn)更好的分類效果.