孔玲爽,閔悅,何靜,劉建華,張昌凡,黃聰聰
基于脈沖神經(jīng)網(wǎng)絡的鋼材表面缺陷識別研究
孔玲爽1,閔悅2,何靜1,劉建華2,張昌凡2,黃聰聰2
(1.湖南工業(yè)大學 電氣與信息工程學院,湖南 株洲 412007; 2.湖南工業(yè)大學 軌道交通學院,湖南 株洲 412007)
針對現(xiàn)有鋼材缺陷識別算法特征圖利用不充分、識別準確率低、參數(shù)量大等問題,基于脈沖神經(jīng)網(wǎng)絡,提出一種用于鋼材缺陷識別的稠密卷積脈沖神經(jīng)網(wǎng)絡(DCSNN)模型,減少系統(tǒng)消耗和內(nèi)存占用。首先,采用卷積編碼,對輸入圖片進行特征提取和編碼。其次,采用稠密連接算法搭建稠密卷積脈沖神經(jīng)網(wǎng)絡,實現(xiàn)特征重復利用,抑制梯度消失,并通過替代梯度下降算法進行網(wǎng)絡訓練。最后,在帶鋼數(shù)據(jù)集上進行測試,實現(xiàn)帶鋼缺陷識別。實驗結果顯示,DCSNN在測試集上的準確率為98.61%,參數(shù)量為0.5萬,在鋼材表面缺陷識別問題上表現(xiàn)出良好效果。
脈沖神經(jīng)網(wǎng)絡;稠密連接;鋼材表面;缺陷識別;替代梯度下降
金屬材料廣泛應用于工業(yè)產(chǎn)品包裝、運輸包裝和銷售包裝。鋼材由于來源較豐富、價格較低廉,具有良好的可塑性和延展性,用量在金屬包裝材料中占首位。鋼材在生產(chǎn)過程中,由于板坯原有缺陷以及生產(chǎn)工藝的問題,存在劃痕、裂紋、斑塊、麻點、磨花、夾雜等各種各樣的缺陷[1]。這些缺陷不僅影響鋼材外觀質(zhì)量,也非常不利于后續(xù)包裝使用。因此對鋼材缺陷識別的研究是非常有必要的。
針對帶鋼缺陷識別的研究為時已久,傳統(tǒng)的人工檢測分類方法效率低且多遺漏[2]。普通機器學習方法手工提取低層特征,特征提取時間長、勞動強度高、無法滿足實時檢測要求。近年來,深度學習發(fā)展迅速,圖像融合技術[3]、卷積神經(jīng)網(wǎng)絡廣泛應用于工業(yè)缺陷分類[4-6]。然而在實際應用中,缺陷種類多,樣本少,相似因素大,因此,針對小樣本不平衡問題,通過改進卷積神經(jīng)網(wǎng)絡[7-8],引入注意力機制、多尺度最大池化模塊,增強提取的特征圖的特征,使網(wǎng)絡集中于最終檢測結果的有效區(qū)域,從而提升網(wǎng)絡性能。隨著卷積神經(jīng)網(wǎng)絡層數(shù)加深,特征減弱,常出現(xiàn)梯度消失、梯度爆炸等問題,造成網(wǎng)絡難以訓練,DenseNet模型[9]的提出有效抑制了這一問題,稠密連接機制也逐步運用在工業(yè)缺陷檢測分類中[10],通過對低層特征的重復利用,有效抑制了梯度消失,但網(wǎng)絡結構復雜,網(wǎng)絡層數(shù)深,內(nèi)存占用多、系統(tǒng)消耗大。
脈沖神經(jīng)網(wǎng)絡(SNN)是第三代人工神經(jīng)網(wǎng)絡,是一個更強大、更具有生物可解釋性的神經(jīng)網(wǎng)絡[11]。脈沖神經(jīng)網(wǎng)絡與人工神經(jīng)網(wǎng)絡的交叉融合被認為是發(fā)展人工通用智能的有力途徑[12]。脈沖神經(jīng)網(wǎng)絡基本神經(jīng)元為脈沖神經(jīng)元,具有稀疏性,可實現(xiàn)對輸入圖像的稀疏表征[13]。由于使用離散的脈沖信號傳遞信息,避免卷積神經(jīng)網(wǎng)絡(CNN)高昂的計算代價,具有低功耗特性。脈沖神經(jīng)元由于其不可微分性導致難以進行反向傳播,替代梯度下降算法[14]通過在反向傳播時對脈沖函數(shù)進行合適替代,達到訓練網(wǎng)絡的目的。當前的SNN多為淺層網(wǎng)絡結構,在mnist、Fashion_mnist等數(shù)據(jù)集上取得較好分類效果[15-16],針對復雜工業(yè)背景的缺陷識別具有局限性,存在對特征圖利用不充分,網(wǎng)絡深度增加時易產(chǎn)生梯度消失、梯度爆炸,網(wǎng)絡難以訓練或精度不高等問題。
通過以上分析,基于脈沖神經(jīng)網(wǎng)絡,結合稠密連接思想,提出一種參數(shù)量更少,空間復雜度更低的稠密卷積脈沖神經(jīng)網(wǎng)絡模型(DCSNN)。
實驗發(fā)現(xiàn),傳統(tǒng)卷積脈沖神經(jīng)網(wǎng)絡可以對帶鋼缺陷進行分類,然而精度較低,加深網(wǎng)絡深度和寬度精度提升較小且參數(shù)量增大,同時更容易產(chǎn)生梯度消失的問題。為了解決這一問題即在加深網(wǎng)絡深度的同時抑制梯度消失,減小網(wǎng)絡參數(shù)量,基于傳統(tǒng)脈沖神經(jīng)網(wǎng)絡,提出稠密卷積脈沖神經(jīng)網(wǎng)絡模型。稠密卷積脈沖神經(jīng)網(wǎng)絡帶鋼缺陷識別算法整體框架見圖1。
在每個時間步長內(nèi),將輸入圖像送入稠密卷積脈沖神經(jīng)網(wǎng)絡模型,首先,通過自適應編碼(Adaptive coding),提取輸入特征并轉為脈沖序列,用于后續(xù)脈沖神經(jīng)網(wǎng)絡處理。其次,學習層采用密集連接思想構建脈沖稠密塊(Spike-Denseblock),輸入通過脈沖稠密塊,輸出若干特征圖,在通過脈沖轉換塊(Spike- Transitionblock)1×1卷積降低輸出通道,減小參數(shù)量和計算量,經(jīng)過全局平均池化送入帶有dropout的全連接層進行決策(Classification Layer),決策層LIF脈沖神經(jīng)元發(fā)射脈沖并計數(shù)。在時間窗口T后,取FC層脈沖神經(jīng)元最大脈沖發(fā)射頻率的神經(jīng)元對應標簽為分類結果,并返回神經(jīng)元脈沖發(fā)放頻率,與one-hot編碼標簽求平方和誤差損失函數(shù),采用可微分函數(shù)近似脈沖發(fā)放函數(shù)進行反向傳播。網(wǎng)絡結構參數(shù)見表1。
圖1 稠密卷積脈沖神經(jīng)網(wǎng)絡帶鋼缺陷識別算法整體框架
脈沖稠密塊由5層脈沖稠密層(Spike? Denselayer)組成,每層稠密層包括正則化—突觸—1×1卷積—正則化—突觸—3×3卷積。其中,1×1卷積作用為降低輸出維度,減小參數(shù)量。多次使用批量標準化,對每層的輸出規(guī)范其均值和方差,防止梯度消失、梯度爆炸等問題,進而實現(xiàn)脈沖神經(jīng)網(wǎng)絡的深層訓練。輸入經(jīng)過Spike?Denselayer后輸出,在通過 concat操作將Spike?Denselayer的輸入和輸出進行通道上的拼接作為下一層Spike?Denselayer的輸入,從而實現(xiàn)對特征的重復利用,抑制梯度消失。
IF神經(jīng)元模型可看作一個理想的積分器,膜電位電壓不會隨時間產(chǎn)生泄露,如式(1)所示,用差分方程近似替代膜電位電壓函數(shù)得時刻的膜電位電壓如式(2)所示,其中,V為時刻膜電位電壓,U為當前時刻輸入產(chǎn)生的膜電位電壓,threshold為閾值電壓,當膜電位電壓達到閾值電壓時發(fā)射脈沖,反之則不發(fā)放脈沖,如式(3)所示,()為階躍函數(shù),如式(4)所示,因此,突觸層采用IF神經(jīng)元。
設輸入為0,則首層稠密層輸出1,見式(5)。其中,代表正則化—突觸—1×1卷積—正則化—突觸—3×3卷積操作。第2層脈沖稠密層的輸入為0和1的拼接,輸出2見式(6)。
最后一層脈沖稠密層的輸入則為前面所有層的輸出特征圖和0的拼接,輸出5見式(7),其中,3和4分別為第4層和第5層的輸出。
為減小模型計算量和參數(shù)量,添加脈沖轉換塊(Spike?Transitionblock),Spike?Transitionblock由正則化—IF神經(jīng)元—1×1卷積組成,通過1×1卷積,在不改變特征圖尺寸的前提下,降低輸出通道,減少輸出特征圖,從而減小參數(shù)量。
表1 稠密卷積脈沖神經(jīng)網(wǎng)絡結構參數(shù)
Tab.1 Parameters of dense convolutional spiking neural network structure
輸入經(jīng)過Spike–DenseBlock等卷積池化操作后,得到若干特征圖,傳統(tǒng)脈沖神經(jīng)網(wǎng)絡采用多層全連接層實現(xiàn)分類,網(wǎng)絡參數(shù)量大,因此在全連接層設計中,采用全局平均池化代替首層全連接層,對每一個通道的特征圖所有像素值求平均值,降低全連接層輸入維度,極大減小網(wǎng)絡參數(shù)量,見圖2。同時加入大量的Dropout結構,將全連接層的50%的節(jié)點輸出隨機置0,防止網(wǎng)絡過擬合,見圖3。
圖2 全連接層結構
圖3 Dropout結構
LIF神經(jīng)元在接收一次刺激且未達到閾值電壓時,膜電位電壓會逐漸產(chǎn)生泄露,從而使得不頻繁接收刺激的神經(jīng)元趨近于不發(fā)放脈沖,因而全連接層采用LIF神經(jīng)元。其微分方程見式(8),采用離散的差分方程近似連續(xù)的膜電位微分方程見式(9),其中,m為膜電壓時間常數(shù),V為神經(jīng)元時刻的膜電壓,V?1為前一時刻膜電位電壓,reset為復位電壓,U為時刻神經(jīng)元的外部輸入產(chǎn)生的膜電位電壓,由突觸前神經(jīng)元和突觸間連接權重決定。膜電位電壓達到閾值電壓時釋放脈沖,見式(3)。
LIF神經(jīng)元輸出是二值的,直接將單次運行的結果用于分類極易受到干擾,因此,采用輸出層一段時間內(nèi)的脈沖發(fā)放頻率P作為輸出,發(fā)放頻率的高低表示該類別的響應大小,并取最大響應的神經(jīng)元對應的標簽為分類結果,如式(10)所示,其中,代表時間窗口,O個神經(jīng)元的脈沖發(fā)放個數(shù),為輸出層神經(jīng)元下標,取0、1、2、3、4、5。
帶鋼分類為多分類問題,采用One–hot編碼,即在特征處置1,其余處置0。結合脈沖神經(jīng)元特性,文中將損失函數(shù)定義為輸出層神經(jīng)元預測標簽與實際圖像標簽的均方差,該損失函數(shù)使得類別輸入時,輸出層第個神經(jīng)元的脈沖發(fā)放頻率趨于1,而其他神經(jīng)元的脈沖發(fā)放頻率接近0,見式(11)。其中,為測試集圖像數(shù)量,[P]為網(wǎng)絡輸出第張圖片的預測標簽向量,L為第張圖片實際標簽值向量。
由式(3)可知,脈沖神經(jīng)元自身具有不可微分即不可導性,無法直接進行反向傳播,因此,研究采取替代梯度下降進行反向傳播,即前向傳播時仍表現(xiàn)出神經(jīng)元脈沖特性,反向傳播時通過函數(shù)替代進行求導。文中選取3種特定函數(shù)的導數(shù)進行替代,分別為Atan、Sigmoid、NonzeroSignlogAbs函數(shù),其原函數(shù)見式(12)—(14),函數(shù)的導數(shù)曲線見圖4。文中在實驗結果部分進一步詳細分析不同替代函數(shù)對網(wǎng)絡性能的影響。
文中選用的數(shù)據(jù)集為Song等制作的東北大學(NEU)表面缺陷數(shù)據(jù)庫中的帶鋼缺陷數(shù)據(jù)集[17],共收集了熱軋帶鋼的6種典型表面缺陷,分別為夾雜(In)、斑塊(Pa)、裂紋(Cr)、麻點(Ps)、磨花(RS)和劃痕(Sc)。圖5所示為6種典型表面缺陷的樣本圖像。該數(shù)據(jù)庫共包括1 800張圖片,每類典型表面缺陷各有300個樣本,分辨率為64像素×64像素。文中將數(shù)據(jù)集NEU按照8∶2的比例分為訓練集和測試集,訓練集1 440張,測試集360張,進行模型訓練。
圖4 脈沖替代函數(shù)導數(shù)的近似曲線
圖5 NEU的6類缺陷圖像
所提出方法在NEU進行了測試,在磁瓦缺陷數(shù)據(jù)集上進行魯棒性驗證。實驗在python上實現(xiàn),環(huán)境搭建在pycharm框架下,隨機種子數(shù)固定,網(wǎng)絡的權重隨機初始化生成,使用Adam作為訓練優(yōu)化器,學習率設置為0.001。在訓練過程中,對模型的損失值進行監(jiān)控。所用電腦配置為處理器(Intel(R) Core(TM)i9–9900kCPU@3.60 Hz)、運行內(nèi)存(64 GB)、顯卡(GeForce RTX 2080Ti)。
在1.3節(jié)中,引入了3種不同的替代梯度函數(shù)來近似脈沖發(fā)射的導數(shù),在該小節(jié)中,文中對3種替代函數(shù)對模型性能影響做出分析比較。實驗結果見圖6。由圖6可以看出,反向傳播函數(shù)選擇NonzeroSignlogAbs,模型在訓練70 epoch時,在測試集上的分類準確率仍未達到擬合狀態(tài),且損失函數(shù)波動大。當反向傳播函數(shù)選擇Sigmoid時,準確率收斂較快,但在40 epoch后,模型開始波動,趨向于不穩(wěn)定。當反向傳播函數(shù)選擇ATan時,分類準確率曲線和損失函數(shù)曲線相比于另外2種反向傳播函數(shù)更為平滑,適合DCSNN模型。分析認為,Atan原函數(shù)更貼近脈沖神經(jīng)元的發(fā)放過程機理,因此,文中選擇ATan作為最佳反向傳播函數(shù)。
在文中提出的DCSNN結構中,有2個關鍵的超參數(shù),一是增長率,代表每層脈沖稠密層輸出特征圖數(shù)量,越大,每層脈沖稠密層輸出特征圖數(shù)越大。二是脈沖稠密層層數(shù),不同的表示了不同的網(wǎng)絡深度,越大則網(wǎng)絡越深。為了優(yōu)化網(wǎng)絡精度、計算復雜度,文中在數(shù)據(jù)集上通過改變參數(shù)進行實驗,選出最優(yōu)參數(shù)。在分類精度和測試時間方面的實驗結果見表2—3。
圖6 不同替代函數(shù)下模型的訓練曲線
表2 增長率對網(wǎng)絡性能的影響
Tab.2 Effect of growth rate on network performance
表3 稠密層層數(shù)對網(wǎng)絡性能的影響
Tab.3 Effect of dense layer number on network performance
由表2可知,不同增長率對模型性能是有區(qū)別的。越大,輸出特征圖數(shù)量增多,輸入通道增大,測試時間增加。當增長率為4時,此時有最小測試時間,測試精度為97.22%,當增長率為8時,測試時間增長,精度提升了0.83%,模型達到了最優(yōu)測試精度。相比于其他4種增長率的設定,增長率設為8更能保證模型的高精度識別,因此在后續(xù)實驗中選取8作為最佳增長率。
由表3可知,不同稠密層數(shù)對網(wǎng)絡性能是有影響的。增大,脈沖稠密層層數(shù)加深,網(wǎng)絡測試時間增加。當層數(shù)設置為3時,此時有最小測試時間,但網(wǎng)絡分類性能較差,分類精度只達94.44%;當層數(shù)設置為5時,網(wǎng)絡達到最高分類精度98.05%,此時在測試集上測試一次的時間為7.221 7 s,精度提升了3.61%,更能保證模型的高精度識別,因此后續(xù)實驗中,選取5作為最優(yōu)稠密層層數(shù)。
首先,在相同的實驗環(huán)境下,將文中提出的網(wǎng)絡模型與Resnet34、Resnet50、Resnet101、VGG16、Densenet121 5個經(jīng)典模型進行比較,實驗結果見表4??梢钥闯?,相比其他算法,DCSNN算法有最大分類精度98.61%,且網(wǎng)絡模型參數(shù)量達到最低。
表4 不同模型識別效果
Tab.4 Identification effect of different models
其次,將文中研究算法與其他已有研究成果進行比對,實驗結果見表5。其中,文中研究模型所用數(shù)據(jù)集與文獻[4—5]所用數(shù)據(jù)集相同,文獻[2,18]采用了不同方式進行數(shù)據(jù)增強。由表5可知,該研究模型的識別準確率較文獻[2,4,5,18]所用的模型分別高出3.94%、1.67%、4.94%、2.78%。因此,該研究提出的稠密卷積脈沖神經(jīng)網(wǎng)絡模型具有較高的識別準確率。
表5 與已有研究成果對比
Tab.5 Comparison with existing research results
對模型進行分析,實驗結果見表6。表6中SNN為基礎脈沖神經(jīng)網(wǎng)絡,其分類精度為94.44%,混淆矩陣如圖7a所示,可以看出,此時針對夾雜和劃痕缺陷分類準度較低。在脈沖神經(jīng)網(wǎng)絡基礎上,加入普通的脈沖卷積層,增加網(wǎng)絡深度和寬度,構建卷積脈沖神經(jīng)網(wǎng)絡(SNN+Conv),得到第2組實驗結果,混淆矩陣如圖7b所示。此時精度得到提升,達到了96.38%,參數(shù)量增大了接近5倍,這是因為卷積層的加入使得特征提取增強,網(wǎng)絡深度和寬度的增加導致參數(shù)量增大。將普通的脈沖卷積層改為文中提出的Spike–Denseblock模塊,即SNN+SpikeD模型,混淆矩陣如圖7c所示。此時,精度提升為97.77%,參數(shù)量為0.280百萬,相比普通脈沖卷積神經(jīng)網(wǎng)絡低0.213×106參數(shù)量,分析認為Spike–Denseblock的加入實現(xiàn)對低層特征的重復利用,進一步加強了網(wǎng)絡特征提取,實現(xiàn)對特征圖的重復使用。最后采用全局平均池化代替脈沖神經(jīng)網(wǎng)絡首層全連接層得到最后一組實驗SNN+SpikeD+GAP,即文中提出的DCSNN模型,混淆矩陣如圖7d所示。此時網(wǎng)絡精度高達98.61%,參數(shù)量僅有0.5×106,模型在Pa、Cr、Rs上都取得了100%的分類準確率,在In、Ps、Sc上取得分類最大精度分別為98.33%、95%、98.33%。分析認為,全局平均池化通過對同一通道求均值,每一通道特征圖對應一個像素值,減少全連接層的輸入,抑制模型過擬合,減少網(wǎng)絡參數(shù)量。
表6 所提模型的識別能力
Tab.6 Identification ability of proposed model
圖7 模型的混淆矩陣
首先,隨機選取單張測試圖片輸入模型,得到輸出分類結果,見圖8。其中,OSC代表了輸出脈沖計數(shù)(Out-Spike-Counter),即在=10時間窗口內(nèi),輸出層6個LIF神經(jīng)元的累積發(fā)放脈沖次數(shù),不同神經(jīng)元代表不同缺陷類別,脈沖發(fā)放次數(shù)最大的神經(jīng)元對應的缺陷類別即為分類結果。由圖8可看出,該模型針對不同缺陷均做出了準確識別,針對麻點缺陷時,對應LIF神經(jīng)元發(fā)放脈沖頻率低,但仍高于其他神經(jīng)元,可準確識別缺陷。
其次,為了進一步研究模型的有效性,采用T–SNE工具將圖像嵌入到二維空間中進行可視化,效果見圖9。T–SNE可視化效果圖中,不同顏色代表不同缺陷類別,不同類別之間間距越大,相同類別越聚攏代表分類效果越好。由圖9可看出,原始數(shù)據(jù)集聚合緊密,不易區(qū)分,經(jīng)過DCSNN模型分類后,類別聚攏,類間間距大,分類清晰,表明了模型具有良好的分類效果。
圖8 模型識別結果可視化
圖9 T–SNE可視化
為了驗證所提模型對不同缺陷能夠進行準確識別,另選取磁瓦缺陷數(shù)據(jù)集[19]進行實驗。磁瓦缺陷數(shù)據(jù)集共有1 344張圖片,包含5種缺陷,分別為氣孔缺陷115張、裂紋缺陷85張、斷裂缺陷57張、磨損缺陷32張、不均勻缺陷103張和一類正常樣本952張,見圖10。
圖10 磁瓦缺陷數(shù)據(jù)集
由于數(shù)據(jù)集大小不同,因此將圖像大小統(tǒng)一為64像素×64像素。使用與帶鋼缺陷識別相同的實驗配置,將DCSNN模型與ResNet34、Densenet121、SNN、SCNN 4種網(wǎng)絡進行對比。同時,數(shù)據(jù)集的劃分影響實驗精度,因此實驗過程中分別按照9∶1、8∶2、7∶3、6∶4劃分數(shù)據(jù)集進行實驗,實驗結果見圖11。
圖11 磁瓦缺陷數(shù)據(jù)精度
由圖11可看出,文中模型在不同比例上都取得了最高分類精度,優(yōu)于其他模型。同時,實驗發(fā)現(xiàn),模型在磁瓦缺陷數(shù)據(jù)集上的精度低于帶鋼識別精度,分析認為,磁瓦缺陷數(shù)據(jù)集存在樣本分布不平衡,部分缺陷樣本極少的問題,對算法提出更高的要求。
提出一種基于稠密脈沖卷積層的DCSNN模型,能夠對網(wǎng)絡中淺層特征圖重復利用,減小網(wǎng)絡模型參數(shù)量。采用全局平均池化代替首層脈沖全連接層,對輸出特征圖像素求平均值,減少全連接層的輸入,防止模型過擬合。為了優(yōu)化模型結構,提高模型精度,對模型進行參數(shù)分析,并比較3種不同的反向傳播替代函數(shù)。與ResNet–34、ResNet–50、ResNet–108、VGG16、Densenet121網(wǎng)絡結構進行對比可知,DCSNN模型對帶鋼缺陷識別的準確率和精確率更高,參數(shù)量最低。同時,將DCSNN模型應用于磁瓦缺陷識別,在相同實驗條件下,該算法取得了最優(yōu)效果,證明了模型的魯棒性。稠密連接的引入增加了網(wǎng)絡計算量,后續(xù)將進一步研究如何減小DCSNN的計算量。
[1] MAISURADZE M V, RYZHKOV M A. Typical Engineering Steel Defects[J].Metallurgist, 2021, 64(11-12): 1279-1287.
[2] 常江, 管聲啟, 師紅宇, 等. 基于改進生成對抗網(wǎng)絡和MobileNetV3的帶鋼缺陷分類[J]. 激光與光電子學進展, 2021, 58(4): 221-226.
CHANG Jiang, GUAN Sheng-qi, SHI Hong-yu, et al. Strip Defect Classification Based on Improved Generative Adversarial Networks and MobileNetV3[J]. Laser & Optoelectronics Progress, 2021, 58(4): 221-226.
[3] 李樹濤, 李聰妤, 康旭東. 多源遙感圖像融合發(fā)展現(xiàn)狀與未來展望[J]. 遙感學報, 2021, 25(1): 148-166.
LI Shu-tao, LI Cong-yu, KANG Xu-dong. Development Status and Future Prospects of Multi-Source Remote Sensing Image Fusion[J]. National Remote Sensing Bulletin, 2021, 25(1): 148-166.
[4] ABU M, AMIR A, LEAN Y H, et al. The Performance Analysis of Transfer Learning for Steel Defect Detection by Using Deep Learning[J]. Journal of Physics: Conference Series, 2021, 1755(1): 12041-.
[5] GUAN Sheng-qi, LEI Ming, LU Hao. A Steel Surface Defect Recognition Algorithm Based on Improved Deep Learning Network Model Using Feature Visualization and Quality Evaluation[J]. IEEE Access, 2020, 8: 49885-49895.
[6] 何靜, 余昊宇, 張昌凡, 等. 基于Canny-YOLOv3的列車輪對踏面損傷檢測[J]. 電子測量與儀器學報, 2019, 33(12): 25-30.
HE Jing, YU Hao-yu, ZHANG Chang-fan, et al. Damage Detection of Train Wheelset Tread Using Canny-YOLOv3[J]. Journal of Electronic Measurement and Instrumentation, 2019, 33(12): 25-30.
[7] 薛文亮, 靳伍銀, 王全. 改進關系網(wǎng)絡的小樣本帶鋼表面缺陷分類方法[J]. 電子測量技術, 2021, 44(19): 167-172.
XUE Wen-liang, JIN Wu-yin, WANG Quan. The Surface Defects Classification Method of Strip Steel with Small Samples Based on Improved Relation Network[J]. Electronic Measurement Technology, 2021, 44(19): 167-172.
[8] WAN Xiang, ZHANG Xiang-yu, LIU Li-lan. An Improved VGG19 Transfer Learning Strip Steel Surface Defect Recognition Deep Neural Network Based on few Samples and Imbalanced Datasets[J]. Applied Sciences, 2021, 11(6): 2606.
[9] HUANG GAO, LIU ZHUANG, VAN DER MAATEN L, et al. Densely Connected Convolutional Networks[C]// IEEE, Honolulu, 2017: 2261-2269.
[10] LIU Bing, YU An-zhu, ZHANG Peng-qiang, et al. Active Deep Densely Connected Convolutional Network for Hyperspectral Image Classification[J]. International Journal of Remote Sensing, 2021, 42(15): 5915-5934.
[11] 張慧港, 徐桂芝, 郭嘉榮, 等. 類腦脈沖神經(jīng)網(wǎng)絡及其神經(jīng)形態(tài)芯片研究綜述[J]. 生物醫(yī)學工程學雜志, 2021, 38(5): 986-994.
ZHANG Hui-gang, XU Gui-zhi, GUO Jia-rong, et al. A Review of Brain-Like Spiking Neural Network and Its Neuromorphic Chip Research[J]. Journal of Biomedical Engineering, 2021, 38(5): 986-994.
[12] 胡一凡, 李國齊, 吳郁杰, 等. 脈沖神經(jīng)網(wǎng)絡研究進展綜述[J]. 控制與決策, 2021, 36(1): 1-26.
HU Yi-fan, LI Guo-qi, WU Yu-jie, et al. Spiking Neural Networks a Survey on Recent Advances and New Directions[J]. Control and Decision, 2021, 36(1): 1-26.
[13] 張哲益, 曹衛(wèi)華, 朱蕊, 等. 基于脈沖卷積神經(jīng)網(wǎng)絡稀疏表征的高分辨率遙感圖像場景分類方法[J]. 控制與決策, 2022, 37(9): 2305-2313.
ZHANG Zhe-yi, CAO Wei-hua, ZHU Rui, et al. Sparse Representation with Spike Convolutional Neural Networks for Scene Classification of Remote Sensing Images of High Resolution[J]. Control and Decision, 2022, 37(9): 2305-2313.
[14] WUNDERLICH T C, PEHLE C. Event-Based Backpropagation can Compute Exact Gradients for Spiking Neural Networks[J]. Scientific Reports, 2021, 11(1): 12829.
[15] FAGHIHI F, ALASHWAL H, MOUSTAFA A A. A Synaptic Pruning-Based Spiking Neural Network for Hand-Written Digits Classification[J]. Frontiers in Artificial Intelligence, 2022, 5: 680165.
[16] WANG Teng-xiao, SHI Cong, ZHOU Xi-chuan, et al. CompSNN: A Lightweight Spiking Neural Network Based on Spatiotemporally Compressive Spike Features[J]. Neurocomputing, 2020, 425: 1-2.
[17] SONG Ke-chen, YAN Yun-hui. A Noise Robust Method Based on Completed Local Binary Patterns for Hot-Rolled Steel Strip Surface Defects[J]. Applied Surface Science, 2013, 285: 858-864.
[18] LI Zhong, WU Chen, HAN Qi, et al. CASI-Net: A Novel and Effect Steel Surface Defect Classification Method Based on Coordinate Attention and Self-Interaction Mechanism[J]. Mathematics, 2022, 10(6): 963.
[19] 王超, 劉玉婷, 徐祥宇, 等. 基于卷積神經(jīng)網(wǎng)絡的磁瓦缺陷檢測研究[J]. 大連民族大學學報, 2019, 21(3): 220-224.
WANG Chao, LIU Yu-ting, XU Xiang-yu, et al. Research on Magnetic Tile Defect Detection Based on Convolutional Neural Network[J]. Journal of Dalian Minzu University, 2019, 21(3): 220-224.
Steel Surface Defect Identification Based on Spiking Neural Network
KONG Ling-shuang1, MIN Yue2, HE Jing1, LIU Jian-hua2, ZHANG Chang-fan2, HUANG Cong-cong2
(a. College of Electrical and Information Engineering b. College of Railway Transportation, Hunan University of Technology, Hunan Zhuzhou 412007, China)
The work aims to propose a dense convolutional spiking neural network (DCSNN) model for steel defect identification based on spiking neural network aiming at the problems of insufficient utilization of feature images, low recognition accuracy and numerous parameters of existing steel defect identification algorithms, so as to reduce system consumption and memory occupation. Firstly, convolutional coding was used to extract and encode the features of the input images. Secondly, the dense convolutional spiking neural network was constructed by the dense connection algorithm to realize the reuse of features and suppress the disappearance of gradients. Then, the network was trained by alternative gradient descent algorithm. Finally, the test was carried out on the strip steel dataset to realize the defect identification of strip steel. The experimental results indicated that the accuracy of DCSNN on the test set was 98.61% and the number of parameters was 5 000. The proposed model shows a good effect on the identification of steel surface defects.
spiking neural network; dense connection; steel surface; defect identification; alternative gradient descent
TP183
A
1001-3563(2022)15-0013-10
10.19554/j.cnki.1001-3563.2022.15.002
2022–06–02
國家自然科學基金(52172403,61733004);湖南省自然科學基金(2021JJ30217,2021JJ50001);湖南省教育廳資助項目(19A137,18A267);湖南省研究生科研創(chuàng)新項目(CX20211081)
孔玲爽(1979—),女,博士,湖南工業(yè)大學教授,主攻復雜工業(yè)過程建模與優(yōu)化控制等。
劉建華(1981—),男,博士,湖南工業(yè)大學副教授,主攻電力牽引、傳動與控制理論及應用等。
責任編輯:曾鈺嬋