国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于ADAM主動(dòng)衰減退火算法的鋼材缺陷檢測*

2023-02-04 01:12朱清波
關(guān)鍵詞:網(wǎng)絡(luò)結(jié)構(gòu)鋼材殘差

朱清波,石 程,李 磊

(湖北工業(yè)大學(xué)機(jī)械工程學(xué)院,武漢 430068)

0 引言

鋼材是機(jī)械行業(yè)中應(yīng)用最為廣泛的物質(zhì)基礎(chǔ),也是現(xiàn)代化建設(shè)中必不可少的生產(chǎn)資料。由于生產(chǎn)加工工藝不完善或長期處于惡劣的工況中,鋼材表面會(huì)出現(xiàn)不同程度的損傷,鋼材的缺陷直接或間接影響到社會(huì)生產(chǎn)的各個(gè)方面,鋼材的缺陷會(huì)對(duì)加工的機(jī)械零件造成潛在的威脅。因此,對(duì)鋼材表面缺陷的檢測是一個(gè)重要任務(wù)。卷積神經(jīng)網(wǎng)絡(luò)具有部分感知和參數(shù)共享兩個(gè)特點(diǎn),避免了繁雜的特征提取過程,并且能有效的從大量抽象數(shù)據(jù)中學(xué)習(xí)到相應(yīng)的特征,因此在鋼材的缺陷檢測中廣泛使用。IHOR等[1]通過殘差網(wǎng)絡(luò)在不平衡的工業(yè)鋼材缺陷數(shù)據(jù)集上實(shí)現(xiàn)了較高精度的分類。王立中、楊莉等[2-3]通過改進(jìn)fast-RCNN實(shí)現(xiàn)了鋼材的高精度識(shí)別分類。HU等[4]通過引入多個(gè)注意機(jī)制在Mobile Net V2網(wǎng)絡(luò)結(jié)構(gòu)上實(shí)現(xiàn)了金屬工件表面缺陷高精度分類。方葉祥等[5]通過特征金字塔與殘差層融合特征的網(wǎng)絡(luò)結(jié)構(gòu),并通過YOLOv3實(shí)現(xiàn)快速對(duì)鋼材的劃痕壓痕進(jìn)行分類處理。這些工作都在不同的應(yīng)用背景下取得了相應(yīng)的結(jié)果,對(duì)于鋼材缺陷分類起到了一定的推動(dòng)作用。綜合來說,目前的鋼材缺陷識(shí)別分類都是結(jié)合不同的神經(jīng)網(wǎng)絡(luò),通過數(shù)據(jù)集進(jìn)行訓(xùn)練后再實(shí)際應(yīng)用至工業(yè)中。學(xué)習(xí)率是神經(jīng)網(wǎng)絡(luò)最重要的超參數(shù)之一,通過對(duì)神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練的學(xué)習(xí)率進(jìn)行調(diào)整能夠直接影響到實(shí)際工業(yè)生產(chǎn)中的檢測分類任務(wù)。動(dòng)量方法是一種較早用于加速神經(jīng)網(wǎng)絡(luò)梯度下降的優(yōu)化算法,能減緩震蕩。在此基礎(chǔ)上考慮了目標(biāo)函數(shù)的二階導(dǎo)數(shù),并以此來決定下一步迭代學(xué)習(xí)率,提高了模型訓(xùn)練的穩(wěn)定性。后續(xù)基于這些研究便出現(xiàn)了自適應(yīng)調(diào)整學(xué)習(xí)率的方法。Adagrad方法通過將學(xué)習(xí)率逐參數(shù)的除以上一次迭代梯度平方和的平方根來對(duì)學(xué)習(xí)率進(jìn)行調(diào)整。在此基礎(chǔ)上RMSprop(root mean square prop)方法添加了折合系數(shù),使學(xué)習(xí)率除以平方梯度的指數(shù)衰減平均值,使得學(xué)習(xí)率在平坦空間更新更快。DIEDERIK 等[6]提出的自適應(yīng)矩(adaptive moment estimation,Adam)在保留了Adagrad和RMSprop的特點(diǎn)外,額外引入了梯度指數(shù)下降的均值,用歷史梯度平方的指數(shù)移動(dòng)平均值來調(diào)整學(xué)習(xí)率,公式如下:

mt=β1mt-1+(1-β1)gt

(1)

(2)

式中,mt和vt分別為梯度的第一矩和非中心方差的估計(jì)值;β1和β2分別為一階和二階動(dòng)量系數(shù)。

目前,對(duì)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)率的調(diào)整算法中,Adam因收斂較快且參數(shù)易于調(diào)整而被廣泛應(yīng)用于工業(yè)應(yīng)用中,但僅使用Adam優(yōu)化器對(duì)神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練可能存在不收斂,錯(cuò)過全局最優(yōu)解的問題。因此,本文提出一種基于Adam的主動(dòng)衰減退火算法,通過多段判斷對(duì)學(xué)習(xí)率衰減或重啟,優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)模型,并實(shí)際應(yīng)用于鋼材表面缺陷的檢測分類任務(wù)中。

1 鋼材圖像分類模型

本文的神經(jīng)網(wǎng)絡(luò)模型用于對(duì)鋼材的不同受損情況進(jìn)行分類。便于后續(xù)實(shí)際工業(yè)生產(chǎn)中實(shí)現(xiàn)其他的處理工作。

1.1 數(shù)據(jù)集

全文基于深度學(xué)習(xí)的鋼材缺陷圖像分類技術(shù)對(duì)于數(shù)據(jù)集比較敏感,數(shù)據(jù)集的質(zhì)量直接影響到后續(xù)的訓(xùn)練。數(shù)據(jù)集大部分從不同機(jī)械零件表面采集而來,包含了不同工況下、不同視角和不同光照條件下的零件裂紋,能夠較為全面的反映真實(shí)場景,為了防止因樣本過少而造成模型的泛化能力較弱,對(duì)數(shù)據(jù)集進(jìn)行了常規(guī)的預(yù)處理和擴(kuò)增處理。數(shù)據(jù)集中含有3種類別,分別為無缺陷、輕微缺陷和嚴(yán)重缺陷3種,其中無缺陷5000張,輕微缺陷和嚴(yán)重缺陷各7500張,樣本分布較為均勻,部分?jǐn)?shù)據(jù)集如圖1所示。并通過隨機(jī)種子將數(shù)據(jù)集按照7:3劃分為訓(xùn)練集和測試集,并使用One-hot編碼將標(biāo)簽存儲(chǔ)為對(duì)應(yīng)的稀疏矩陣。

(a) 無缺陷 (b) 無缺陷 (c) 輕微缺陷

(d) 輕微缺陷 (e) 嚴(yán)重缺陷 (f) 嚴(yán)重缺陷圖1 鋼材缺陷樣本圖

1.2 模型結(jié)構(gòu)

淺層網(wǎng)絡(luò)結(jié)構(gòu)的非線性表達(dá)能力較差,可能對(duì)復(fù)雜的鋼材表面缺陷特征難以進(jìn)行全面的表達(dá),深層網(wǎng)絡(luò)參數(shù)過多會(huì)造成嚴(yán)重的計(jì)算負(fù)荷。VGG16網(wǎng)絡(luò)模型優(yōu)點(diǎn)在于結(jié)構(gòu)精巧且具有條理性[7]。與AlexNet相比網(wǎng)絡(luò)結(jié)構(gòu)更深且參數(shù)減少,性能提升明顯,沒有太多的超參數(shù),簡化了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。結(jié)構(gòu)相當(dāng)統(tǒng)一,圖像隨著網(wǎng)絡(luò)的深入,尺寸會(huì)因最大池化減半,同時(shí)通道數(shù)量成倍增加。與GoogleNet和ResNet這些深層網(wǎng)絡(luò)相比層數(shù)少,但層數(shù)較少時(shí)性能接近。采用較小的卷積核和較深的網(wǎng)絡(luò)結(jié)構(gòu)使得VGG網(wǎng)絡(luò)模型相當(dāng)于進(jìn)行了隱式的正則化,再加上預(yù)初始化的處理,使得VGG網(wǎng)絡(luò)收斂較快。因此,在綜合考慮實(shí)際的數(shù)據(jù)樣本,本文的鋼材缺陷圖像分類的骨干網(wǎng)絡(luò)為VGG16,并通過這個(gè)網(wǎng)絡(luò)結(jié)構(gòu)驗(yàn)證提出的基于ADAM的主動(dòng)衰減退火算法。

本文在VGG16的基礎(chǔ)上添加了額外的殘差結(jié)構(gòu),能夠避免深度網(wǎng)絡(luò)帶來的過擬合問題,并通過一個(gè)多分支的輸入實(shí)現(xiàn)額外的特征表達(dá),并與特征金字塔池的結(jié)合,使得網(wǎng)絡(luò)能夠從不同的尺度對(duì)鋼材的缺陷特征進(jìn)行學(xué)習(xí)。

在卷積網(wǎng)絡(luò)中,不同層次的網(wǎng)絡(luò)中含有語義信息不同,大的感受野和充分的語義信息存在于深層的網(wǎng)絡(luò)結(jié)構(gòu)中。深層網(wǎng)絡(luò)結(jié)構(gòu)特征對(duì)于多樣的鋼材缺陷特征識(shí)別、環(huán)境影響和局部變形的變化具有魯棒性。經(jīng)過卷積的處理中,圖像隨著分辨率的降低使得部分幾何細(xì)節(jié)信息損失。相反淺層網(wǎng)絡(luò)接受輸入的特征圖分辨率較高,能夠獲取更多的細(xì)粒度特征信息但缺少深層的抽象信息。將淺層與深層的語義信息相結(jié)合能夠有效的提升模型精度,因此模型在采用的VGG16模型的基礎(chǔ)上,額外增加一個(gè)分支輸入并結(jié)合特征金字塔池模型[8](feature pyramid networks,F(xiàn)PN)。主體結(jié)構(gòu)分為兩條分支,通過將輸入的數(shù)據(jù)轉(zhuǎn)換為張量矩陣輸入神經(jīng)網(wǎng)絡(luò)模型中。單個(gè)分支的特征提取部分使用VGG16模型的卷積和池化等操作進(jìn)行特征的提取。本文中所用的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

圖2 網(wǎng)絡(luò)模型結(jié)構(gòu)圖

其中在每次卷積和池化都使用批量歸一化處理(batch normalization,BN)[9],通過小批量的均值和方差保證相對(duì)穩(wěn)定的數(shù)據(jù)輸出。通過訓(xùn)練數(shù)據(jù)得到當(dāng)前批的均值和方差,通過引入可學(xué)習(xí)參數(shù)γ和β,使得下層網(wǎng)絡(luò)保留了上層的特征,待模型訓(xùn)練整體完成,可得整個(gè)樣本的均值和方差作為模型預(yù)測的均值和方差。輸出函數(shù)值yi與輸入變量xi歸一化后關(guān)系如下:

(3)

式中,E(xi)為樣本訓(xùn)練得到的均值;Var[xi]為樣本的方差;ε為防止分母為0使用的極小正數(shù)。利用非線性激活函數(shù)Relu,將輸入切分為兩組,將負(fù)信號(hào)全部置為0,正信號(hào)時(shí)維持與輸入函數(shù)值一致。并根據(jù)t輪訓(xùn)練得到的權(quán)重Wt和偏置b進(jìn)行變換,其中Relu函數(shù)處理的公式如下:

Relu(x)=max(0,Wtx+b)

(4)

最后將這兩個(gè)分支得到的特征圖用一個(gè)融合模塊進(jìn)行組合連接,在融合過程中對(duì)低層特征圖進(jìn)行上采樣操作,將低尺寸的特征圖還原到上層特征圖的感受野如圖3所示。通過在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,引入特征金字塔池結(jié)構(gòu),實(shí)現(xiàn)了缺陷的多尺度特征表示。

圖3 不同卷積層的感受野特征圖

并與前端兩個(gè)分支進(jìn)行最后一個(gè)維度的融合完成整個(gè)特征融合過程。再將輸出數(shù)字信息輸入到兩層全連接層中轉(zhuǎn)為相應(yīng)的特征向量。為了保證分類模型整體的精度,采用了丟棄法,隨機(jī)省略部分連接,將神經(jīng)元節(jié)點(diǎn)置為0,強(qiáng)制使隨機(jī)選擇的神經(jīng)元共同工作,能防止訓(xùn)練數(shù)據(jù)上復(fù)雜的協(xié)同適應(yīng)。使得神經(jīng)元節(jié)點(diǎn)的聯(lián)合適應(yīng)性降低,模型的泛化能力提高。為減少迭代次數(shù)更快收斂,在除含有softmax全連接層分別采用了丟棄率為0.25和0.2的丟棄。因?yàn)橹赜玫蛯哟翁卣餍畔?,能減少向高級(jí)特征過渡中的特征信息損失。最后通過softmax層將全連接層的神經(jīng)元的輸出映射到(0,1)區(qū)間中,從而進(jìn)行圖像分類處理。

1.3 模型評(píng)估標(biāo)準(zhǔn)

本文采用softmax的交叉熵作為模型的誤差損失函數(shù)(loss),并結(jié)合圖像分類的準(zhǔn)確率(Accuracy)作為分類模型的衡量指標(biāo),計(jì)算公式為:

(5)

(6)

式中,p=[p0,p1,…,pm]為概率分布;pi為對(duì)應(yīng)的屬于i的概率;y=[y0,y1,…,ym]為對(duì)應(yīng)的One-hot編碼;m為樣本數(shù);yi為編碼與預(yù)測的布爾值;TP為實(shí)例判定一致的正例次數(shù);TN為實(shí)例判定一致的負(fù)例次數(shù);FP為實(shí)例與判定不一致,正例被判為負(fù)例次數(shù);FN為實(shí)例與判定不一致,負(fù)例被判為正例次數(shù)。對(duì)鋼材缺陷圖像分類不是一個(gè)單純的線性問題,目標(biāo)優(yōu)化函數(shù)除了最優(yōu)解外,可能存在局部最優(yōu)解。因此在模型訓(xùn)練過程中若模型精度未出現(xiàn)上升趨勢或loss未出現(xiàn)收斂的趨勢,可以通過加大學(xué)習(xí)率,跳出訓(xùn)練鞍點(diǎn),重新尋找全局最優(yōu)解。

2 主動(dòng)衰減退火算法

2.1 基于Adam的主動(dòng)衰減退火算法

模型訓(xùn)練主體采用了Adam優(yōu)化器,其中f(θ)表示帶參數(shù)的優(yōu)化目標(biāo)函數(shù)。初始設(shè)置學(xué)習(xí)率為a為0.000 1,初始一階估計(jì)矩β1為0.9,二階估計(jì)矩β2為0.999,最小容差ξ為10-6,ts1、ts2分別設(shè)置為10和25,γt初始值為10-3。在此基礎(chǔ)上,提出了一種多分段閾值對(duì)模型學(xué)習(xí)率進(jìn)行更為精細(xì)的調(diào)整。在Adam切換置其他學(xué)習(xí)率的調(diào)整方法的時(shí)機(jī)參考了文獻(xiàn)[10],通過比對(duì)Adam中偏差校正的指數(shù)平均值γt來確定是否切換算法,如滿足式(7)就切換到其他算法對(duì)學(xué)習(xí)率進(jìn)行更新。

(7)

主動(dòng)衰減退火算法原理受到了余弦退火算法的啟發(fā)。余弦退火是一種周期性模擬隨機(jī)梯度下降的熱啟動(dòng)方法,在執(zhí)行置一定的epoch后,開始對(duì)學(xué)習(xí)率進(jìn)行周期的重啟更新,模擬熱重啟過程余弦退火能避免陷入局部最優(yōu)[11],使學(xué)習(xí)率沿著余弦函數(shù)減小,在衰減結(jié)束時(shí),將學(xué)習(xí)率重新啟動(dòng)并置為初始值,原理如式(8)所示。

(8)

(9)

圖4 算法結(jié)構(gòu)圖

在前一輪的loss相比于下一輪未出現(xiàn)收斂趨勢時(shí),記錄當(dāng)前的學(xué)習(xí)率,此時(shí)不對(duì)學(xué)習(xí)率進(jìn)行更改,此時(shí)學(xué)習(xí)率仍保持衰減的趨勢,通過設(shè)定兩個(gè)預(yù)設(shè)值,分別為衰減預(yù)設(shè)值和重啟預(yù)設(shè)值,在迭代次數(shù)超過衰減預(yù)設(shè)值時(shí),將學(xué)習(xí)率乘以一個(gè)衰減系數(shù),再次超過閾值時(shí),對(duì)學(xué)習(xí)率進(jìn)行重啟操作,學(xué)習(xí)率置為首次loss出現(xiàn)異常值時(shí)對(duì)應(yīng)的學(xué)習(xí)率。當(dāng)loss值更新幅度較小時(shí)或超出最大迭代次數(shù),停止訓(xùn)練,輸出訓(xùn)練參數(shù)。

2.2 實(shí)驗(yàn)數(shù)據(jù)與分析

實(shí)驗(yàn)分為兩個(gè)部分,一是在主動(dòng)衰減退火的調(diào)整下對(duì)加入殘差結(jié)構(gòu)的VGG16模型與傳統(tǒng)的VGG16的模型進(jìn)行對(duì)比驗(yàn)證分類模型的性能。二是在殘差網(wǎng)絡(luò)結(jié)構(gòu)模型上分別采用Adam、主動(dòng)衰減退火、余弦退火的算法對(duì)模型進(jìn)行訓(xùn)練來驗(yàn)證算法的精度。訓(xùn)練最大迭代次數(shù)為256,Batchsize設(shè)置為50,實(shí)驗(yàn)結(jié)果如圖5~圖8、表1和表2所示。

圖5 不同模型下測試集的精度圖 圖6 不同測試集的誤差損失圖

圖7 不同算法下測試集的精度圖 圖8 不同算法下測試集的誤差損失圖

表1 不同模型的精度與損失

表2 不同優(yōu)化方法下的精度與損失

2.3 結(jié)果分析

通過結(jié)合圖5和圖6可以看出在引入殘差結(jié)構(gòu)后,VGG16模型的精度提升,誤差損失降低,說明引入殘差結(jié)構(gòu)模型性能較好,能更有效的從缺陷圖像中獲取特征信息。再結(jié)合表1中的數(shù)據(jù)進(jìn)行分析,可以看出在引入殘差結(jié)構(gòu)的模型在訓(xùn)練和測試的精度更接近,表明模型泛化能力較好,而傳統(tǒng)的模型訓(xùn)練精度與測試精度始終存在一定的偏差,此時(shí)模型存在一定程度的過擬合。表明在引入殘差結(jié)構(gòu)后的模型泛化性能與預(yù)測精度都有小幅度的提升。

從圖7可以看出模型在訓(xùn)練輪次不足50輪時(shí),各種算法的精度接近,但在50輪之后模型精度逐漸拉開差距,此時(shí)判斷達(dá)到了周期重啟的條件,學(xué)習(xí)率重啟后帶來模型的精度的震蕩。在125輪之后使用主動(dòng)衰減退火調(diào)整的模型始終優(yōu)于余弦退火與僅使用Adam調(diào)整的模型,從表2的數(shù)據(jù)也可以得出主動(dòng)衰減退火的性能相較與Adam、余弦退火有一定的提升,表明衰減退火能有效抑制學(xué)習(xí)率的震蕩。從誤差損失的角度分析,從圖8中可以得出余弦退火算法誤差損失在起始時(shí)下降較慢,但在收斂時(shí)優(yōu)于Adam。Adam起始收斂速度較快,但最終的損失相較于余弦退火與主動(dòng)衰減退火仍有很大的差距。在模型訓(xùn)練達(dá)到125輪之后,主動(dòng)衰減退火表現(xiàn)出了良好的調(diào)整性能,誤差下降幅度明顯,主動(dòng)衰減退火算法在模型訓(xùn)練后期仍有很強(qiáng)的調(diào)控能力。

綜上分析可知本文提出的主動(dòng)衰減退火算法能夠有效利用Adam收斂較快的優(yōu)點(diǎn),并通過設(shè)定多段學(xué)習(xí)率調(diào)整,使得尋優(yōu)能力更強(qiáng),優(yōu)化后的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)具有更好的預(yù)測性能和泛化能力。

3 結(jié)論

本文構(gòu)建了引入殘差結(jié)構(gòu)的VGG16神經(jīng)網(wǎng)絡(luò)模型,通過引入特征金字塔池結(jié)構(gòu),實(shí)現(xiàn)了多尺度的特征融合。使得模型能夠?qū)Σ煌叨鹊娜毕萏卣鬟M(jìn)行有效的學(xué)習(xí),提高了模型整體的泛化性能。針對(duì)Adam的收斂問題,提出了主動(dòng)衰減退火算法,設(shè)定多個(gè)閾值對(duì)學(xué)習(xí)率進(jìn)行分段調(diào)整。根據(jù)閾值控制學(xué)習(xí)率衰減或進(jìn)行周期重啟,能有效防止訓(xùn)練跌入鞍點(diǎn)。實(shí)驗(yàn)結(jié)果表明提出的主動(dòng)衰減退火算法相較于Adam和余弦退火算法有較好的性能,在鋼材缺陷測試集上的平均準(zhǔn)確率為97.3%,能夠滿足實(shí)際工業(yè)應(yīng)用的要求。

猜你喜歡
網(wǎng)絡(luò)結(jié)構(gòu)鋼材殘差
2022年11月我國出口鋼材559萬噸
基于雙向GRU與殘差擬合的車輛跟馳建模
鋼材集中采購管理思考探究
基于殘差學(xué)習(xí)的自適應(yīng)無人機(jī)目標(biāo)跟蹤算法
基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
基于廣義混合圖的弱節(jié)點(diǎn)對(duì)等覆蓋網(wǎng)絡(luò)結(jié)構(gòu)
體系作戰(zhàn)信息流轉(zhuǎn)超網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化
鋼材分類標(biāo)號(hào)(一)
基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)比對(duì)算法研究進(jìn)展