孫世旭,胡小鋒,夏銘遠(yuǎn)
(1.上海交通大學(xué) 機(jī)械與動(dòng)力工程學(xué)院,上海 200240;2.上海航天控制技術(shù)研究所,上海 201109)
刀具破損直接影響切削加工零件的表面質(zhì)量,造成不可修復(fù)的表面損傷,甚至損壞機(jī)床。尤其對(duì)于航空發(fā)動(dòng)機(jī)機(jī)匣、發(fā)電機(jī)轉(zhuǎn)子等高價(jià)值零件,會(huì)導(dǎo)致巨大的經(jīng)濟(jì)損失。刀具破損在線監(jiān)測(cè)在保證加工質(zhì)量、降低加工成本方面具有重要意義。
近年來,國內(nèi)外許多學(xué)者致力于刀具破損監(jiān)測(cè)的研究。刀具破損失效主要有切削刃破損(flute breakage)和柄斷裂(shank breakage)兩種類型[1-2],其中柄斷裂屬于最嚴(yán)重的刀具破損,很容易通過切削力、功率等信號(hào)檢測(cè);切削刃破損在本質(zhì)上是細(xì)微的破損,因此很難檢測(cè)[1]。在刀具破損機(jī)理和理論模型方面,李健男等[3]基于分子動(dòng)力學(xué)分析了粘結(jié)破損的過程和原因;蔣宏婉等[4]基于近場(chǎng)動(dòng)力學(xué)理論分析了沖擊載荷引起的刀具微觀破損機(jī)理和原因;鄭敏利等[5]提出通過粘結(jié)自由能衡量刀具破損程度;程耀楠等[6]基于硬質(zhì)合金抗彎強(qiáng)度理論,采用經(jīng)驗(yàn)公式建立了硬質(zhì)合金刀具理論壽命可靠性模型。研究刀具破損的機(jī)理和理論模型,有助于確定影響刀具破損的主要因素,但無法杜絕破損發(fā)生、避免破損刀具繼續(xù)使用造成質(zhì)量事故。
為了保證加工質(zhì)量,在加工過程中通過振動(dòng)[7-8]、功率[9-10]、聲發(fā)射[11-14]等信號(hào)對(duì)刀具進(jìn)行在線監(jiān)測(cè)成為主流方法。然而,由于此類高值零件對(duì)制造過程的可靠性有嚴(yán)苛要求,且刀具破損會(huì)造成零件表面不可修復(fù)的損傷[15],通常采用保守的切削參數(shù)和換刀策略將破損發(fā)生概率降至最低,導(dǎo)致能夠獲取的刀具破損樣本數(shù)量遠(yuǎn)小于刀具正常狀態(tài)的樣本數(shù)量,機(jī)器學(xué)習(xí)模型無法充分學(xué)習(xí)到刀具破損信號(hào)的規(guī)律。此外,刀具內(nèi)部裂紋的增加、擴(kuò)展和刀具破壞形式都具有隨機(jī)性[16-17],刀具破損的信號(hào)復(fù)雜多樣;生產(chǎn)環(huán)境中存在工件材料性能波動(dòng)、切削參數(shù)微調(diào)等工況變化,刀具正常狀態(tài)的信號(hào)分布隨工況變化;導(dǎo)致基于歷史樣本建立的監(jiān)測(cè)模型存在對(duì)破損的查全率低,對(duì)正常狀態(tài)的誤報(bào)率高的問題。
增量學(xué)習(xí)(incremental learning)[18]方法被提出用于應(yīng)對(duì)機(jī)器學(xué)習(xí)中的概念漂移(concept drift)[19],解決機(jī)器學(xué)習(xí)模型對(duì)分布變化樣本的識(shí)別問題。ZHANG等[20]將自編碼器分為兩部分,在前三層用于提取樣本的共有特征,后三層用于提取樣本的私有特征,通過重建誤差判斷是否發(fā)生了概念漂移,發(fā)生概念漂移后對(duì)后三層進(jìn)行學(xué)習(xí)和更新,從而避免增量學(xué)習(xí)過程的災(zāi)難性遺忘。LI等[21]提出一種不平衡數(shù)據(jù)增量學(xué)習(xí)的集成學(xué)習(xí)方法,通過訓(xùn)練多個(gè)決策樹構(gòu)建集成分類模型,在獲取一定數(shù)量的新樣本后,基于Bagging算法對(duì)新樣本進(jìn)行重采樣以平衡其分布并劃分為多個(gè)樣本集,然后采用這些樣本集對(duì)所有決策樹進(jìn)行訓(xùn)練,以更新集成分類模型。ZHU等[22]通過訓(xùn)練一系列極限支持向量機(jī)(extreme support vector machine)實(shí)現(xiàn)并行的增量學(xué)習(xí),通過對(duì)這些極限支持向量機(jī)的結(jié)果加權(quán)相加得到最終結(jié)果,實(shí)驗(yàn)表明該方法取得了與批量學(xué)習(xí)一致的效果。然而,上述增量學(xué)習(xí)方法解決的是樣本類別增加的學(xué)習(xí)問題,而不能處理同類樣本分布變化的問題,且均基于監(jiān)督學(xué)習(xí),無法應(yīng)對(duì)刀具破損監(jiān)測(cè)中存在的樣本極度不平衡問題。
本文提出一種刀具破損在線監(jiān)測(cè)的半監(jiān)督增量學(xué)習(xí)方法。首先,通過半監(jiān)督學(xué)習(xí)機(jī)制對(duì)大量刀具狀態(tài)正常的樣本分布進(jìn)行學(xué)習(xí),在沒有刀具破損樣本參與訓(xùn)練的條件下,通過判斷樣本是否符合正常樣本的分布規(guī)律實(shí)現(xiàn)破損樣本的檢測(cè);然后,在刀具破損監(jiān)測(cè)過程中,當(dāng)出現(xiàn)樣本分布變化或識(shí)別錯(cuò)誤時(shí),對(duì)模型進(jìn)行增量訓(xùn)練,確保模型時(shí)刻具備良好的檢測(cè)性能。
機(jī)器學(xué)習(xí)模型在實(shí)際應(yīng)用過程中面臨一個(gè)重要問題:數(shù)據(jù)是隨時(shí)間逐漸產(chǎn)生的,數(shù)據(jù)的分布規(guī)律也可能隨時(shí)間變化。傳統(tǒng)的機(jī)器學(xué)習(xí)方法采用批量訓(xùn)練的模式,一次性對(duì)大量樣本進(jìn)行學(xué)習(xí)后,用于識(shí)別與訓(xùn)練樣本同分布的新觀測(cè)樣本。在面對(duì)實(shí)際的隨時(shí)間產(chǎn)生的樣本數(shù)據(jù)時(shí),存在前期樣本不足無法訓(xùn)練模型,后期樣本變化后模型性能下降,重新訓(xùn)練模型效率低、難度大的問題。增量學(xué)習(xí)方法可以先通過少量樣本的訓(xùn)練建立模型,然后在獲取到新的樣本后對(duì)模型進(jìn)行更新,從而賦予機(jī)器學(xué)習(xí)模型動(dòng)態(tài)學(xué)習(xí)新知識(shí)的能力。
增量學(xué)習(xí)方法的定義是根據(jù)給定的數(shù)據(jù)流樣本s1,s2,…,st生成一系列模型h1,h2,…,ht[18]。其中:st為t時(shí)刻產(chǎn)生的有標(biāo)簽訓(xùn)練樣本,
st=(xt,yt)∈n×{1,2,…,C};
(1)
ht為t時(shí)刻的模型:
ht:n{1,2,…,C},
(2)
ht僅依賴t-1時(shí)刻的模型ht-1和最近的p個(gè)訓(xùn)練樣本st-p+1,st-p+2,…,st,p為增量學(xué)習(xí)樣本數(shù)量的上限。
增量學(xué)習(xí)方法具有以下特點(diǎn):①模型需要逐步更新,t時(shí)刻的模型ht基于t-1時(shí)刻的模型ht-1更新得到,而不是完全重新訓(xùn)練;②保留之前已學(xué)習(xí)到的知識(shí),避免災(zāi)難性遺忘,即在模型更新后,保留對(duì)歷史訓(xùn)練樣本的識(shí)別能力;③每一次更新模型,只有有限的樣本(數(shù)量為p)用來訓(xùn)練。
由于在模型對(duì)新樣本進(jìn)行識(shí)別后延遲一段時(shí)間即可獲得樣本的真實(shí)標(biāo)簽,大部分增量學(xué)習(xí)方法所用的樣本都是有標(biāo)簽樣本,其學(xué)習(xí)方法本質(zhì)上還是監(jiān)督學(xué)習(xí),而且目前很少有考慮到數(shù)據(jù)極度不平衡的增量學(xué)習(xí)方法。在應(yīng)用于刀具破損樣本極少的不平衡問題時(shí),很難從極少的刀具破損樣本中學(xué)習(xí)規(guī)律,需要研究半監(jiān)督的增量學(xué)習(xí)方法,以學(xué)習(xí)多數(shù)正常狀態(tài)樣本的分布規(guī)律為主,當(dāng)出現(xiàn)破損樣本、識(shí)別錯(cuò)誤或者樣本分布變化時(shí),對(duì)模型進(jìn)行更新。
本文基于自編碼器提出一種刀具破損監(jiān)測(cè)的增量學(xué)習(xí)方法,該方法在生產(chǎn)過程中實(shí)施的流程如圖1所示,圖中最下方的橫軸代表時(shí)間,上方的4層分別代表隨時(shí)間產(chǎn)生的樣本、發(fā)生的事件、采取的措施和得到的模型。本文提出的方法包含模型的初始訓(xùn)練階段和破損檢測(cè)與增量學(xué)習(xí)階段兩個(gè)主要階段。
模型的初始訓(xùn)練階段為離線完成,在收集到一部分刀具正常狀態(tài)的樣本后,即t0時(shí)刻,啟動(dòng)初始訓(xùn)練,自編碼器網(wǎng)絡(luò)學(xué)習(xí)刀具正常狀態(tài)的樣本分布規(guī)律,據(jù)此建立刀具破損檢測(cè)的模型Ct0,模型的初始訓(xùn)練階段完成,進(jìn)入刀具破損檢測(cè)和增量學(xué)習(xí)階段。
刀具破損檢測(cè)和增量學(xué)習(xí)階段為在線完成,首先通過Ct0對(duì)新產(chǎn)生的觀測(cè)樣本進(jìn)行識(shí)別,識(shí)別后延遲一段時(shí)間即可獲得樣本的真實(shí)類別標(biāo)簽。若出現(xiàn)樣本識(shí)別錯(cuò)誤,則觸發(fā)增量學(xué)習(xí),即ti時(shí)刻,模型自動(dòng)抓取臨近ti時(shí)刻的p個(gè)樣本進(jìn)行增量訓(xùn)練,模型由Ct0更新為Cti。模型在進(jìn)行刀具破損檢測(cè)的同時(shí),檢測(cè)刀具正常狀態(tài)的樣本分布規(guī)律是否與已學(xué)習(xí)到的規(guī)律一致,若出現(xiàn)較大偏差,即使沒有樣本識(shí)別錯(cuò)誤,也會(huì)主動(dòng)觸發(fā)增量學(xué)習(xí)。如圖1中tj時(shí)刻所示,模型檢測(cè)到樣本分布變化,自動(dòng)抓取臨近tj時(shí)刻的p個(gè)樣本進(jìn)行增量訓(xùn)練,模型由Cti更新為Ctj。
Eφ:Rd→Rk,x→Eφ(x)。
(3)
其中φ為編碼器的網(wǎng)絡(luò)參數(shù)。
將h映射為x′的部分網(wǎng)絡(luò)稱為解碼器(Decoder),記為:
Dθ:Rk→Rd,h→Dθ(h)。
(4)
其中θ為解碼器的網(wǎng)絡(luò)參數(shù)。
(5)
(6)
傳統(tǒng)的自編碼器網(wǎng)絡(luò)用于異常檢測(cè)等半監(jiān)督學(xué)習(xí)問題時(shí),僅以重建誤差作為檢測(cè)依據(jù),當(dāng)觀測(cè)樣本的重建誤差超過已有正常樣本的最大重建誤差時(shí),則判別為異常,否則判別為正常。在應(yīng)用過程中存在對(duì)異常樣本的檢測(cè)率低、將分布發(fā)生變化的正常樣本誤判為異常等問題,且不具備增量學(xué)習(xí)能力。本文對(duì)現(xiàn)有的自編碼器網(wǎng)絡(luò)進(jìn)行改進(jìn),設(shè)計(jì)新的損失函數(shù)和分類方法,并引入增量學(xué)習(xí)機(jī)制,以實(shí)現(xiàn)刀具破損的準(zhǔn)確檢測(cè)。
本文提出的刀具破損檢測(cè)自編碼器通過樣本在低維特征空間的分布對(duì)樣本進(jìn)行識(shí)別,通過樣本的重建誤差判斷樣本分布是否發(fā)生變化。其結(jié)構(gòu)如圖2所示,包含4層,其中編碼器Eφ,γ包含兩層,其節(jié)點(diǎn)數(shù)分別用α,β表示,其網(wǎng)絡(luò)參數(shù)分別用φ,γ表示;解碼器Dσ,θ包含兩層,其節(jié)點(diǎn)數(shù)與編碼器對(duì)稱,分別為β,α,網(wǎng)絡(luò)參數(shù)分別用σ,θ表示。
自編碼器網(wǎng)絡(luò)以(x,y)為輸入,x=(x1,x2,…,xd)是d維樣本,y∈{1,0}是樣本的標(biāo)簽,刀具正常狀態(tài)的樣本標(biāo)記為0,刀具破損的樣本標(biāo)記為1,樣本的標(biāo)簽y僅在網(wǎng)絡(luò)的訓(xùn)練階段起作用,用于計(jì)算損失函數(shù)。
編碼器的輸出,即低維特征向量h的輸出,用于進(jìn)行刀具破損的檢測(cè);解碼器的輸出,即重建樣本x′的輸出,用于樣本分布變化的檢測(cè)。
在采集到一定數(shù)量的初始樣本后,對(duì)破損檢測(cè)的自編碼器模型進(jìn)行初始訓(xùn)練。初始訓(xùn)練的目標(biāo)是以刀具正常狀態(tài)的樣本對(duì)自編碼器進(jìn)行訓(xùn)練,令自編碼器學(xué)習(xí)正常樣本的特征和壓縮、重建的規(guī)律。在初始訓(xùn)練階段,模型的損失函數(shù)為:
(7)
(8)
(8)
在完成初始訓(xùn)練后,將訓(xùn)練好的編碼器和解碼器記作Eφ0,γ0,Dσ0,θ0,用于破損檢測(cè)和樣本分布變化檢測(cè)。
破損檢測(cè)的自編碼器對(duì)樣本進(jìn)行壓縮,提取的低維特征并不能直接用于破損檢測(cè),還需要根據(jù)樣本的特征分布構(gòu)建用于破損檢測(cè)的分類器。
(10)
(11)
(12)
T0=min{μ0+C·σ0,max(0)}。
(13)
在完成模型的初始訓(xùn)練,進(jìn)行破損檢測(cè)的過程中,模型將同時(shí)檢測(cè)樣本的分布是否發(fā)生變化,若樣本不符合訓(xùn)練樣本的分布規(guī)律,則對(duì)模型進(jìn)行增量訓(xùn)練。同時(shí),若檢測(cè)過程中出現(xiàn)樣本識(shí)別錯(cuò)誤,同樣觸發(fā)增量訓(xùn)練,使模型始終保持良好的檢測(cè)準(zhǔn)確性。
樣本分布變化的檢測(cè)通過樣本的重建誤差實(shí)現(xiàn),對(duì)一個(gè)觀測(cè)樣本xi,根據(jù)式(6)計(jì)算其重建誤差εi,若大于訓(xùn)練樣本的最大重建誤差εmax,即εi>εmax,則判斷為樣本不符合訓(xùn)練樣本的分布,進(jìn)行增量訓(xùn)練。初始訓(xùn)練階段,參與訓(xùn)練的只有正常樣本,損失函數(shù)ini也是針對(duì)正常樣本設(shè)計(jì)的。在增量訓(xùn)練階段,破損樣本也可能參與增量訓(xùn)練,因此需要修改損失函數(shù)。在增量訓(xùn)練階段,模型的損失函數(shù)為:
(14)
式中:p為參與增量訓(xùn)練的樣本數(shù)量;ε(x,x′)為式(6)所示的樣本重建誤差;N0,N1分別為增量訓(xùn)練樣本中標(biāo)簽0和1的樣本數(shù)量;L0,L1分別表示標(biāo)簽為0和1的樣本與中心的距離平方和:
(15)
(16)
式中l(wèi)i為式(8)所示訓(xùn)練樣本距離樣本中心的距離。L0的作用與初始訓(xùn)練時(shí)一致,促使正常樣本的特征分布集中;L1的作用是促使破損樣本的特征遠(yuǎn)離正常樣本。
在增量學(xué)習(xí)階段,為保留模型對(duì)與初始訓(xùn)練樣本同分布樣本的識(shí)別能力,將編碼器第一層、解碼器第二層的網(wǎng)絡(luò)參數(shù)φ0,θ0固定,只更新編碼器的第二層和解碼器的第一層。即增量訓(xùn)練過程通過最小化損失函數(shù)優(yōu)化Eφ0,γ,Dσ0,θ:
(17)
在完成自編碼器的增量訓(xùn)練后,還需將參與增量訓(xùn)練的樣本并入初始訓(xùn)練樣本集,并根據(jù)式(13)重新計(jì)算破損識(shí)別分類器的閾值T0,然后繼續(xù)進(jìn)行破損檢測(cè)和樣本分布檢測(cè)。
本文實(shí)驗(yàn)平臺(tái)由某發(fā)電機(jī)廠提供,采用某型號(hào)轉(zhuǎn)子嵌線槽銑削加工過程刀片破損監(jiān)測(cè)數(shù)據(jù)[24-25],測(cè)試和驗(yàn)證本文所提方法。該實(shí)驗(yàn)數(shù)據(jù)包含5次發(fā)電機(jī)轉(zhuǎn)子的加工過程監(jiān)測(cè)數(shù)據(jù),5次實(shí)驗(yàn)的工件材料均為25Cr2Ni4MoV,工件的材料性能實(shí)測(cè)數(shù)據(jù)如表1所示,對(duì)每個(gè)工件的6個(gè)不同位置進(jìn)行采樣,測(cè)試得到屈服強(qiáng)度和抗拉強(qiáng)度的均值和標(biāo)準(zhǔn)差;切削刀具為直徑1 100 mm的槽銑刀,上面安裝36個(gè)SNC55型硬質(zhì)合金刀片作為切削刃;切削條件為轉(zhuǎn)速35 RPM,進(jìn)給速度350 mm/min,切削深度50 mm,切削寬度42.1 mm,采用空氣冷卻。
表1 工件的材料性能 MPa
轉(zhuǎn)子的加工和數(shù)據(jù)采集過程如圖5所示,在加工過程中,采用聲發(fā)射傳感器監(jiān)測(cè)刀具狀態(tài),傳感器型號(hào)為PAC-R15α,通過磁座吸附固定在工件表面。信號(hào)的采集設(shè)備為PAC-PCI2型聲發(fā)射信號(hào)采集卡,采樣頻率為2 MHz,通過采集卡實(shí)時(shí)提取均方根值、幅值、上升時(shí)間、絕對(duì)能量、平均信號(hào)電平、計(jì)數(shù)、峰值計(jì)數(shù)、信號(hào)強(qiáng)度、平均頻率、中心頻率、初始頻率、峰值頻率、反算頻率13個(gè)特征值。
實(shí)驗(yàn)完成后,采用工業(yè)視頻顯微鏡測(cè)量刀片的破損大小,顯微鏡的放大倍數(shù)為160倍,測(cè)量分辨率為1 μm,如圖6所示。在本實(shí)驗(yàn)中,共采集到17個(gè)破損樣本和10 433個(gè)刀具正常狀態(tài)的樣本,用于對(duì)本文提出的方法進(jìn)行測(cè)試和驗(yàn)證。
將實(shí)驗(yàn)數(shù)據(jù)集按照樣本獲取的時(shí)序和工況,分為初始訓(xùn)練樣本和測(cè)試、增量學(xué)習(xí)樣本兩個(gè)子集。其中,初始訓(xùn)練樣本集中包含2 250個(gè)刀具正常狀態(tài)的樣本,無刀具破損的樣本,所有樣本均在1號(hào)轉(zhuǎn)子加工過程中采集。測(cè)試、增量學(xué)習(xí)樣本在2號(hào)~5號(hào)轉(zhuǎn)子的加工過程中采集,包含8 200個(gè)樣本,其中17個(gè)刀具破損狀態(tài)的樣本,8 183個(gè)刀具正常狀態(tài)的樣本。
首先,采用初始訓(xùn)練樣本訓(xùn)練刀具破損檢測(cè)的自編碼器,并構(gòu)建破損識(shí)別分類器。本文設(shè)計(jì)的自編碼器網(wǎng)絡(luò)通過TensorFlow[26]構(gòu)建,采用學(xué)習(xí)率為lr的Adam[27]優(yōu)化器進(jìn)行訓(xùn)練。初始訓(xùn)練階段是離線進(jìn)行的,編碼器網(wǎng)絡(luò)每次從初始訓(xùn)練樣本集中隨機(jī)抽取Nb個(gè)樣本進(jìn)行訓(xùn)練,重復(fù)Ne次。Nb,Ne以及前文提到的關(guān)鍵參數(shù)的取值如表2所示。本文設(shè)計(jì)的自編碼器網(wǎng)絡(luò)的結(jié)構(gòu)和關(guān)鍵參數(shù)是根據(jù)文獻(xiàn)[28]~文獻(xiàn)[29]中的經(jīng)驗(yàn)設(shè)置的,表中給出的取值為效果最好的。
表2 關(guān)鍵參數(shù)設(shè)置
表3 識(shí)別結(jié)果的混淆矩陣
然后,根據(jù)混淆矩陣計(jì)算模型對(duì)所有測(cè)試樣本的正確率A、查全率R、查準(zhǔn)率P和F得分F1:
(18)
(19)
(20)
(21)
其中:正確率衡量的是模型正確識(shí)別所有樣本的能力;查全率衡量的是模型正確識(shí)別正類(即少數(shù)的破損樣本)的能力;查準(zhǔn)率衡量的是模型正確識(shí)別負(fù)類(即多數(shù)的正常樣本)的能力;F得分是查全率和查準(zhǔn)率的調(diào)和平均值,綜合衡量模型的查全率和查準(zhǔn)率。
根據(jù)測(cè)試樣本的檢測(cè)結(jié)果,按樣本采集的順序逐個(gè)增加樣本,計(jì)算樣本量增加時(shí)模型的正確率、查準(zhǔn)率、查全率和F得分,并繪制各評(píng)價(jià)指標(biāo)的變化趨勢(shì),如圖7所示。圖中,不同顏色、線型的曲線代表各評(píng)價(jià)指標(biāo)隨累計(jì)樣本數(shù)量的變化情況,例如,紅色線條上的點(diǎn)(2 000,100)代表本方法對(duì)累計(jì)獲取的2 000個(gè)樣本的查準(zhǔn)率為100%;為了便于分析本方法的表現(xiàn),用黑色線條標(biāo)注了觸發(fā)增量學(xué)習(xí)的時(shí)刻。測(cè)試樣本的真實(shí)類別標(biāo)簽如圖8所示,其中絕大多數(shù)樣本為刀具正常狀態(tài)的樣本,刀具破損的樣本僅17個(gè)。
在刀具破損的觀測(cè)樣本獲取之前,準(zhǔn)確率達(dá)到了100%,但查準(zhǔn)率、查全率、F得分均為0,這是因?yàn)榇藭r(shí)只有正常樣本,所以對(duì)破損樣本的查全率、查準(zhǔn)率均為0,綜合反映查全率和查準(zhǔn)率的F得分也為0。在獲取到刀具破損的觀測(cè)樣本,即累計(jì)樣本數(shù)量大于約1 800之后,查準(zhǔn)率、查全率、和F得分開始反映模型對(duì)刀具破損樣本的檢測(cè)效果。在獲取到約2 000個(gè)樣本時(shí),模型對(duì)破損樣本識(shí)別錯(cuò)誤,查全率下降,在觸發(fā)增量學(xué)習(xí)后破損的查全率提高;在獲取到約2 700個(gè)樣本時(shí),模型對(duì)正常樣本識(shí)別錯(cuò)誤,查準(zhǔn)率下降,在觸發(fā)增量學(xué)習(xí)后查準(zhǔn)率明顯提高;隨后在獲取到約2 800個(gè)樣本時(shí),模型發(fā)現(xiàn)正常樣本的重建誤差仍大于歷史樣本的最大值,即發(fā)現(xiàn)樣本分布變化,增量學(xué)習(xí)后模型的查全率、查準(zhǔn)率等進(jìn)一步提高;隨著累計(jì)樣本數(shù)量繼續(xù)增加,又觸發(fā)3次增量學(xué)習(xí)。
本方法一直保持較高的查全率和查準(zhǔn)率,對(duì)所有樣本的檢測(cè)正確率始終保持在接近100%水平。最終,對(duì)所有8 200個(gè)測(cè)試樣本的檢測(cè)結(jié)果為:正確率99.95%,查準(zhǔn)率84.21%,查全率94.12%,F(xiàn)得分88.89%。
為了客觀評(píng)價(jià)本文提出方法的效果,本節(jié)采用相同的評(píng)價(jià)指標(biāo),將本方法與其他方法進(jìn)行對(duì)比。本方法首先改進(jìn)了標(biāo)準(zhǔn)自編碼器的學(xué)習(xí)目標(biāo)和破損檢測(cè)方法,又引入了增量學(xué)習(xí)機(jī)制,因此本節(jié)將標(biāo)準(zhǔn)自編碼器和改進(jìn)的自編碼器作為對(duì)比方法。除自編碼器方法以外,其他常用于半監(jiān)督異常檢測(cè)問題的方法,按機(jī)理主要可以分為基于概率的(probabilistic)、基于域的(domain-based)、基于距離的(distance-based)和基于重建的(reconstruction-based)[32]。其中,基于概率的方法對(duì)高維樣本效果很差[32];本文所提方法是基于重建的,將本方法與基于重建的代表性方法——標(biāo)準(zhǔn)自編碼器、基于域的代表性方法——一分類支持向量機(jī) (one-class support vector machine)、基于距離的代表性方法——局部離群因子 (local outlier factor)進(jìn)行對(duì)比。
標(biāo)準(zhǔn)自編碼器與本方法采用相同的網(wǎng)絡(luò)結(jié)構(gòu),采用式(5)所示的損失函數(shù),將訓(xùn)練樣本的最大重建誤差作為破損識(shí)別的閾值,采用樣本的重建誤差對(duì)樣本進(jìn)行識(shí)別。其識(shí)別結(jié)果如圖9所示,該方法對(duì)所有樣本的檢測(cè)正確率較高,但查全率、查準(zhǔn)率較低,且存在多次下降的問題。對(duì)所有8 200個(gè)測(cè)試樣本的檢測(cè)結(jié)果為:正確率99.60%,查準(zhǔn)率19.23%,查全率29.41%,F(xiàn)得分23.26%。
改進(jìn)的自編碼器與本方法采用相同的網(wǎng)絡(luò)結(jié)構(gòu)和主要參數(shù),同樣采用式(7)作為損失函數(shù),采用式(12)和式(13)進(jìn)行破損樣本識(shí)別,與本方法的唯一區(qū)別是在測(cè)試過程中不檢測(cè)樣本分布變化,也不進(jìn)行增量學(xué)習(xí)。其識(shí)別結(jié)果如圖10所示,該方法對(duì)所有樣本的檢測(cè)正確率接近100%,查全率、查準(zhǔn)率相比標(biāo)準(zhǔn)自編碼器有提高,但仍存在隨樣本數(shù)量增加而下降的問題。對(duì)所有8 200個(gè)測(cè)試樣本的檢測(cè)結(jié)果為:正確率99.77%,查準(zhǔn)率46.43%,查全率76.47%,F(xiàn)得分57.78%,效果不如增量學(xué)習(xí)方法。
一分類支持向量機(jī)采用徑向基核函數(shù)(radial basis function),其超參數(shù)松弛變量參數(shù)nu和gamma通過指數(shù)變化的網(wǎng)格搜索確定最優(yōu)參數(shù)組合,即nu=0.05∶0.05∶1,gamma=2-10∶1∶5。其識(shí)別結(jié)果如圖11所示,該方法將大量正常樣本錯(cuò)誤識(shí)別為破損,導(dǎo)致其總體正確率、查準(zhǔn)率、F得分極低,僅對(duì)破損的查全率正常,為47.06%。
將局部離群因子的超參數(shù)n_neighbors設(shè)置為{10,20,30,40,50,60,70,80,90,100},選取最好的結(jié)果作為對(duì)比。其識(shí)別結(jié)果如圖12所示,與一分類支持向量機(jī)類似,該方法將大量正常樣本錯(cuò)誤識(shí)別為破損,其總體正確率、查準(zhǔn)率、F得分極低,僅對(duì)破損的查全率略高,為64.71%。
本文提出的增量學(xué)習(xí)方法與其他方法最終對(duì)所有測(cè)試樣本的識(shí)別結(jié)果如表4所示。本文所提方法獲得了94%的查全率和84%的查準(zhǔn)率,相比于改進(jìn)的自編碼器,即無增量學(xué)習(xí)機(jī)制的方法,將查準(zhǔn)率從46%大幅提高至84%,將查全率從76%進(jìn)一步提高至94%;相比于標(biāo)準(zhǔn)的自編碼器方法、一分類支持向量機(jī)和局部離群因子方法,在查全率、查準(zhǔn)率方面均有大幅度提高,在4個(gè)評(píng)價(jià)指標(biāo)上均取得最優(yōu)結(jié)果(如表中加粗字體所示),證實(shí)了本文提出的增量學(xué)習(xí)方法可以有效提高模型對(duì)不同工況獲取的樣本的識(shí)別能力。
表4 5種方法的破損識(shí)別結(jié)果 %
實(shí)際生產(chǎn)環(huán)境中獲取的刀具破損樣本數(shù)量遠(yuǎn)小于正常樣本數(shù)量,且生產(chǎn)環(huán)境中存在工況變化導(dǎo)致刀具正常狀態(tài)的信號(hào)分布變化,基于歷史樣本建立的監(jiān)測(cè)模型查全率低、誤報(bào)率高的問題,本文提出一種基于半監(jiān)督學(xué)習(xí)的增量學(xué)習(xí)方法,首先采用一部分刀具正常狀態(tài)的樣本對(duì)模型進(jìn)行初始訓(xùn)練并開始刀具破損檢測(cè),在檢測(cè)過程中同時(shí)判斷樣本分布是否變化,在樣本分布變化或者模型識(shí)別錯(cuò)誤時(shí)對(duì)模型進(jìn)行增量訓(xùn)練,使模型時(shí)刻具有良好的檢測(cè)能力。相比于無增量學(xué)習(xí)機(jī)制的方法,本文方法將查全率從76%提高至94%,查準(zhǔn)率從46%提高至84%,顯著提高了對(duì)不同工況獲取的樣本的識(shí)別能力。
在未來工作中,需要進(jìn)一步研究將反映工況變化的材料力學(xué)性能等數(shù)據(jù)輸入模型中,為模型提供更多信息,從而實(shí)現(xiàn)更好的刀具破損檢測(cè)效果。