周 瑩金合麗陳友榮?劉半藤任條娟
(1.浙江樹人大學(xué)信息科技學(xué)院,浙江 杭州 310015;2.常州大學(xué)計算機(jī)與人工智能學(xué)院,江蘇 常州 213164)
多層導(dǎo)電結(jié)構(gòu)被廣泛的使用在飛機(jī)、核電站、鐵軌等制造中,是重要的工業(yè)制造材料。在長期使用過程中,多層導(dǎo)電結(jié)構(gòu)可能會受到疲勞荷載、撞擊和擠壓等一些外力因素,導(dǎo)致其鉚釘連接處出現(xiàn)裂紋缺陷,從而可能會影響多層導(dǎo)電結(jié)構(gòu)使用的安全性,造成經(jīng)濟(jì)的損失,甚至對生命造成威脅。因此需要評估多層導(dǎo)電結(jié)構(gòu)的使用安全性,即需要檢測出裂紋的位置和定量分析裂紋,估計裂紋的尺寸,從而進(jìn)行針對性的維護(hù)。目前,常用的多層導(dǎo)電結(jié)構(gòu)電渦流無損檢測技術(shù)包括脈沖渦流、常規(guī)電渦流、遠(yuǎn)場渦流等檢測技術(shù)[1]。相較于常規(guī)電渦流、遠(yuǎn)場渦流等其他電渦流檢測技術(shù),脈沖渦流檢測技術(shù)在頻域具有更豐富的信息,并且能夠有效降低趨膚效應(yīng)和提離效應(yīng)的影響[2-3]。因此可選擇脈沖渦流檢測技術(shù)對多層導(dǎo)電結(jié)構(gòu)進(jìn)行檢測,獲得和分析可以穿透多層導(dǎo)電結(jié)構(gòu)的脈沖渦流信號,從而估計出缺陷位置和尺寸。
目前,國內(nèi)外有部分學(xué)者側(cè)重于研究基于脈沖渦流的多層導(dǎo)電結(jié)構(gòu)缺陷檢測方法,從而估計出缺陷位置,如文獻(xiàn)[4]采用Rihaczek分布分析信號的頻域特征,并結(jié)合時域特征,采用主成分分析提取特征確定多層導(dǎo)電結(jié)構(gòu)中缺陷的分布;文獻(xiàn)[5]采用主成分分析法對特征進(jìn)行刪選,再采用Fisher線性判別法區(qū)分第三層表面和亞表面的缺陷;文獻(xiàn)[6]采用主成分分析法對特征進(jìn)行刪選,再采用支持向量機(jī)區(qū)分第一層和第二層的表面和次表面缺陷。但是目前文獻(xiàn)[4-6]只針對單層、某一層或兩層導(dǎo)電結(jié)構(gòu)的表面或亞表面的缺陷位置進(jìn)行研究,較少研究三層導(dǎo)電結(jié)構(gòu)各層存在缺陷的情況。另一部分學(xué)者通過電渦流檢測,估計多層導(dǎo)電結(jié)構(gòu)中某一層的缺陷尺寸,如文獻(xiàn)[7]利用不同的脈沖寬度的激勵信號檢測多層導(dǎo)電結(jié)構(gòu),并提取相應(yīng)脈沖渦流檢測信號的頻率分量作為特征,說明該特征能夠在一定程度上體現(xiàn)缺陷尺寸的變化情況。雖然該文獻(xiàn)提取的特征能夠反應(yīng)出尺寸信息,但是沒有具體對缺陷尺寸做出定量分析;文獻(xiàn)[8]通過有限元方法對多層導(dǎo)電結(jié)構(gòu)隱藏的腐蝕缺陷進(jìn)行定量分析;文獻(xiàn)[9]采用主成分分析和聚類算法對多層導(dǎo)電結(jié)構(gòu)的第二層缺陷進(jìn)行定量分析。但是文獻(xiàn)[8-9]只對某一層存在的缺陷尺寸進(jìn)行定量分析。此外文獻(xiàn)[7-9]都沒有綜合考慮缺陷位置與尺寸的問題,因此另一小部分學(xué)者同時綜合研究缺陷位置與尺寸估計問題,如文獻(xiàn)[10]采用基于信息散度指數(shù)的投影追蹤,提取信號特征用于對缺陷進(jìn)行定位與定量。但是該文獻(xiàn)采用信息散度指數(shù)的投影追蹤對特征進(jìn)行降維時,容易受到冗余、無效特征的影響,導(dǎo)致根據(jù)降維得到的新特征對缺陷進(jìn)行定位與定量分析的效果較差。此外文獻(xiàn)[4-6]和[9]提出的主成分分析法是一種無監(jiān)督的特征提取方法,沒有很好的利用特征的先驗(yàn)知識進(jìn)行識別。
綜上所示,針對目前學(xué)者較少涉及三層導(dǎo)電結(jié)構(gòu)下的缺陷位置和尺寸分析、只對某一層存在的缺陷尺寸進(jìn)行定量分析,降維算法效果較差等問題,因此提出一種多層導(dǎo)電結(jié)構(gòu)缺陷位置和尺寸的無損估計方法(nondestructive estimation method of defect location and size for multilayer conductive structure,NEM)。NEM算法提取脈沖渦流檢測信號的時域特征,利用傅里葉變換和希爾伯特黃變換分析脈沖渦流檢測信號的頻域和瞬時頻域,并提取頻域、瞬時頻域等特征,最終共獲得47個特征參數(shù)。提出基于AIC+Fisher的特征降維方法,尋找最優(yōu)的特征降維維度,從而減少特征冗余,更好表征缺陷類型,提高分類器的識別精度和效率,最后利用支持向量機(jī)(SVM)構(gòu)造分類器,采用粒子群算法對分類器模型參數(shù)進(jìn)行尋優(yōu),從而提高訓(xùn)練速度和精度。最終對降維后的特征集進(jìn)行訓(xùn)練,識別多層導(dǎo)電結(jié)構(gòu)缺陷位置和尺寸。NEM算法可提高缺陷位置和尺寸識別的查準(zhǔn)率和查全率,降低缺陷尺寸識別的誤差。
脈沖渦流檢測信號包含了被測試件的信息,不同的信號特征表征不同的被測試件的結(jié)構(gòu)信息,若多層導(dǎo)電結(jié)構(gòu)存在缺陷會導(dǎo)致磁感應(yīng)強(qiáng)度變化,從而導(dǎo)致檢測到的脈沖渦流檢測信號會對缺陷有一定的反映,電壓出現(xiàn)不同的波峰,因此從時域中分別提取峰值、峰值時間和過零點(diǎn)時間三個特征。如圖1所示,其中,峰值是指激勵信號的上升沿和下降沿同時檢測到瞬態(tài)響應(yīng)信號的最大電壓幅值,過零點(diǎn)時間是指從激勵信號的上升沿或下降沿開始到瞬態(tài)響應(yīng)信號電壓幅值降為零的時間間隔,峰值時間是指從激勵信號的上升沿或下降沿開始到電壓峰值的時間間隔。令脈沖渦流檢測信號幅值函數(shù)為f(t),則峰值為max[f(t)],令到達(dá)峰值的時間點(diǎn)為tfmax,尋找tfmax之前最后一個令f(t)=0的時間點(diǎn)為t1,尋找到達(dá)tfmax之后第一個令f(t)=0的時間點(diǎn)為t2,則過零點(diǎn)時間=t2-t1,峰值時間=tfmax-t1。
圖1 時域特征
此外脈沖渦流的激勵信號有豐富頻率成分,因此脈沖渦流檢測信號頻域包含大量反映多層導(dǎo)電結(jié)構(gòu)試件信息的特征,因此采用傅里葉變換和希爾伯特黃變換對脈沖渦流檢測信號的頻域和瞬時頻域進(jìn)行分析,并提取頻域、瞬時頻域特征。即通過傅里葉變換將時域脈沖渦流檢測信號變換為頻域信號F(wh)。從F(wh)中分別提取能反映脈沖渦流滲透多層導(dǎo)電結(jié)構(gòu)深度特征的當(dāng)頻率等于激勵頻率時的頻譜幅值(基頻分量)、當(dāng)頻率等于二到十二倍激勵頻率時的頻譜幅值(二次到十二次的諧波分量)。
式中:F(wh)表示wh的頻域信號,wh表示第h次諧波分量對應(yīng)的頻率值,ζ表示虛數(shù)。選擇2.5 kHz,5 kHz,7.5 kHz,10 kHz,12.5 kHz,15 kHz,17.5 kHz,20 kHz,22.5 kHz,25 kHz,27.5 kHz,30 kHz的頻率,共12個點(diǎn)。
利用希爾伯特黃變換分析信號的瞬時頻域[11-12],首先采用經(jīng)驗(yàn)?zāi)B(tài)分解方法將脈沖渦流檢測信號分解成多個本征模態(tài)函數(shù),采用式(2)對前四個本征模態(tài)函數(shù)進(jìn)行希爾伯特變換后得到分別利用式(3)~式(6)計算前四個本征模態(tài)函數(shù)的瞬時幅度、瞬時相位、瞬時頻率和邊際譜,并提取本征模態(tài)函數(shù)均值、瞬時相位的方差、瞬時頻率的方差、瞬時幅度的方差和邊際譜的帶寬、方差、面積、最大值等特征。
式中:cd(τ)表示第d個本征模態(tài)函數(shù),表示第d個本征模態(tài)函數(shù)經(jīng)過希爾伯特變換后的函數(shù)。
通過式(3)計算第d個本征模態(tài)函數(shù)的瞬時幅度ad(t):
通過式(4)計算第d個本征模態(tài)函數(shù)的瞬時相位θd(t):
通過式(5)計算第d個本征模態(tài)函數(shù)的瞬時頻率wd(t):
通過式(6)計算第d個本征模態(tài)函數(shù)的邊際譜H(wd):
式中:Re()表示取實(shí)數(shù)。
1.1節(jié)中提取的脈沖渦流檢測信號特征沒有利用不同缺陷類型樣本特征分布的先驗(yàn)知識,所提取的特征包含冗余信息,導(dǎo)致計算量變大,并且可能淹沒重要信息??紤]到Fisher降維是一種有監(jiān)督的特征降維方法,可以合理利用先驗(yàn)知識選取最佳投影方向?qū)μ卣鬟M(jìn)行投影,降低特征維度,使得到不同缺陷的新特征樣本點(diǎn)之間的距離變大,相同缺陷的新特征樣本點(diǎn)之間的距離變小,提高缺陷分類的準(zhǔn)確率。但是Fisher降維能確定特征維度的投影方向,而無法確定最優(yōu)降維維度,無法保證SVM分類精確度的同時保證SVM的分類效率。因此選擇赤池信息準(zhǔn)則[13](Akaike Information Criterion,AIC)評估Fisher降維后的特征數(shù)據(jù)的優(yōu)良性,從而確定最優(yōu)降維維度。具體原理如下:
假設(shè)需要分類的類別數(shù)量為C,輸入47個維度的脈沖渦流檢測信號特征,各類樣本的數(shù)量為mj。通過式(7)和式(8)計算特征樣本類內(nèi)散度矩陣S W和類間散度矩陣S B:
式中:x ji表示第j類類別的第i個樣本,mj表示第j類類別的樣本數(shù)量,u j表示第j類類別的樣本均值,表示全部樣本均值,pj表示第j類類別的先驗(yàn)經(jīng)驗(yàn);
通過Fisher的降維準(zhǔn)則J(WK)可將信號特征降到K維:
式中:W K={w1,w2,…,wK}表示每種特征的投影方向。
利用式(10)計算每個K維樣本的類內(nèi)偏差
式中:Di表示樣本i的類內(nèi)偏差,表示降維后樣本i的第k維特征值,表示降維后樣本i所屬類中心的第k維特征值。
根據(jù)概率分布理論,考慮到樣本特征的類內(nèi)偏差服從高斯分布,得到偏差的極大似然估計函數(shù),可表示為:
式中:Γ表示極大似然估計函數(shù),n表示樣本總數(shù)量,u?表示期望值,σ2表示標(biāo)準(zhǔn)方差。
同時,考慮特征維度會影響SVM算法時間復(fù)雜度,因此將特征降維維度K作為AIC需要考慮的獨(dú)立參數(shù)量,構(gòu)造AIC公式,可表示為:
式中:λ表示獨(dú)立參數(shù)系數(shù)。AIC值越小,所提取的特征越好。因此通過式(9)~式(12)分別計算1-47維的AIC值,提取使AIC值最小的投影維度下的特征集,進(jìn)行多層導(dǎo)電結(jié)構(gòu)缺陷位置和尺寸的估計。
相較于其他分類算法,由于SVM分類算法是基于最小化經(jīng)驗(yàn)風(fēng)險的原則,具有良好的泛化能力和不易過擬合等優(yōu)點(diǎn),同時由于需要訓(xùn)練的特征是多維和線性不可分,因此本文采用基于高斯核的SVM分類算法構(gòu)建分類器[14],即首先利用SVM分類算法構(gòu)造4個分類模型SVM-0L,SVM-1L,SVM-2L,SVM-3L分別用于識別多層導(dǎo)電結(jié)構(gòu)無缺陷、第一層缺陷、第二層缺陷和第三層缺陷等情況,如表1所示。然后構(gòu)造6個分類模型SVM-2S,SVM-3S,SVM-4S,SVM-5S,SVM-6S,SVM-7S,分別用于檢測尺寸為2 mm、3 mm、4 mm、5 mm、6 mm和7 mm的缺陷,如表2所示。其中表1和表2中的“1”表示識別結(jié)果為正類樣本,“-1”表示識別結(jié)果為負(fù)類樣本。以構(gòu)建識別SVM-1L分類模型為例,將第一層缺陷特征樣本作為正類樣本,其他缺陷特征樣本作為負(fù)類樣本。利用如下模型對降維后的數(shù)據(jù)進(jìn)行訓(xùn)練,采用粒子群算法方法對懲罰因子和高斯函數(shù)核等參數(shù)進(jìn)行尋優(yōu),計算得到最優(yōu)Lagrange乘子解參數(shù),并利用獲得的參數(shù)構(gòu)建分類模型,用于估計缺陷位置和尺寸。
表1 缺陷位置分類模型
表2 缺陷尺寸分類模型
式中:Q(α)表示分類模型,αi,αl分別表示第i和l個Lagrange乘子,yi,yl分別表示第i和l個樣本標(biāo)簽,yi,yl∈{-1,1},Mj表示j類缺陷的特征數(shù)量,Φ(xi,xl)表示高斯函數(shù),表示懲罰因子。
如圖2所示,具體實(shí)現(xiàn)步驟如下:
圖2 方法流程圖
步驟1 初始化k=1,Kyu=47和λ等參數(shù),并讀取脈沖渦流檢測信號的訓(xùn)練樣本;
步驟2 將輸入的脈沖渦流檢測信號轉(zhuǎn)化為時域,提取峰值、峰值時間和過零點(diǎn)時間共3個時域特征;
步驟3 對時域信號進(jìn)行傅里葉變換,提取基頻分量和二次到十二次諧波分量,共12個頻域特征;
步驟4 利用經(jīng)驗(yàn)?zāi)B(tài)分解算法分解時域信號,得到多個本征模態(tài)函數(shù);
步驟5 對前四個本征模態(tài)函數(shù)進(jìn)行希爾伯特變換,計算每個本征模態(tài)函數(shù)的瞬時相位、瞬時頻率和邊際譜,并提取前四個本征模態(tài)函數(shù)的均值、瞬時相位的方差、瞬時頻率的方差、瞬時幅度的方差和邊際譜的帶寬、方差、面積、最大值等共32個特征參數(shù)。
步驟6 利用Fisher將上述提取的特征降到k維;計算和記錄k維維度對應(yīng)的AIC值,k=k+1,判斷k是否大于閾值Kyu。如果是,則跳到步驟七,否則重新返回步驟六。
步驟7 獲得AIC值最小對應(yīng)的Fisher投影維度Kbest,提取Kbest維度投影下的特征集;
步驟8 根據(jù)位置和尺寸分類類型,按照1.3節(jié)方法分別構(gòu)建相應(yīng)的分類器,并利用樣本集對分類器進(jìn)行訓(xùn)練,同時采用粒子群算法對分類器的懲罰因子和高斯函數(shù)核參數(shù)進(jìn)行尋優(yōu),獲得分類器的模型參數(shù);
步驟9 輸入待估計的脈沖渦流檢測信號,從時頻和頻域上提取47維特征,并采用Fisher投影成Kbest維特征。根據(jù)處理后的特征,先采用訓(xùn)練好的位置分類器進(jìn)行缺陷位置估計,再采用訓(xùn)練好的尺寸分類器進(jìn)行尺寸大小估計,并輸出缺陷的估計位置和尺寸。
首先分別在三層導(dǎo)電結(jié)構(gòu)的每一層中制造具有2 mm、3 mm、4 mm、5 mm、6 mm和7 mm缺陷的試件和無缺陷試件,共19個試件。采用自制脈沖渦流檢測設(shè)備對上述19個試件進(jìn)行檢測,獲得每一種有缺陷試件的200組脈沖渦流檢測信號數(shù)據(jù)和無缺陷350組脈沖渦流檢測信號數(shù)據(jù),且每組具有2 000個采樣數(shù)據(jù)。
采用MATLAB軟件進(jìn)行實(shí)驗(yàn)仿真。在實(shí)驗(yàn)中,令降維維度閾值Kyu為47,系數(shù)λ為0.6,并根據(jù)三層導(dǎo)電結(jié)構(gòu)缺陷位置或缺陷尺寸的識別結(jié)果,計算查全率、查準(zhǔn)率和平均誤差值等算法性能指標(biāo)。其中,令Zj表示測試集中第j類的待識別的元素數(shù)量,vj表示j類型正確識別的元素數(shù)量,bj表示識別為j類型的元素數(shù)量。則查全率F1定義為類型正確識別的元素數(shù)量占總元素數(shù)量的百分比,即:
查準(zhǔn)率F2定義為類型正確識別的元素數(shù)量與識別為該類型元素數(shù)量比值的平均值,即
平均誤差值R定義為識別出元素缺陷尺寸與真實(shí)該元素缺陷尺寸的平均誤差,即:
式中:si表示第j類的第i個元素的真實(shí)缺陷尺寸,s′i表示第j類的第i個元素的識別出的缺陷尺寸。
3.2.1 參數(shù)λ對算法的影響
選擇式(12)中λ分別為0.5,0.6,0.7,0.8,0.9,1,1.1,1.2,1.3,1.4,1.5和4.1節(jié)中參數(shù),提取包括缺陷位置所對應(yīng)的脈沖渦流檢測信號時頻域中的47個特征值,計算其AIC值,得到不同λ值和維度下的AIC值,并利用SVM分類器分別對最佳特征維度下Fisher降維后的特征參數(shù)進(jìn)行訓(xùn)練和識別,獲得訓(xùn)練識別時間和識別查全率。
首先,分析不同λ值和維度對AIC值的影響。如圖3所示,隨著特征維度的增大,同一個λ值下的AIC值先下降,到達(dá)最小值后開始上升,即同一個λ值下的AIC值變化曲線都存在最小AIC值,其對應(yīng)的特征維度為Fisher的最優(yōu)降維維度。隨著λ的變大,時間復(fù)雜度對AIC值的影響增強(qiáng),查全率對AIC值的影響減弱,從而導(dǎo)致其對應(yīng)AIC值變化曲線中的最小AIC值對應(yīng)的Fisher的最優(yōu)降維維度變小。
圖3 不同λ值和維度下的AIC值
如圖4所示,隨著λ的增加,AIC更側(cè)重于考慮算法的時間復(fù)雜度,使得AIC值變化曲線中的最小AIC值對應(yīng)的Fisher最優(yōu)降維維度變小,從而使得訓(xùn)練時間逐漸變短。但是當(dāng)λ=<1.1時,由于最優(yōu)降維維度變小,導(dǎo)致輸入模塊的特征參數(shù)信息變少,部分缺陷沒有識別正確,因此隨著λ的增加,查全率變小,當(dāng)λ>1.1時,由于當(dāng)前選擇的降維維度更適合當(dāng)前數(shù)據(jù),少量原來識別錯誤的數(shù)據(jù)重新被正確識別,因此隨著λ的增加,查全率略微提高1%??傊?,考慮到當(dāng)λ=0.6時,訓(xùn)練時間為18 min在可接收的時間范圍內(nèi),其查全率為96.93%,相對較高,因此在后續(xù)的實(shí)驗(yàn)中,選擇λ=0.6。
圖4 λ變化下的訓(xùn)練時間和查全率
3.2.2 缺陷位置識別實(shí)驗(yàn)分析
選取350×2000個無缺陷信號數(shù)據(jù)、每一層選取2 mm、3 mm、4 mm、5 mm、6 mm和7 mm各50×2 000個有缺陷試件的信號數(shù)據(jù)作為缺陷位置識別的數(shù)據(jù)集。對該數(shù)據(jù)集提取2.1節(jié)所述的47維特征,并采用基于AIC+Fisher的特征降維方法,獲得最優(yōu)降維維度為19維,獲得無缺陷、第一層缺陷、第二層缺陷和第三層缺陷四種位置類型降維后的特征參數(shù),并以前三維特征分布為例說明所提取特征的有效性。如圖5所示,基于AIC和Fisher的特征降維方法可提取無缺陷、第一層缺陷、第二層缺陷和第三層缺陷的特征,且其前三個特征相對聚集,能明顯體現(xiàn)不同缺陷位置下的脈沖渦流檢測信號對缺陷位置的反映,因此NEM所提取的特征能夠較好的表征缺陷位置,但是無缺陷、第二層缺陷和第三層缺陷的特征之間存在一定的重疊,需要更多特征參數(shù)和SVM進(jìn)行進(jìn)一步區(qū)分。
圖5 缺陷位置識別時降維后前三個特征分布圖
對數(shù)據(jù)集中數(shù)據(jù)進(jìn)行特征提取和降維,獲得特征數(shù)據(jù)集,并設(shè)計由隨機(jī)抽取每種類型的100%、90%、80%、70%和60%的特征數(shù)據(jù)構(gòu)成的R1、R2、R3、R4和R5五組訓(xùn)練樣本集。測試集由全部特征數(shù)據(jù)集構(gòu)成。同時,選擇NEM、SVM47、AF_F、Fisher47和AF_R共5種識別方法對R1、R2、R3、R4和R5五組訓(xùn)練樣本集進(jìn)行訓(xùn)練,對其測試集進(jìn)行缺陷位置識別,并計算查全率和查準(zhǔn)率。其中,SVM47是采用SVM算法作為分類器,直接對特征提取后的47維特征進(jìn)行訓(xùn)練和識別;AF_F是根據(jù)基于AIC+Fisher選擇的最優(yōu)降維參數(shù)下的特征參數(shù),采用Fisher作為分類器,對缺陷進(jìn)行識別;Fisher47是采用Fisher作為分類器,直接對特征提取后的47維特征進(jìn)行訓(xùn)練和識別;AF_R是根據(jù)基于AIC+Fisher選擇的最優(yōu)降維參數(shù)下的特征參數(shù),采用徑向基神經(jīng)網(wǎng)絡(luò)(RBF)作為分類器,對缺陷進(jìn)行訓(xùn)練和識別。
如圖6所示,隨著訓(xùn)練集中訓(xùn)練樣本的減少,SVM47、AF_F和Fisher47的查全率變化幅度較小,且始終小于87%,而NEM和AF_R的查全率雖然隨之降低,但是這兩個算法的查全率始終大于90%,且NEM的查全率下降幅度較少。同時,不管訓(xùn)練樣本如何變化,NEM的查全率始終大于SVM47、AF_F、Fisher47和AF_R。這是因?yàn)?NEM采用AIC+Fisher合理利用先驗(yàn)知識尋找缺陷位置與特征之間的映射關(guān)系,獲得權(quán)衡準(zhǔn)確率和算法時間復(fù)雜度的最優(yōu)降維特征,并在選取的最佳投影方向?qū)μ卣鬟M(jìn)行投影,從而獲得能較好表征缺陷位置特點(diǎn)且去除冗余的特征數(shù)據(jù)。這些特征數(shù)據(jù)中,不同缺陷的特征點(diǎn)之間的距離較大,相同缺陷的特征點(diǎn)之間的距離較小,有利于支持向量機(jī)(SVM)進(jìn)行分類,從而較多的識別出正確的缺陷位置。而Fisher47和AF_F分別采用Fisher分類方法對47維和最優(yōu)降維維度下數(shù)據(jù)進(jìn)行分類,其直接識別效果較差。SVM47直接對47維特征數(shù)據(jù)進(jìn)行分類,其特征數(shù)據(jù)存在較多冗余,較難選擇好分類參數(shù)。AF_R采用RBF對最優(yōu)降維維度下數(shù)據(jù)進(jìn)行分類,但是SVM算法構(gòu)造分類器對特征的擬合性較好且適用于較少的訓(xùn)練樣本,因此NEM略高于AF_R,且隨著訓(xùn)練樣本數(shù)量的下降,兩者差距更明顯。
圖6 缺陷位置識別的查全率比較
如圖7所示,NEM的缺陷位置識別的查準(zhǔn)率大于SVM47、AF_F、Fisher47和AF_R,且隨著訓(xùn)練樣本數(shù)量的下降,NEM的查準(zhǔn)率下降幅度不大。這是因?yàn)?NEM能尋找到降低特征冗余且較好表征缺陷位置的特征數(shù)據(jù),并采用SVM設(shè)計了缺陷位置識別的分類器,從而正確識別出4種類型的數(shù)據(jù),且無缺陷識別為有缺陷的數(shù)量較少,從而提高了NEM的查準(zhǔn)率。而SVM47和Fisher47沒有進(jìn)行特征降維,F(xiàn)isher的分類效果較差,訓(xùn)練集樣本較少的情況下RBF分類效果也較差。
圖7 缺陷位置識別的查準(zhǔn)率比較
3.2.3 缺陷尺寸識別實(shí)驗(yàn)分析
每一層選取2 mm、3 mm、4 mm、5 mm、6 mm和7 mm缺陷尺寸。每一層每一類缺陷尺寸選擇200×2 000個信號數(shù)據(jù),共18×200×2000個信號數(shù)據(jù)作為缺陷尺寸識別實(shí)驗(yàn)的數(shù)據(jù)集。對該數(shù)據(jù)集提取2.1節(jié)所述特征,并根據(jù)AIC值得到一到三層Fisher最優(yōu)降維維度分布為15維、20維和21維。以第一層的6種缺陷尺寸類型缺陷降維后的前三維特征分布為例,說明所提取特征的有效性。如圖8所示,不同尺寸下的缺陷特征相對聚焦,能體現(xiàn)不同尺寸缺陷下的脈沖渦流檢測信號對缺陷尺寸的反映,且2 mm、3 mm和4 mm的缺陷特征與5 mm、6 mm和7 mm的缺陷特征區(qū)別明顯。但是2 mm、3 mm和4 mm的缺陷特征之間存在一定的重疊,5 mm、6 mm和7 mm的缺陷特征之間存在一定的重疊,這需要更多特征參數(shù)和SVM進(jìn)行進(jìn)一步區(qū)分。
圖8 降維后第一層不同缺陷尺寸下的前三個特征分布圖
對缺陷尺寸識別實(shí)驗(yàn)的數(shù)據(jù)集中數(shù)據(jù)進(jìn)行特征提取和降維,獲得特征數(shù)據(jù)集,并設(shè)計由隨機(jī)抽取每種類型的100%、90%、80%、70%和60%的特征數(shù)據(jù)構(gòu)成的R6、R7、R8、R9和R10五組訓(xùn)練樣本集。測試集都由缺陷尺寸識別實(shí)驗(yàn)的全部特征數(shù)據(jù)集構(gòu)成。同時,選擇NEM、SVM47、AF_F、Fisher47和AF_R共5種識別方法對R6、R7、R8、R9和R10五組訓(xùn)練樣本集進(jìn)行訓(xùn)練,對測試集進(jìn)行缺陷尺寸識別,并計算各個算法的查全率、查準(zhǔn)率和平均誤差值。
如圖9所示,隨著訓(xùn)練樣本數(shù)量的下降,NEM、AF_R、SVM47和AF_F的查全率隨之下降,F(xiàn)isher47的查全率基本變化不大。但是NEM的查全率受訓(xùn)練樣本數(shù)量的影響較小,其始終高于SVM47、AF_F、Fisher47和AF_R。這是因?yàn)?NEM根據(jù)缺陷尺寸數(shù)據(jù)的特點(diǎn),采用AIC+Fisher算法,去除冗余特征,獲得最優(yōu)降維維度。同時,NEM提取出針對缺陷尺寸識別的有效特征參數(shù),并采用對特征擬合性較好的SVM方法設(shè)計6個分類模型,可有效識別出缺陷尺寸。而AF_R、SVM47和AF_F存在節(jié)3.2.1中所述的相同缺點(diǎn),因此NEM的查全率最高,且隨著訓(xùn)練樣本數(shù)量的下降,其下降幅度較小。
圖9 缺陷尺寸識別的查全率比較
如圖10所示,隨著訓(xùn)練樣本數(shù)量的下降,NEM、AF_R、SVM47的查全率隨之下降,AF_F和Fisher47的查全率基本變化不大。但是NEM的查全率受訓(xùn)練樣本數(shù)量的影響較小,其始終高于SVM47、AF_F、Fisher47和AF_R。這是因?yàn)?NEM提取的特征能很好表征缺陷尺寸,且設(shè)計了合理的SVM分類器,即使在訓(xùn)練集較少的情況下,仍能較好分類對應(yīng)缺陷尺寸,其查全率受樣本數(shù)量影響較少。
圖10 缺陷尺寸識別的查準(zhǔn)率比較
如圖11所示,不管訓(xùn)練樣本數(shù)量如何變化,NEM的缺陷尺寸識別的平均誤差值始終小于SVM47、AF_F、Fisher47和AF_R。這是因?yàn)?NEM能較好的識別出各個缺陷的尺寸類型,其查準(zhǔn)率和查全率都是最高,且個別識別錯誤的缺陷,其識別出的缺陷尺寸在其實(shí)際缺陷尺寸的附近,這降低了NEM的缺陷尺寸識別的平均誤差值。SVM47、AF_F、Fisher47和AF_R的查準(zhǔn)率和查全率都不是最優(yōu)的,其缺陷尺寸識別的平均誤差值較大。
圖11 缺陷尺寸識別的平均誤差值比較
提出一種多層導(dǎo)電結(jié)構(gòu)缺陷位置和尺寸的無損估計方法(NEM),能夠有效對多層導(dǎo)電結(jié)構(gòu)缺陷位置和尺寸進(jìn)行識別。首先,NEM將脈沖渦流檢測信號轉(zhuǎn)換為時域信號,分析時域信號并提取特征,然后利用傅里葉變換和希爾伯特黃變換分析脈沖渦流檢測信號的頻域和瞬時頻域,并提取47維特征。接著提出基于AIC和Fisher的特征降維方法,去除冗余特征,提高分類器的訓(xùn)練速度,并采用SVM構(gòu)造分類器,可避免數(shù)據(jù)過擬合的問題,提高識別精度。最后,給出實(shí)驗(yàn)數(shù)據(jù)和參數(shù),仿真分析參數(shù)λ對算法的影響,比較缺陷位置識別和缺陷尺寸識別下的NEM、SVM47、AF_F、Fisher47和AF_R的性能。
實(shí)驗(yàn)結(jié)果表明:NEM能夠適用于多層導(dǎo)電結(jié)構(gòu)的缺陷位置識別和缺陷尺寸識別,從而提高識別的查全率和查準(zhǔn)率,降低缺陷尺寸識別的平均誤差值,優(yōu)于SVM47、AF_F、Fisher47和AF_R等方法。但是NEM采用基于粒子群參數(shù)尋優(yōu)的SVM進(jìn)行分類,其分類速度相對較慢,因此下一個階段目標(biāo)是研究適用于大規(guī)模數(shù)據(jù)的分類方法。