張 偉,許愛強(qiáng)
ZHANG Wei,XUAiqiang
海軍航空大學(xué) 航空作戰(zhàn)勤務(wù)學(xué)院,山東 煙臺 264001
School ofAeronautical Operations and Service,NavalAeronautical University,Yantai,Shandong 264001,China
現(xiàn)代電子技術(shù)的快速發(fā)展,對模擬電路的測試與診斷提出了新的要求。由于元件參數(shù)的容差性、故障模式的多樣性、廣泛存在的非線性,使得傳統(tǒng)的故障診斷方法在實際模擬電路診斷中難以達(dá)到預(yù)期的效果[1-2]。為此,針對模擬電路的故障特點,國內(nèi)外學(xué)者開展了大量的研究,其中基于核的智能診斷方法取得了廣泛的肯定和積極的研究成果[3-6],例如支持向量機(jī)(Support Vector Machine,SVM)、核超限學(xué)習(xí)機(jī)(Kernel Extreme Learning Machine,KELM)等。該方法將故障診斷問題建模為模式識別問題,通過對電路的正常模式和故障模式進(jìn)行學(xué)習(xí),構(gòu)建診斷模型,最終形成診斷策略。
盡管基于核的診斷方法展示出優(yōu)越的性能,但是核函數(shù)、核參數(shù)的選擇嚴(yán)重制約著其有效性。近些年,大量研究表明,多核學(xué)習(xí)(Multiple Kernel Learning,MKL)是一種靈活性更強(qiáng)、解釋能力更好的學(xué)習(xí)方法[7-8]。文獻(xiàn)[4-5,9-10]已經(jīng)將其應(yīng)用到模擬電路等系統(tǒng)的故障診斷中,并通過大量實例證明在面對單故障、多故障以及并發(fā)故障時均能取得更高的診斷精度。在MKL中,為避免基核權(quán)重的縮放與初始化問題,通常一個范數(shù)約束被施加到基核權(quán)重上[11]。無論怎樣,為一個給定的學(xué)習(xí)任務(wù)選擇一種合適的范數(shù)約束本身就是一個開放性的問題。
近些年,在MKL中一個新興的研究熱點是通過最小泛化誤差界來學(xué)習(xí)基核組合系數(shù)。在這些工作中將核導(dǎo)出空間中包含所有訓(xùn)練樣本的最小閉球(Minimum Enclosing Ball,MEB)半徑納入MKL中。文獻(xiàn)[12]構(gòu)造了一個集成半徑信息的MK-SVM模型,該模型被證明可以有效解決上文提到的縮放與初始化問題,從而避免了范數(shù)約束形式的選擇問題。文獻(xiàn)[13]提出一種融合半徑信息的MK-ELM模型。該模型在繼承融合半徑信息的MK-SVM優(yōu)點的同時,兼具了ELM計算高效的特點。但無論怎樣,它也存在一些問題:(1)MEB半徑對外部干擾極其敏感;(2)KELM中并不存在所謂的半徑-間距界理論,將MEB半徑強(qiáng)行引入MK-ELM,缺乏基本的理論依據(jù)。
為此,結(jié)合模擬電路故障特點,本文通過分析多核特征空間中的類內(nèi)散度特性,設(shè)計了一種集成散度的自適應(yīng)正則化MK-ELM模型。通過模擬電路診斷實例證明了所提方法的有效性、適用性。
在MKL框架下,設(shè) {kq(?,?)}rq=1為選擇的r個基核;為對應(yīng)于r個基核的特征映射為給定任務(wù)下基核對應(yīng)的核矩陣。則多核特征映射、組合核函數(shù)、組合核矩陣分別表示為:
對于一組具有c種模式的故障數(shù)據(jù)集,假設(shè)第l類故障樣本個數(shù)為nl,且,n表示故障樣本總數(shù)。則在組合核函數(shù) k(?,?;γ)導(dǎo)出的特征空間中,訓(xùn)練樣本的類內(nèi)散度矩陣如下式所示:
不失一般性,將故障樣本的類內(nèi)散度特性定義為類內(nèi)散度矩陣的跡,記作Scatter-P=tr[Sw(γ)]。利用核技巧,進(jìn)一步有:
設(shè)訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)分別為DTr和DTe。令。其中,xi∈?d表示訓(xùn)練數(shù)據(jù)實例;d∈?表示xi的維數(shù);yi∈{1,2,…,c}表示xi對應(yīng)的故障模式。令。其中,x′j∈?d表示測試數(shù)據(jù)實例;y′j未知。診斷模型設(shè)計的目的就是基于DTr去尋找一個映射函數(shù) f(?):?d→? ,使其可以將 DTe中的 x′j映射為相應(yīng)的故障模式。當(dāng)采用一般的MK-ELM作為診斷模型求解映射函數(shù) f(?)時,其初始優(yōu)化問題表示為:
假設(shè)在優(yōu)化問題(3)所示的MK-ELM框架下存在一個區(qū)別于原始r個基核的虛擬基核,定義其對應(yīng)的特征映射、核函數(shù)、核矩陣分別為:
式中,ei是一個n維的行向量,且第i個元素為1,其余元素為0;δ(i-j)為單位沖激函數(shù),當(dāng)i=j時等于1,否則為0;I是一個n階的單位矩陣。
將式(5)納入式(4)中,進(jìn)一步得到:
在優(yōu)化問題(6)中有兩個顯著的改進(jìn):(1)通過引入虛擬基核,將正則化因子融入基核權(quán)重優(yōu)化過程中,避免了基于交叉驗證的正則化因子選擇過程;(2)通過將Scatter-P集成到MK-ELM中,使得在最小化訓(xùn)練誤差的同時最小化類內(nèi)離散性,一方面賦予了優(yōu)化過程更加明確的物理意義;另一方面則繼承了集成MEB半徑方法的優(yōu)良特性。
定理1設(shè)τ為任意的正標(biāo)量,對于式(6)所示的目標(biāo)函數(shù)有 J(γ)=J(τγ),并且MK-ELM模型的決策函數(shù)值不受τ的影響。
可以看到,目標(biāo)函數(shù)(8)與目標(biāo)函數(shù)(6)具有相同的形式,所以二者具有相同的目標(biāo)值,即 J(γ)=J(τγ)。設(shè)目標(biāo)函數(shù)(6)的最優(yōu)解為 β?,則目標(biāo)函數(shù)(7)的最優(yōu)解為
所以模型的決策值不會隨著基核權(quán)重γ的縮放而發(fā)生改變。證畢。根據(jù)MK-ELM的決策函數(shù),進(jìn)一步有:
定理2設(shè)有兩個不同范數(shù)約束的優(yōu)化問題:
式中,||?||p表示向量的 p范數(shù)。如果是問題P2的最優(yōu)解,那么必定是問題P1的最優(yōu)解。
由定理2,若問題(10)的最優(yōu)解為 η?,則問題(9)的最優(yōu)解也為 η?。再由定理1,J(η)=J(τγ)=J(γ),所以問題(6)和(9)具有相同的目標(biāo)值,且當(dāng)問題(9)的最優(yōu)解為η?時,問題(6)對應(yīng)的最優(yōu)解為:
同理,將γ?代入MK-ELM決策函數(shù)中,顯然有。所以,通過解優(yōu)化問題(10)來替代解優(yōu)化問題(6),最終決策函數(shù)值不變。
式中,α 和 λ均為拉格朗日乘子,且 α=[α1,α2,…,αn]T,。為了求解模型參數(shù),采用一種兩步交替優(yōu)化的策略。
3.2.1 給定η的條件下求解α
將式(12)代入式(13)中,得到:
式中,Y表示標(biāo)簽矩陣,且Y=[y1,y2,…,yn]T。
3.2.2 給定α的條件下更新η
式中,ηq表示第q個基核在上一次迭代中的權(quán)重表示第q個基核在當(dāng)前迭代中的權(quán)重。將代入到式(15)中即可得到新的組合權(quán)重
當(dāng)通過3.2節(jié)獲得最優(yōu)解α?,η?后,MK-ELM的決策函數(shù)表示為:
在故障電路生成階段,通過變異生成操作將多種故障注入到被測電路(Circuit Under Test,CUT)中,得到一系列不同故障模式下的CUT變異體,故障生成所采用的變異操作如表1所示。其中,PCH為軟故障變異操作,令ε為元件容差值,Θ為標(biāo)稱值,用均勻分布U(0.1Θ,Θ(1-ε))和 U(Θ(1+ε),2Θ)分別表示元件的參數(shù)負(fù)向偏差和正向偏差;ROP、LRB、GRB和NSP為硬故障變異操作,采用均勻分布 U(100 kΩ,1 MΩ)和 U(10 Ω,1 kΩ)分別表示開路狀態(tài)和橋接狀態(tài)對應(yīng)的阻值。將生成的CUT變異體輸入到基于Pspice的仿真器中,以掃頻信號為激勵,得到各CUT的頻率響應(yīng)曲線作為原始數(shù)據(jù)集。
表1 變異操作
設(shè)原始特征集合為FT={g1,g2,…,gnum}。其中,gs表示第s個特征,num表示特征的個數(shù)。通過4.1節(jié),每一類故障都有一個基于FT的num×nl的數(shù)據(jù)集Dl,記。其中,Dl(gs)表示第l類故障在特征gs上的數(shù)據(jù)集。而gs在所有故障上的數(shù)據(jù)集記作
定義1(故障特征間一維模糊度)給定兩個故障Fa和Fb及其各自在特征gs上的概率密度函數(shù)(x)和Fa和Fb在特征gs上的一維特征模糊度定義為兩條概率密度函數(shù)曲線的重疊部分與x軸圍成區(qū)域的面積,如圖1所示,記作:
圖1 模糊度示意圖
定義2(故障特征辨識力)給定兩個故障Fa和Fb及其在特征gs上的一維特征模糊度,則 gs對這兩類故障的辨識力定義為;進(jìn)一步,gs對所有故障模式的辨識力定義為:
定義3(故障特征間的相似度)給定兩個特征gs、gt及其在所有故障模式上的數(shù)據(jù)集 X(gs)和 X(gt);則gs與gt的相似度定義為X(gs)與X(gt)的皮爾遜相關(guān)系數(shù)[14],即:
假定需要選擇d個特征,用FTd表示最終的特征集合?;诙x2、3,結(jié)合最小冗余最大相關(guān)準(zhǔn)則,首先令;然后采用增量搜索算法依次去尋找滿足優(yōu)化條件的特征[15-16]。假設(shè)已經(jīng)得到一個子集FTd-1,當(dāng)前需要從{FT-FTd-1}中選出第d個特征,則對應(yīng)的優(yōu)化條件表示為:
式中,χ>0是一個懲罰因子,用于平衡兩個條件之間的重要性。通過上述的增量搜索過程,最終一組具有預(yù)定規(guī)模的特征集合能被獲得。
為表示方便,將提出的集成特征空間類內(nèi)散度的自適應(yīng)正則化多核診斷模型記作SiAMK-ELM(Scatterincorporated Adaptation MK-ELM)。下面將基于SiAMKELM的診斷流程總結(jié)如下。
步驟1輸入原始仿真數(shù)據(jù);設(shè)置特征選擇個數(shù)d;懲罰因子 χ;基核 {kq(?,?)}以及虛擬基核 kr+1(?,?)。
步驟2由定義1計算Fa和Fb在gs上的一維特征模糊度。由定義2計算gs的辨識力dis(gs)(s=1,2,…,num)。由定義3計算特征gs和gt之間的一維相似度sim(gs,gt)(s,t=1,2,…,num ;s≠t)。
步驟4根據(jù)特征集FTd生成訓(xùn)練樣本集DTr;令h=0,ηh=[1/r,…,1/r,1/C]。計算訓(xùn)練樣本對應(yīng)于基核的核矩陣;利用公式(5)計算基核誘導(dǎo)的特征空間中類內(nèi)散度特性
步驟6根據(jù)特征集FTd生成測試樣本集DTr;對于測試數(shù)據(jù)實例 x′j,計算 kq(xi,x′j)(i=1,2,…,n ;q=1,2,…,r);利用公式(16)計算 f(x′j);利用公式(17)得到x′j所對應(yīng)的故障標(biāo)簽label(xj)。
為證明所提方法有效性,將其與KELM、SVM、SimpleMKL[17]、R-MKL[12]及文獻(xiàn)[4,6]中的方法分別進(jìn)行比較。實驗中,單核方法采用高斯核函數(shù),正則化參數(shù)與核參數(shù)通過網(wǎng)格搜索法得到;多核方法的正則化參數(shù)通過5折交叉驗證得到。基于SVM的算法在處理多分類問題時采用“一對一”的策略;各種方法的診斷性能通過下列指標(biāo)共同評價。
(1)錯正率(False Positive Rate,F(xiàn)PR)=發(fā)生的漏警數(shù)/測試的故障樣本總數(shù)。
(2)錯負(fù)率(False Negative Rate,F(xiàn)NR)=發(fā)生的虛警數(shù)/測試的正常樣本總數(shù)。
(3)故障命中率(Precision)=正確檢測到的故障樣本總數(shù)/檢測到的故障樣本總數(shù)。
(4)故障檢測率(Fault Detection Rate,F(xiàn)DR)=正確檢測到的故障樣本總數(shù)/測試的故障樣本總數(shù)。
(5)分類正確率(Accuracy)=分類正確的樣本總數(shù)/測試的樣本總數(shù)。
該電路被用于詳細(xì)分析SiAMK-ELM模型的診斷性能,其電路結(jié)構(gòu)如圖2所示。
圖2 Sallen-Key帶通濾波電路
仿真實驗共注入14種軟故障,故障描述如表2所示。
表2 Sallen-Key帶通濾波電路故障描述
實驗中掃頻信號設(shè)置為1 Hz~100.1 kHz,最終得到每種故障樣本數(shù)為200,樣本特征數(shù)為1 001的原始數(shù)據(jù)集。將其平分為2組,分別作為訓(xùn)練和測試數(shù)據(jù)集。令χ=0.8,提取出該CUT的診斷特征為FT21=[0.001,9.31,16.12,16.82,17.02,17.42,17.62,18.22,18.32,19.32,20.42,20.82,21.92,23.02,27.73,30.13,30.23,33.33,33.43,70.87,71.37]kHz。多核設(shè)置為 1個線性核,3個多項式核(參數(shù)分別為1,2,3)和8個高斯核(參數(shù)分別為1,2,4,6,8,10,12,14)。采用所有算法分別對該CUT進(jìn)行診斷,提出的SiAMK-ELM的診斷結(jié)果如圖3所示。
圖3 SiAMK-ELM的診斷結(jié)果
由圖3看到,SiAMK-ELM對本案例中的各類故障模式均有較好的區(qū)分能力,對所有故障模式的平均診斷正確率達(dá)到96.4%。其中,對F3、F7、F10和F14均實現(xiàn)了100%的診斷正確率;診斷正確率最低的是F8,其對應(yīng)的正確率為84%。
表3給出了SiAMK-ELM與單核診斷方法的診斷性能比較。由表3看到:(1)對于診斷精度,相比于三種單核方法,SiAMK-ELM將其分別提升了5.13%、7.87%和4.28%。(2)對于時間花費,SiAMK-ELM由于要解多核優(yōu)化問題,因此需要花費更長的時間。(3)對于FPR、SiAMK-ELM較KELM降低了1.36%;對于FNR、SiAMKELM較SVM降低了5%;實現(xiàn)了對漏警、虛警的有效均衡。
表3 與單核診斷方法的診斷性能比較
表4給出了SiAMK-ELM與多核診斷算法的診斷性能比較。由表4看到:(1)在診斷精度上,相比于其余三種算法,SiAMK-ELM將診斷精度分別提升了1.60%、0.60%和0.53%,得到了與其他算法近似一致的診斷精度。(2)在時間花費上,其余三種MKL算法的訓(xùn)練時間分別是SiAMK-ELM的2.10倍、3.60倍和1.84倍。究其原因,首先,ELM作為一種快速的分類算法,相比于SVM更加高效。其次,在SiAMK-ELM中不需要對基核權(quán)重施加任何范數(shù)約束,優(yōu)化過程更加簡潔。再次,SiAMK-ELM中由于正則化因子的自適應(yīng)調(diào)整保證了算法可以更快地達(dá)到收斂。
圖4 Biquad低通濾波電路
表4 與多核診斷方法的診斷性能比較
該電路被用來驗證SiAMK-ELM對不同屬性電路故障的診斷能力,電路結(jié)構(gòu)如圖4所示。仿真實驗共注入故障29個,故障描述如表5所示。
表5 Biquad低通濾波電路故障描述
通過模糊度分析發(fā)現(xiàn),ROP、LRB變異操作下的各故障模式與正常模式的頻率響應(yīng)曲線極其相似。圖5展示了F0與F18在4個頻點上的模糊度值,顯然,F(xiàn)18與F0很難被區(qū)分。為了處理該問題,本節(jié)引入響應(yīng)曲線簇模糊組定義。
圖5 F0和F18在4個頻點上的模糊度值
定義4(響應(yīng)曲線簇模糊組)給定故障Fa和Fb,二者間的最小模糊度定義為設(shè)置閾值ν∈[0,1],若Fa和Fb的最小模糊度滿足 A?a,b≥ν,則稱這兩個故障構(gòu)成一個響應(yīng)曲線簇模糊組。
通過依次設(shè)置 ν等于1.0、0.7、0.5、0.3和0.1,Biquad低通濾波電路的模糊組如表6所示。
表6 不同門限下Biquad電路模糊組
實驗中得到每種故障樣本數(shù)為100,樣本特征數(shù)為1 000的數(shù)據(jù)集。將其平分為兩組,分別作為訓(xùn)練和測試數(shù)據(jù)集。令χ=1,提取出該CUT的診斷特征為FT25=[7.609,10.61,13.01,14.02,14.62,14.82,15.02,15.22,15.42,15.62,15.82,16.02,16.22,16.42,16.62,16.82,17.02,17.22,17.42,17.62,17.82,46.25,46.65,199.8,200]kHz。多核設(shè)置為1個線性核,3個多項式核(參數(shù)分別為1、2、3)和8個高斯核(參數(shù)分別為1、2、4、8、12、60、100、140)。假設(shè)只要診斷結(jié)果為實際故障所在模糊組中的任意一種故障則認(rèn)為診斷正確。不同ν值下各方法的診斷精度如表7所示;而診斷的FNR、FPR、Precision和FDR分別如圖6所示。
圖6 Biquad低通濾波電路診斷結(jié)果比較
表7 Biquad低通濾波電路診斷精度比較
通過表7和圖6可以看到:(1)當(dāng)ν=1,即不考慮模糊組時,三種方法的診斷正確率都比較低,而且虛警率很高,正如提到的F18,此時許多故障模式與正常模式難以被區(qū)分。(2)隨著ν的降低,具有相似特征的故障模式落入同一模糊組中。當(dāng)考慮模糊組時,三種方法的診斷準(zhǔn)確率隨著ν的減小而上升。在不同的模糊組門限下,SiAMK-ELM具有最高的診斷正確率,當(dāng)ν=0.5時,其診斷正確率已達(dá)到88.8%,甚至高于ν=0.1時文獻(xiàn)[6]的診斷精度。(3)在圖6中,SiAMK-ELM在不同ν下具有更低的FNR和FPR,同時具有更高的FDR和Precision,該結(jié)果進(jìn)一步證實了所提方法的有效性。
通過故障注入生成參數(shù)連續(xù)的各類軟故障和硬故障,并考慮非故障元件的參數(shù)容差,本文提出一種新的模擬電路故障診斷方法。針對兩個CUTs的診斷實驗,得到下列結(jié)論:
(1)相比于單核診斷方法,所提方法在平衡漏警、虛警的同時,能夠顯著提升診斷的正確率。當(dāng)引入模糊組概念時,能夠?qū)㈦y以辨識的故障樣本更加準(zhǔn)確地隔離到相應(yīng)模糊組中。
(2)相比于一般的多核診斷方法,所提方法在獲得相似甚至更高的診斷正確率的同時,能夠有效約減診斷時間花費。
(3)所提方法在MKL基礎(chǔ)上將正則化因子直接納入多核優(yōu)化過程中,因此不需要額外的參數(shù)選擇過程,人為干預(yù)因素少,便于操作。
參考文獻(xiàn):
[1]Han H,Wang H J,Tian S L,et al.A new analog circuit fault diagnosis method based on improved mahalanobis distance[J].Journal of Electronic Testing,2013,29(1):95-102.
[2]顏龍,丁鵬,馬峻.基于狼群算法的RBF神經(jīng)網(wǎng)絡(luò)模擬電路故障診斷[J].計算機(jī)工程與應(yīng)用,2017,53(19):152-156.
[3]Tang X F,Xu A Q.Practical analog circuit diagnosis based on fault features with minimum ambiguities[J].Journal of Electronic Testing,2016,32(1):1-13.
[4]Zhang C L,He Y G,Yuan L F,et al.A novel approach for diagnosis of analog circuit fault by using GMKLSVM and PSO[J].Journal of Electronic Testing,Theory and Applications,2016,32(5):531-540.
[5]Ye F M,Zhang Z B,Chakrabarty K,et al.Board-level functional fault diagnosis using multikernel support vector machines and incremental learning[J].IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems,2014,33(2):279-290.
[6]高坤,何怡剛,譚陽紅,等.主成分分析和超限學(xué)習(xí)機(jī)的模擬電路故障診斷[J].計算機(jī)工程與應(yīng)用,2016,52(9):248-252.
[7]Liang Z Z,Zhang L,Liu J.A novel multiple kernel learning method based on the Kullback-Leibler divergence[J].Neural Process Lett,2015,42:745-762.
[8]張鋼,謝曉珊,黃英,等.面向大數(shù)據(jù)流的半監(jiān)督在線多核學(xué)習(xí)算法[J].智能系統(tǒng)學(xué)報,2014,9(3):355-363.
[9]Ye Q,Pan H.Simultaneous fault diagnosis of main retarder using improved paired relevance vector machine based on multi-kernel learning[J].Applied Mechanics and Materials,2014,614:339-344.
[10]Li Y X,Ren C Q,Bo J Y,et al.The application of GMKL algorithm to fault diagnosis of local area network[J].Journal of Networks,2014,9(3):747-753.
[11]Kloft V,Brefeld U,Sonnenburg S,et al.lp-norm multiple kernel learning[J].Journal of Machine Learning Research,2011,12:953-997.
[12]Gai K,Chen G Y,Zhang C S.Learning kernels with radiuses of minimum enclosing balls[C]//Advances in Neural Information Processing Systems,2010:649-657.
[13]Liu X W,Wang L,Huang G B,et al.Multiple kernel extreme learning machine[J].Neurocomputing,2015,149:253-264.
[14]Chudzian P.Evaluation measures for kernel optimization[J].Pattern Recognition Letters,2012,33:1108-1116.
[15]Wu P,Duan F Q,Guo P.A pre-selecting base kernel method in multiple kernel learning[J].Neurocomputing,2015,165:46-53.
[16]Peng H C,Long F H,Ding C.Feature selection based on mutual information:Criteria of max-dependency,max-relevance,and min-redundancy[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(8):1226-1238.
[17]Rakotomamonjy A,Bach F R,Caun S,et al.SimpleMKL[J].Journal of Machine Learning Research,2008,9:2491-2521.