蔣 偉,王 挺,盛 文,魯 力
(空軍預(yù)警學(xué)院 防空預(yù)警裝備系, 武漢 430019)
T/R組件作為相控陣雷達的重要組成部分,主要擔負通過雷達天線向外輻射能量,并接收目標的回波信號,同時依靠環(huán)行器、移相器、衰減器等輔助電路實現(xiàn)發(fā)射信號和接收信號在空中合成的作用[1-3],隨著T/R組件的集成度越來越高,其故障率也隨之增長。相控陣雷達T/R組件數(shù)量龐大,少則幾百,多則上千上萬。
相控陣雷達T/R組件的結(jié)構(gòu)比較復(fù)雜,對使用條件的要求也非常高,因此對后續(xù)的使用保障和維修工作提出了更高的要求。為了對后續(xù)的使用保障提供理論依據(jù),需要對T/R組件的可靠性進行分析研究,得到T/R組件運行時間和可靠度之間的關(guān)系。在可靠性分析中,壽命分布建模是一種常用的數(shù)學(xué)方法[4],目前在判斷一組可靠性數(shù)據(jù)的分布類型方面,主要有以下幾種方法:1.最小誤差法[5],即選取幾個通??赡艿姆植碱愋停缓笥每煽啃詳?shù)據(jù)分別進行擬合,當中誤差最小的就是所求的分布類型;2.圖形法[6],即將可靠性數(shù)據(jù)映射到圖形中,若該數(shù)據(jù)與某一特定分布數(shù)據(jù)圖形相一致,則該分布為所求的分布類型;3.智能識別方法,當前壽命分布的智能識別算法很多,比如文獻[7]提出一種智能復(fù)合結(jié)構(gòu),能夠?qū)ΤR姷膸追N壽命分布進行識別,且識別率達到90%以上;文獻[8]提出了一種基于最大隸屬優(yōu)勢準則的變量汞壽命分布識別方法,具有較高的可信度;文獻[9]利用BP神經(jīng)網(wǎng)絡(luò)對可靠性數(shù)據(jù)進行壽命分布識別,文獻[10]利用經(jīng)典分布擬合法、最大熵值法、多項式逼近法和正態(tài)信息擴散法對巖土參數(shù)的概率分布進行推斷,但上述方法中,最小誤差法和圖形法可能出現(xiàn)有多個分布同時滿足要求的情況和BP神經(jīng)網(wǎng)絡(luò)收斂速度慢等問題。因此本文首先根據(jù)可靠性數(shù)據(jù)的特點,對其樣本的峰度、偏度、累積概率、分位數(shù)等特征進行提取,然后利用核主成分分析法對數(shù)據(jù)特征進行降維,并構(gòu)造了可靠性數(shù)據(jù)概率分布特征的訓(xùn)練樣本,最后運用多分類支持向量機模型對數(shù)據(jù)的概率分布進行模式識別。
根據(jù)壽命分布數(shù)據(jù)的特點可知,其統(tǒng)計特征主要包括:極差、標準偏差、變異系數(shù)、算數(shù)平均值、中位數(shù)、眾數(shù)、峰度、偏度、累積概率。在對T/R組件壽命分布樣本進行構(gòu)建時,根據(jù)文獻[9]以及通過反復(fù)研究試驗,結(jié)果表明當選取峰度、偏度、變異系數(shù)、累積概率、中位數(shù)作為樣本的主要特征進行提取時,能夠得到更好的分類效果,因此本文選取峰度、偏度、變異系數(shù)、累積概率、中位數(shù)作為數(shù)據(jù)樣本的特征。
在對T/R組件壽命分布數(shù)據(jù)進行識別時,首先要對其可能的分布模式進行選取,根據(jù)T/R組件所屬的器件類型為電子器件,且根據(jù)工程實際情況,選取指數(shù)分布、正態(tài)分布、威布爾分布、對數(shù)正態(tài)分布四種分布類型為可能的分布模式類別。
1) 從可靠性數(shù)據(jù)中獲取數(shù)據(jù)特征信息,將其表示為m×n矩陣,其中m為樣本組數(shù),n為特征屬性個數(shù)。
(1)
2) 選取合適的核函數(shù),并計算核矩陣K,本文在建模時選取徑向基(RBF)核函數(shù):
(2)
式中:xi,xj為輸入空間的樣本,δ1為核參數(shù)。
3) 對核矩陣K進行修正,得到矩陣Kp,計算矩陣Kp的特征值V和特征向量D。
4) 將特征值按降序排列,同時調(diào)整對應(yīng)的特征向量。
5) 計算特征值的累積貢獻率Rc,并給定最小提取閾值,提取t個主元分量α1,α2,…,αt。
6) 計算在提取的特征向量上的投影,Y=Kp·α,其中α=α1,α2,…,αt,Y即為所得的降維后的數(shù)據(jù)。
支持向量機在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢[14-16]。
二分類支持向量機的基本思想為:首先通過非線性變換將輸入變量空間映射到一個高維空間,然后在這個高維空間中求取最優(yōu)線性分類面,最優(yōu)分類線的選取原則為不但能將兩種類別無錯誤分類,而且要使兩種類別的分類間隙最大,最優(yōu)分類線如圖1所示。
圖1中,○和▲分別為兩類樣本,H為把兩類樣本無錯誤分開的最優(yōu)分類線,H1和H2分別為經(jīng)過各類樣本且離最優(yōu)分類線最近的平行于最優(yōu)分類線的直線,H1和H2之間的距離稱為分類間隙,將圖1推廣到高維度空間,最優(yōu)分類線就變?yōu)樽顑?yōu)分類面。
支持向量機其實為一個二類分類器,但為了能夠?qū)崿F(xiàn)對多種類型進行分類,主要方法就是訓(xùn)練多個二分類器,當前多分類實現(xiàn)方式主要有以下兩種方法:1).一對多,即對于給定的m個類別,需要訓(xùn)練m個分類器,其中分類器i是將i類數(shù)據(jù)設(shè)置為類1(正類),其他所有m-1個i類以外的類共同設(shè)置為類2(負類),因此對于每一類都要訓(xùn)練一個二分類器,最后總共需要m個二分類器。對于一個即將要進行分類的數(shù)據(jù)X,用分類器i對數(shù)據(jù)進行分類,如果獲得的是正類結(jié)果,就說明數(shù)據(jù)X屬于i類,如果獲得的是負類結(jié)果,則說明數(shù)據(jù)X不屬于i類,如此反復(fù)最終得到數(shù)據(jù)X的類別屬性。2).多對多,即對于給定的m個類別,對m個類別中的每兩個類都訓(xùn)練一個分類器,總共二分類器的個數(shù)為m(m-1)/2。對于數(shù)據(jù)X,它需要經(jīng)過所有分類器的識別,最終確定所屬的類別,該方法與“一對多”方法相比,需要的分類器較多。本文利用Matlab軟件中的libsvm工具包,選用多對多方法進行分類,并利用網(wǎng)格搜索的方法確定錯分懲罰因子gam和徑向基核函數(shù)的參數(shù)δ2。
根據(jù)上述核主成分降維分析方法以及多分類支持向量機模型可建立一套完整的T/R組件壽命分布識別流程,具體的流程為:
1) 確定初始訓(xùn)練樣本集。根據(jù)1.2節(jié)所選取的四種分布類型,并選定四種分布參數(shù),利用Matlab軟件,產(chǎn)生四種分布的隨機數(shù),求出每組隨機數(shù)的數(shù)據(jù)特征,并進行歸一化處理,將處理后的數(shù)據(jù)作為初始訓(xùn)練樣本集;
2) 利用核主元分析法進行降維處理。通過建立的核主元模型對初始訓(xùn)練樣本集進行主元特征降維處理,設(shè)置累積貢獻率為0.95,當累積貢獻率到達0.95時,確定主元特征數(shù)量,并把輸出的特征向量作為后續(xù)支持向量機模型的訓(xùn)練樣本;
3) 多分類支持向量機的參數(shù)設(shè)置及樣本訓(xùn)練。設(shè)置SVM模型中的初始參數(shù),然后將四種類型分布的隨機數(shù)經(jīng)過特征提取和降維后,分為訓(xùn)練樣本和測試樣本輸入到模型中,判斷識別率β是否達到要求,若未達到則修改模型初始參數(shù),直到識別率滿足要求為止;
4) 實例仿真識別。對T/R組件的壽命數(shù)據(jù)進行特征選取,并經(jīng)主成分分析法提取主元特征,構(gòu)成待識別壽命分布樣本;
5) 驗證識別結(jié)果的正確性。與傳統(tǒng)假設(shè)檢驗識別方法進行比較,驗證所建立模型的正確性。
具體流程圖如圖2。
在對T/R組件壽命分布數(shù)據(jù)進行識別時,1.2節(jié)已經(jīng)選取了指數(shù)分布、正態(tài)分布、威布爾分布、對數(shù)正態(tài)分布四種分布類型為可能的分布類型,為了更好地分析四種概率分布的形狀及細節(jié)特點,本文對四種分布的具體參數(shù)細分,得到了100種分布模式,如表1所示。
表1 100組分布模式
利用Matlab仿真軟件產(chǎn)生上述100組分布模式的100個隨機數(shù),然后求出每組隨機數(shù)的數(shù)據(jù)特征:峰度、偏度、變異系數(shù)、累積概率、中位數(shù),將處理后的數(shù)據(jù)作為初始訓(xùn)練樣本集,部分初始訓(xùn)練樣本集如表2所示。
表2 部分初始訓(xùn)練樣本集
根據(jù)上述第2節(jié)中所建立的主元分析法步驟,對初始訓(xùn)練樣本數(shù)據(jù)(100×10維矩陣)進行主元特征提取,核函數(shù)選擇徑向基核函數(shù),經(jīng)過仿真試驗,本文δ1取值為100時,前4個核主元的方差累積貢獻率達到97.17%,如圖3所示。因此主元個數(shù)選取為4個,然后將初始訓(xùn)練樣本在主元方向上對應(yīng)的特征向量作為后續(xù)多分類支持向量機模型的輸入量。
本文按照3.2節(jié)多分類支持向量機的實現(xiàn)算法編寫Matlab程序,構(gòu)建了多分類支持向量機壽命分布識別模型,其中對錯分樣本懲罰程度的可調(diào)參數(shù)gam和徑向基核函數(shù)的參數(shù)δ采用網(wǎng)格搜索的方法確定具體取值為gam=5.656 9,δ2=16,設(shè)置樣本分類數(shù)為4類。本文在對模型進行訓(xùn)練時,將100組數(shù)據(jù)樣本進行主元特征提取,然后將提取后的主元特征向量作為多分類支持向量機的訓(xùn)練樣本,其中20組數(shù)據(jù)作為測試樣本,測試樣本的識別率達到95%,所建立的多分類支持向量機模型對測試樣本的具體識別結(jié)果如圖4所示。
為了說明核主元降維分析法的作用,將100組未經(jīng)過核主元分析法的測試樣本輸入到多分類支持向量機模型,測試樣本的識別率達到100%,具體識別結(jié)果如圖5所示。
圖4為經(jīng)過核主元降維后的測試樣本識別結(jié)果,圖5為未經(jīng)過核主元降維后的測試樣本識別結(jié)果,雖然兩者的識別精度有略微差別,但總體識別精度都在95%以上。經(jīng)過核主元降維后的樣本數(shù)據(jù)降低到4維,輸入到多分類支持向量機模型中大大減少了運算時間。上述仿真結(jié)果表明,利用核主元分析法可以對訓(xùn)練樣本數(shù)據(jù)進行降維,對后續(xù)多分類支持向量機模型識別方面大大降低了運算時間,因此在保證一定識別精度的前提下(識別精度在90%以上),經(jīng)過核主元分析降維方法能夠降低運算時間,相比于未經(jīng)過核主元降維的方法,更具優(yōu)越性。
本文對100組T/R組件進行壽命試驗,對該100組T/R組件的首次失效時間進行記錄,記錄的失效時間依次為:13 524 h、23 722 h、2 938 h、5 036 h、8 062 h、5 597 h、11 882 h、3 330 h、6 079 h、5 356 h、57 h、6330 h、21 381 h、1 504 h、436 h、11 995 h、2 734 h、1 855 h、4 284 h、13 647 h、1 910 h、903 h、829 h、6 539 h、14 162 h、2 120 h、1 041 h、2 458 h、3 037 h、7 515 h、9 284 h、1 632 h、2 412 h、3 624 h、3 590 h、4 248 h、1 822 h、13 985 h、3 675 h、2 097 h、6 786 h、4 715 h、5 485 h、1185 h、1 351 h、1 795 h、2 366 h、4 219 h、9 074 h、8 010 h、1 817 h、660 h、3 625 h、7 836 h、385 h、4 054 h、2 920 h、7 737 h、542 h、4 906 h、4822 h、5 213 h、7 175 h、8 495 h、2 560 h、6 487 h、262 h、2 267 h、4 322 h、6 044 h、14 717 h、379 h、4 052 h、2 684 h、179 h、9 564 h、12 179 h、333 h、582 h、238 h、5 138 h、587 h、3 381 h、3 693 h、854 h、6 172 h、4 335 h、17 538 h、5 894 h、776 h、4 543 h、7 507 h、4 195 h、486 h、268 h、6 684 h、9 932 h、353 h、22 316 h、10 523 h。利用Matlab軟件計算出該組數(shù)據(jù)的10個數(shù)據(jù)特征分別為1.764 8、7.921 8、0.954、1 473.8、2 277.6、3 405.2、4 565.3、6 070.2、8 476、10 815。然后對該10個數(shù)據(jù)特征進行核主元分析,將核主元降維后的數(shù)據(jù)輸入到多分類支持向量機模型,得到最終的分類結(jié)果符合指數(shù)分布。
利用極大似然估計法對T/R組件的壽命分布數(shù)據(jù)進行參數(shù)估計,置信度設(shè)置為95%,求出不同假設(shè)分布的參數(shù),并用k-s檢驗方法進行檢驗,具體結(jié)果如表3所示。
表3 分布參數(shù)擬合和k-s檢驗
分析表3的結(jié)果可知,利用極大似然估計和k-s檢驗統(tǒng)計法得到的最終壽命分布結(jié)果和本文建立的核主元降維-多分類支持向量機模型的分布識別結(jié)果一致,驗證了模型的正確性。由于傳統(tǒng)的極大似然估計和k-s檢驗統(tǒng)計法在對壽命分布進行識別時,有可能出現(xiàn)多種分布同時滿足要求,這就需要進一步細分,增加了復(fù)雜程度,而本文建立的核主元降維-多分類支持向量機模型能夠在保證一定識別精度條件下,最大限度降低運算速度,降低模型復(fù)雜程度。
與傳統(tǒng)極大似然估計和k-s檢驗統(tǒng)計法相比,本文所采用的核主元降維-多分類支持向量機模型分類精度高,能夠降低模型的運算速度,更具優(yōu)勢性。