常書源, 趙榮珍, 石明寬
(蘭州理工大學 機電工程學院,蘭州 730050)
在對轉子進行故障診斷時,通常需要從時域、頻域和時頻域等多方面提取故障特征,以盡可能多地獲取故障信息[1]。但這種多域融合的故障特征集往往不可避免地混雜了大量的冗余信息,這無疑增加了后續(xù)算法故障識別的難度,甚至會降低算法的準確性。因此,需用降維方法對高維特征集進行有效的二次特征提取,獲取分類精度高的低維敏感特征矢量[2]。
近年來,在數據科學領域中,關于降維的問題已取得一系列的研究進展,如主成分分析[3](principal component analysis, PCA),局部保持投影[4](locality preserving projection, LPP),半監(jiān)督鄰域自適應正交局部保持投影[5](semi-supervised neighborhood adaptive orthogonal locality preserving projections, SSNA-OLPP),半監(jiān)督鄰域自適應線性局部切空間排列[6](semi-supervised neighborhood adaptive linear local tangent space alignment, SSNA-LLTSA),正交判別投影[7](orthogonal discriminant projection, ODP)等。其中,PCA在最小均方意義下尋找數據的最優(yōu)投影方向。LPP解決了PCA等傳統(tǒng)降維方法無法保持數據非線性流形的缺點,但只注重保持數據的局部結構,對分類問題無指導意義。SSNA-OLPP與SSNA-LLTSA分別為LPP和LLTSA的半監(jiān)督改進方法,能夠利用少量的先驗信息對后續(xù)分類問題起指導作用,但這兩種方法都只關注數據的局部信息,忽略了全局信息,由此可能導致數據結構扭曲。ODP是一種新型監(jiān)督式降維方法,其通過最大化表征全局幾何結構的全局散度矩陣,最小化表征局部幾何結構的局部散度矩陣來尋找最佳投影子空間,因此在對高維數據進行維數約簡時,顯得更加直觀和高效。然而,ODP目前仍存在以下兩個主要缺點:①ODP在維數約簡時,采用的是全局統(tǒng)一鄰域參數,忽略了數據局部幾何結構的差異性,從而影響投影所得低維特征矢量的可分性;②ODP作為監(jiān)督式方法,無法利用大量的無標記樣本,而且在標記樣本不足時會出現過學習問題。
針對上述兩點不足,本文欲通過引入鄰域自適應方法克服ODP使用全局統(tǒng)一的鄰域參數的問題;進一步地,通過引入半監(jiān)督思想,將無標記樣本擴展至ODP的訓練范圍,提出一種半監(jiān)督鄰域自適應正交判別投影(semi-supervised neighborhood adaptive orthogonal discriminant projection, SSNA-ODP)方法。該方法充分利用有標記和無標記數據來構建包含鄰域信息的權重函數,使用有標記數據最大化不同類樣本之間的可分性,使用無標記數據估計數據的內在幾何結構,令其具有較ODP更好的降維能力與魯棒性。
對高維特征集進行降維后,還需采用有效的分類器建立低維特征矢量與故障類別間的對應關系[8]。由于支持向量機[9](support vector machine, SVM)具有魯棒性好,通用性強等優(yōu)點,本文選用SVM來建立低維特征矢量與故障類別間的對應關系?;谏鲜龇治?,本研究擬對SSNA-ODP與SVM結合的轉子故障診斷方法進行探討,欲為高維故障數據集的降維與分類提供一種理論參考依據。
正交判別投影基于圖的拉普拉斯特征譜嵌入,利用數據樣本近鄰點之間的局部信息和類別信息建立了具有判別性的權值函數,并且同時考慮了數據的局部散度和全局散度,具有較好的魯棒性。
假設給定高維數據集X={x1,x2,…,xn}∈RD×n,及其類別信息,其中:n為樣本數;D為特征維數。ODP的主要步驟如下:
步驟1采用歐氏距離度量數據樣本之間的相似性,根據k-近鄰方式選取全局統(tǒng)一的鄰域參數構建鄰域圖G。
步驟2采用式(1)所示的權值函數為鄰域圖G的邊賦權,從而構造出權值矩陣W。
(1)
式中:d2(xi,xj)為xi與xj之間歐氏距離的平方;β為一個可調節(jié)的常數。
步驟3得到W矩陣后,根據式(2)與式(3)分別計算局部散度矩陣SL和全局散度矩陣SN
(2)
(3)
步驟4在線性投影矩陣滿足正交化約束的條件下,建立基于式(4)所示的約束目標函數。
max tr{αATSNA-(1-α)ATSLA}
s.t.ATA=I
(4)
式中,α∈[0,1]為調節(jié)因子,用以調節(jié)不同散度對目標函數的貢獻。
利用拉格朗日乘子法,可將式(4)轉換成求解廣義特征值的問題,即
[αSN-(1-α)SL]A=λA
(5)
由第1章可知,ODP在運行時首先需要選取一個全局統(tǒng)一的近鄰參數k,但樣本的局部分布往往不均勻,統(tǒng)一選取該參數會造成數據的鄰域結構扭曲,進而影響后續(xù)的降維效果;并且ODP屬于監(jiān)督式降維方法,只能利用少量有標記樣本進行學習,從而浪費了大量的無標記樣本。因此,本研究擬從兩個方面對ODP進行改進,提出一種半監(jiān)督鄰域自適應正交判別投影(SSNA-ODP)方法:①構建鄰域圖時,將近鄰概率距離與Parzen窗概率密度估計結合實現對鄰域參數k的自適應調整;②ODP方法的監(jiān)督屬性主要體現于式(1)所示的權值函數,因此,從賦權函數的角度入手,提出一種新的半監(jiān)督權值函數并將其應用于ODP,將無標記樣本擴展到該方法的學習范圍。
近鄰概率距離[10-11]是一種概率距離,在高維空間中能較歐氏距離更精準地描述數據點的分布情況,而Parzen窗概率密度估計[12]能依據樣本分布的概率密度自適應地調整近鄰參數的大小,因此,本文將兩者結合來改進ODP方法的鄰域構建方式,使得樣本點的近鄰參數k能夠依據數據自身分布情況進行自適應調整,更好地反映數據的本質結構。具體方法如下:
給定數據集X={x1,x2,…,xn},設置初始鄰域參數k=k0,窗寬為k0,得到xi初始的鄰域為Nk0(xi)。選用平滑性較好的正態(tài)窗函數,則對于樣本點xi而言,其Parzen窗概率密度估計為
(6)
式中,dist(xi,xj)為樣本點xi與xj的近鄰概率距離,表達式如式(7)所示
(7)
式中:‖·‖為兩點間的歐氏距離;Pij為xi選取xj作為近鄰的概率,滿足Pii=0且數據間的相似度概率和為1,其計算公式見式(8)。
(8)
式中,λ為以xi為中心的高斯分布的方差,與選定的初始鄰域參數有關。
(9)
由式(9)可知,當樣本周圍的數據密度小于平均密度時,k將自動減小,降低了非近鄰或噪聲點對鄰域結構的影響,有利于保持鄰域的局部結構;反之,k將自動增大,避免了因數據缺乏而導致的鄰域結構扭曲。
為了將半監(jiān)督思想引入ODP方法,在式(1)的基礎上,提出一種式(10)所示的半監(jiān)督權值函數,并采用它對自適應鄰域圖GNA的邊賦權,構建權值矩陣S。
(10)
式中,θ=exp[-dist2(xi,xj)/σ],dist2(xi,xj)為根據式(7)與式(8)計算出xi與xj之間概率距離的平方,σ為所有樣本對之間距離均值的平方,由此θ可根據數據結構進行自適應調整。
將dist2(xi,xj)/σ作為自變量,可得到權值Sij關于dist2(xi,xj)/σ的函數圖,如圖1所示。
結合式(10)與圖1可推斷半監(jiān)督權值函數模型具有如下性質:
(1)當自變量相同時,不同權值曲線大小排布為互為近鄰且標記相同>互為近鄰且標記不同>互為近鄰且有一點無標記>其他。近鄰圖中邊的權值表示兩點之間的相似性,權值越大則相似性越高,其所對應的局部散度就越大。因此,從目標優(yōu)化的角度而言,該函數模型具有較好的判別性能。
圖1 半監(jiān)督權值函數圖Fig.1 Semi-supervised weight function graph
(2)奇異點或噪聲點可能與常規(guī)數據點的距離較大,某個點離常規(guī)點的距離越大,則表示該點是奇異點或噪聲點的可能性越大。由圖1可見,隨著距離增大,近鄰點間的權值減小。因此,該函數能夠削弱奇異點或噪聲點對常規(guī)點的影響,提高目標函數的魯棒性。
綜上所述,SSNA-ODP方法具體實現步驟如下:
輸入:D維空間數據樣本集X={x1,x2,…,xnl,…,xn}∈RD×n,其中有標記樣本數為nl,樣本總數為n,降維的目標維數d(d 輸出: 投影轉換矩陣A,低維特征向量Y。 步驟1歸一化處理樣本集X,設定初始近鄰數k0,通過式(6)~式(8)計算出每個樣本點的概率密度估計值,并通過式(9)對鄰域參數ki進行自適應調整,從而構造出自適應鄰域圖GNA。 步驟2利用式(10)對自適應鄰域圖GNA的邊賦權,得到權值矩陣S,并以S代替式(2)與式(3)中的W對局部散度陣SL和全局散度陣SN進行計算。 步驟3將得到的SL和SN代入式(4)構建目標函數,求解式(5)所示廣義特征方程,得到前d個最大特征值所對應的特征向量組成投影轉換矩陣A=[a1,a2,…,ad]。 步驟4根據式Y=ATX,得到低維數據Y。 本文方法在一個典型雙跨度轉子實驗臺上進行實驗驗證,如圖2所示,該方法故障診斷的流程如下: 步驟1采集轉子振動信號,并利用文獻[13]中的混合濾波方法對原始振動信號進行消噪處理,對消噪后的振動信號進行多域多通道特征提取,得到初始高維特征集X。 步驟2將初始高維特征集X進行SSNA-ODP降維,得到低維特征集Y。 步驟3將低維特征集Y輸入SVM進行模式辨識,建立低維特征矢量與故障類別間的對應關系。 圖2 基于SSNA-ODP故障診斷方法流程圖Fig.2 The flow chart of fault diagnosis method based on SSNA-ODP 本研究工作的實驗對象為圖3所示的雙跨度轉子試驗臺。試驗臺共裝有13個電渦流傳感器。其中:1個傳感器設置在電機端,用于采集轉速信號;12個傳感器布置在6個截面處的相互垂直方位,采集不同方位的振動信號。在該設備上分別模擬轉子不對中、質量不平衡、動靜碰磨、軸承松動和正常運轉五種狀態(tài)實驗。設置采樣頻率為5 000 Hz,轉速為3 000 r/min,采集各種狀態(tài)類型數據樣本80組,其中20組作為訓練樣本,60組作為測試樣本。對每個通道采集的信號按表1所示的參數提取特征,擴展至12個通道,構造12×26=312維的混合域特征集,其構造方式見表2。 表1 特征參數 圖3 雙跨度轉子實驗臺Fig.3 Double-span rotor test bench 表2 初始高維特征集 將高維特征集輸入SSNA-ODP進行維數約簡,再通過SVM進行模式識別。使用SSNA-ODP降維時,訓練樣本中含標記信息和未含標記信息的樣本按1 ∶4比例隨機分配。經多次實驗,設置鄰域參數初始值為k0=7,調節(jié)因子為α=0.3。為保留高維特征集中的本質信息,降維目標維數d的選取參考文獻[14],統(tǒng)一設置d=故障類別數-1=4。實驗將從以下4個角度對所提方法的有效性進行驗證。 4.2.1 可視化降維效果與故障辨識結果對比 將高維特征集輸入SSNA-ODP中進行維數約簡,作為比較,分別采用LPP、SSNA-OLPP、ODP、SS-ODP(semi-supervised-ODP)、NA-ODP (neighborhood adaptive-ODP)五種方法對原始高維特征集進行降維(由于小樣本問題,其中LPP和SSNA-OLPP經過PCA預處理),測試樣本經上述六種方法降維后的前三個主分量的低維嵌入效果見圖4。 分析圖4可知,LPP對碰磨、松動、正常三種聚類效果較為明顯,但不對中和不平衡之間存在混疊現象,不平衡狀態(tài)未能實現較好聚類。ODP、SS-ODP和NA-ODP降維后各故障狀態(tài)分離,但類內散度較大,類間距較小。SSNA-OLPP降維后只有碰磨狀態(tài)完全分離,不對中與不平衡之間、松動與正常之間均存在混疊。SSNA-ODP降維后的聚類與分類效果最好,可將五種狀態(tài)完全區(qū)分開,且故障類別之間具有較高的區(qū)分度。 為定量評價文中所提出方法的性能,采用李霽蒲等研究中類間離散度與類內離散度的相關比值Je為評價指標,進行方法的有效性評估。Je越大,說明分離效果越好。分別計算基于用不同方法降維所得低維特征集的Je值,結果如表3所示。 由表3可知,LPP降維效果最差,類內離散度較大,類間離散度較小。SSNA-ODP相對于其他方法具有明顯的優(yōu)勢,評價指標Je達到36.406 0,遠大于其他方法。將上述六種方法降維后得到的低維特征子集輸入SVM分類器中進行故障模式辨識。SVM中核函數選取徑向基核函數(RBF型),選擇核參數ε= 1,懲罰參數C=1。訓練得到不同方法降維后各類故障的識別精度如表4所示(表中G1~G5分別表示轉子不對中、質量不平衡、動靜碰磨、軸承松動及正常轉動五種狀態(tài))。 表3 六種方法類間類內評價指標 分析表4可知: (1)LPP的辨識精度相對較低,這是由于LPP是無監(jiān)督方法,降維過程中無法利用有標記數據中蘊含的先驗信息,易造成誤學習現象。 (2)SSNA-OLPP的平均識別率高于LPP方法,這是因為前者是半監(jiān)督降維方法,運行時能夠同時利用有標記數據和無標記數據指導降維過程。但SSNA-OLPP未考慮數據的全局結構信息與判別信息,因此其識別精度低于ODP。 (3)SS-ODP與NA-ODP的平均識別率均高于ODP方法,并且將鄰域自適應和半監(jiān)督同時與ODP方法結合的降維識別效果要優(yōu)于僅將鄰域自適應或半監(jiān)督與ODP結合,表3中的評價指標亦可佐證此點。 (4) SSNA-ODP識別精度達到最高,這是由于其采用近鄰概率距離作為距離度量函數,得到的距離更精確,且將半監(jiān)督學習和鄰域自適應與算法結合,構建的低維流形更能表征數據的本質信息,使降維后獲得的低維特征集具有更好的可分性。 表4 降維方法及其SVM辨識準確率 圖4 測試樣本基于不同方法的降維效果Fig.4 The test sample results based on different methods of dimensionality reduction 4.2.2 SSNA-ODP處理少標記樣本性能與穩(wěn)定性驗證 為驗證SSNA-ODP綜合利用有標記與無標記樣本的能力,即測試訓練樣本中有標記樣本與無標記樣本比例對降維效果的影響。設置訓練樣本與測試樣本比例為20/60不變(去除小樣本因素影響),分別依次增加各類故障有標記樣本的數目,設置各狀態(tài)有標記訓練樣本分別為 2個、4個、6個、8個、10個、15個、20個。采用SSNA-ODP等方法訓練降維,并將所得低維測試樣本輸入SVM進行分類,得到的平均識別率見圖5。 圖5 有故障標記數目對故障診斷的影響Fig.5 The influence of fault labeled number for fault diagnosis 分析圖5可知: (1)隨著有標記樣本數的增加,除LPP外的五種方法平均識別率隨之增加,這是因為隨著有標記樣本個數的增加,訓練樣本中先驗信息就越多,過學習現象隨之減少,故障識別率增加。而LPP屬于無監(jiān)督方法,無法利用有標記樣本中所含的先驗信息,因此有標記樣本數的變化對其沒有影響。 (2) ODP和NA-ODP受故障標記影響較大,識別率變化較明顯,這是由于這兩種方法作為監(jiān)督式方法,嚴重依賴故障標記信息,在標記信息不足的情況下泛化性較差,會產生過學習問題,導致識別率下降。 (3)半監(jiān)督方法的穩(wěn)定性較好,其中SSNA-ODP識別準確率一直高于其他方法,即使在有標記樣本較少的情況下也能獲得較高的故障辨識精度,克服了ODP方法在有標記樣本較少時的過學習問題。進而說明該方法在處理有標記故障樣本較少時的優(yōu)越性。 改變訓練樣本與測試樣本的比例,以進一步驗證本文所提方法的穩(wěn)定性 (采用半監(jiān)督方法降維時訓練樣本中有標記樣本與無標記樣本比例為1 ∶4不變),設置訓練樣本數/測試樣本數為10/70,20/60,30/50,40/40,50/30,60/20,70/10。并得六種方法的低維測試樣本輸入SVM分類器所得的平均識別率,見圖6。 圖6 不同訓練樣本數對應的平均識別準確率Fig.6 The average recognition accuracy of different training sample 從圖6中可以看出,總體上,降維方法的辨識精度均隨訓練樣本數的增加而增加,這是由于訓練樣本越多,其中所包含的判別信息就越多,因此故障識別率得到一定提升。除SSNA-ODP與SS-ODP外,其余四種方法在訓練樣本較少的情況下,準確率下降明顯。其中,SSNA-ODP的穩(wěn)定性能最好,即使在訓練樣本較少情況下也能取得較高的識別率。 4.2.3 SSNA-ODP的抗噪性能驗證 為驗證本文方法的抗噪能力, 將樣本集混入干擾系數為g=0.1, 0.3, 0.5, 0.7的四種隨機噪聲, 基于不同降維方法的SVM識別率如圖7所示。 圖7 不同方法在四種隨機噪聲干擾下的平均識別準確率Fig.7 Average recognition accuracy of different methods under four kinds of random noise interference 由圖7可知,隨著干擾系數遞增,所有降維方法的平均識別率總體都隨之下降,其中LPP的識別率受影響最大。SSNA-ODP的識別精度在不同的干擾情況下受影響相對最小,說明本文方法具有穩(wěn)定的抗噪能力與較好的魯棒性。 4.2.4 變工況下SSNA-ODP的降維性能驗證 為驗證SSNA-ODP在變工況下的降維能力,分別設置轉速為2 800 r/min,3 000 r/min,3 200 r/min和3 400 r/min的四種工況。取40組3 000 r/min數據作為訓練樣本,再分別取40組四種工況下數據為測試樣本進行實驗。各工況振動數據經LPP、ODP、SSNA-OLPP、SSNA-ODP四種方法降維后的SVM辨識結果見表5。 表5 不同方法在變工況下的SVM辨識結果 由表5可知,變工況下(2 800 r/min,3 200 r/min和3 400 r/min)基于不同降維方法的平均識別率均有所降低,但本文方法的識別精度優(yōu)于其他三種方法,并且降低幅度較小,說明本文方法具有較好的適應性。 本文提出了一種基于SSNA-ODP的轉子故障診斷方法。該方法引入半監(jiān)督思想,在降維時充分利用有標記和無標記數據來構建包含鄰域信息的權重函數,使用有標記數據最大化不同類樣本之間的可分性,使用無標記數據估計數據的內在幾何結構,改善了數據的可區(qū)分度;同時,針對ODP方法中采用統(tǒng)一鄰域參數的不足,將近鄰概率距離作為相似性度量,利用Parzen窗估計樣本點的空間分布情況從而自適應地調整鄰域參數,可更有效地挖掘出數據的低維本質流形。利用 SSNA-ODP 對從高維特征集進行維數約簡,將投影得到的低維特征輸入SVM 進行分類,結合 SSNA-ODP 的降維能力和 SVM 的模式識別優(yōu)勢,可對轉子故障進行有效的診斷,提高了識別準確率,為轉子故障診斷提供了一種新的解決思路。3 基于SSNA-ODP的故障診斷方法
4 實驗結果與分析
4.1 實驗數據說明
4.2 應用情況與分析
5 結 論