林龍 王賢浪
摘要:針對KFCM算法對初始聚類中心敏感導致聚類效果不好等問題,提出一種基于雜草算法(IWO)優(yōu)化的模糊核聚類算法(IWO-KFCM),將其運用于軸承時頻譜圖的狀態(tài)識別。通過小波變換獲取軸承運行狀態(tài)的時頻圖像,利用灰度梯度共生矩陣提取圖像的紋理特征,提出基于可分性測度構造IWO算法的適應度函數;將IWO算法優(yōu)化獲取的初始聚類中心輸入KFCM,實現時頻譜圖的聚類識別。最后進行多類軸承狀態(tài)數據的測試,驗證所提算法的有效性和優(yōu)越性。
Abstract: KFCM algorithm is sensitive to the initial cluster center and leads tolow cluster accuracy. In this paper , a fuzzy kernel cluster algorithm based on invasive weed optimization (IWO-KFCM) is proposed to identifytime-frequency images. Firstly, time-frequency images of the bearing states are obtained through wavelet transform, and GLCM is used to extract the texture features of images.Low dimensional features of high contribution rates can be selected via PCA. This algorithmdefines separability criterion as an evaluation of fitness function, and IWOseeks the optimal solution as the initial cluster centers of KFCM .Finally, the IWO-KFCMis used to clusterdata,andexperiment results of the mutli-class bearing datasets demonstrate the effectiveness and superiority of the proposed algorithm.
關鍵詞:時頻圖像;灰度梯度共生矩陣;雜草算法;可分性測度;半監(jiān)督KFCM;軸承故障
Key words: time-frequency image;GLCM;invasive weed optimization;separability criterion;semi-supervised KFCM;bearing fault
中圖分類號: TN911;TH113? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1674-957X(2021)02-0117-04
0? 引言
隨著模式識別技術的發(fā)展,將機械設備的振動信號轉化為時頻譜圖進行智能識別的研究不斷深入。時頻譜圖的本質是圖像,既具備構成圖像本身的數字信息,也有顏色、像素、紋理、灰度和形狀等圖形信息,這些信息暗含了設備的運行狀態(tài)及差異。對狀態(tài)圖像進行識別首先需要有效地提取圖像特征,近年來,有關時頻譜圖特征提取的研究層出不窮,如二維線性判別分析、二維主成分分析、二維非負矩陣分解等圖像壓縮算法[1],如提取不變矩特征、紋理特征等特征提取方法,這些方法有效緩解了因圖像維數巨大導致診斷困難的難題。
聚類分析是一種針對樣本相似性進行類別劃分的數值方法,目前已廣泛應用于數據挖掘、圖像處理、故障診斷等領域[2-4]。常用的聚類分析算法有:C均值聚類、模糊C均值聚類(Fuzzy C-Means,FCM)、模糊核聚類(Kernel Fuzzy C-means,KFCM)等。FCM算法通過引入隸屬度對C均值聚類的模式歸屬進行軟化,克服了其準則函數不可微的缺點;KFCM算法在FCM算法基礎上引入核函數,將低維非線性特征投影至高維空間,克服了FCM算法對噪聲野值點敏感的缺陷,提高了算法魯棒性。不過兩種算法依然存在對初始值敏感和易陷入局部最優(yōu)的缺點;同時聚類算法具有無監(jiān)督性。
雜草優(yōu)化算法(Invasive Weed Optimization,IWO)是一種高效的隨機智能優(yōu)化算法,以群體中優(yōu)秀個體來指導種群的進化,以正態(tài)分布動態(tài)改變標準差的方式將由優(yōu)秀個體產生的子代個體疊加在父代個體周圍,再經過個體之間的競爭,得到最優(yōu)個體。雜草算法及其改進算法已廣泛應用于車間調度優(yōu)化、控制器優(yōu)化等領域,其優(yōu)點在于兼顧了群體的多樣性和選擇力度,具有較強的全局搜索和局部搜索[5]能力,相比其他的進化算法擁有更大的搜索空間和更好的性能。在圖像聚類領域,蘇守寶[6]采用IWO算法對圖像數據集的簇中心進行準確定位,動態(tài)確定圖像聚類簇數的最優(yōu)選擇范圍。趙小強等學者提出一種基于擴散映射的IWO- FCM算法,提高了FCM算法的全局搜索能力和收斂速度,并將其運用于化工過程數據分類[7],此后提出了相應的改進算法[8];Zhao等提出一種改進的基于IWO模糊核C均值算法,提升了算法抗噪能力和聚類精度[9]。
本文針對FCM算法和KFCM算法存在的缺陷,結合IWO算法的優(yōu)勢,以軸承時頻譜圖的分類識別為具體問題,提出了一種基于IWO算法的軸承時頻譜圖聚類識別方法。首先對軸承振動信號進行時頻轉化并提取的紋理特征;接著對紋理特征進行PCA分析,獲取低維的數據集;然后通過IWO算法對已知標簽樣本特征進行選擇,在此過程中利用可分性測度定義適應度函數,選擇適應度最佳的樣本優(yōu)化初始聚類中心,并對未知狀態(tài)樣本進行模糊核聚類識別;最后對比KFCM、半監(jiān)督KFCM、IWO-FCM算法,實驗驗證了所提算法具有更好的計算效率和聚類性能。
1? 圖像紋理特征
圖像特征提取的質量直接影響診斷的結果。圖像信息主要體現在灰度、形狀、紋理等方面。針對旋轉機械時頻譜圖的特點,采用反映圖像紋理特征的灰度梯度共生矩陣進行特征提取[10,11]。
灰度-梯度共生矩陣是在歸一化灰度圖像及歸一化梯度圖像上構造的?;诨叶?梯度共生矩陣可以計算各種統(tǒng)計量,包括小梯度優(yōu)勢(T1)、大梯度優(yōu)勢(T2)、灰度分布不均勻性(T3)、梯度分布不均勻性(T4)、能量(T5)、灰度熵(T6)、梯度熵(T7)等15個特征量。由這15組特征,得到一列反映圖像紋理信息的特征向量t=[T1,T2,…T15]。不同特征量具有特定的物理意義,如大梯度優(yōu)勢和小梯度優(yōu)勢可從一定程度上反映圖像灰度變化的劇烈程度。當圖像的灰度變化平緩時,小梯度像素數多,小梯度優(yōu)勢大;反之,則大梯度優(yōu)勢大。盡管灰度-梯度共生矩陣能反映圖形紋理信息,但其冗余信息較多,因此可對特征向量t進行主成分分析,選取貢獻率較大的主成分作為診斷輸入。
2? IWO算法
2.1 雜草算法
雜草算法是2006年Lucas等人提出的一種仿生優(yōu)化算法,可以解決一些復雜非線性問題[12]。其基本思想是模擬雜草入侵過程,選擇適應度最強的個體進行繁衍。雜草算法的描述如下:
2.1.1 種群初始化
生成一定數量的雜草種群P,初始化最大迭代次數itermax、問題維數d、可產生的最大和最小種子數Smax和Smin、非線性指數n,區(qū)間步長初始值σmin和最終值σmax,最大種群數Pmax。
2.1.2 生長繁殖
根據適應性函數計算雜草繁殖的種子數量:
式中f為適應度值,適應性好的個體具有較大的生存機會。
2.1.3 空間擴散
子代個體以父代為中心,σiter為標準差的正態(tài)分布方式進行繁殖擴散,繁殖的子代個體與父代個體形成新的種群。σiter定義為:
式中,σinitial和σfinal為初代和終代群體的分布標準差,σiter隨著iter增大逐漸減少,確保算法前期進行全局搜索(r選擇)和后期進行局部搜索(k選擇)。
2.1.4 競爭排除
根據競爭性法則,按照適應度大小對所有個體排序,選擇前Pmax個適應度最佳的個體保留。
2.1.5 迭代終止
重復2.1.2~2.1.4步直至達到最大迭代次數或者滿足最優(yōu)解條件。
2.2 基于可分性測度的適應度函數構造
雜草的適應性受種群之間的競爭斗爭,種群內部的生存環(huán)境等因素影響;為了體現雜草在不同種群的排異性和同一種群的適應性,本文采用可分性測度來構造適應度函數[13,14]。
3? IWO-KFCM算法
模糊核聚類算法通過一個非線性的核函數將特征映射至高維空間從而線性可分,提升了聚類的魯棒性。
設含有M維特征向量數據集合X={x,i=1,2,…,n}。對其進行聚類,設定為聚類數目為c,第i類聚類中心為vi,uik表示第k個樣本對第i類的隸屬度(0?燮uik?燮1)。定義KFCM目標函數,求解以下最優(yōu)化問題:
在約束條件下,可得隸屬度uik和聚類中心vi的迭代優(yōu)化公式為:
在此基礎上,提出的IWO-KFCM算法步驟如下:
①IWO優(yōu)化測試樣本特征,選擇適應度高的樣本,計算每類中心作為初始聚類中心vi(i=1,2,…,c)。
②確定初始聚類數目c,隸屬度指數m。
③根據當前的聚類中心更新式(9)的隸屬度矩陣。
根據當前的聚類中心和隸屬度矩陣更新式(10)的各個聚類中心。
④重復步驟3,直到隸屬度誤差或迭代次數達到設定值。
基于IWO-KFCM算法的軸承譜圖識別方法流程如圖1所示。
4? 實驗
本文以西儲大學公開的軸承數據集作為算法性能的驗證數據[15]。本文選擇采樣頻率為12kHz,載荷為0.746kW時的驅動端軸承信號進行分析,信號數據包含四種狀態(tài):正常、內圈故障、外圈故障和滾動體故障(故障直徑均為0.1778mm)。其中,各狀態(tài)的數據劃分為20個樣本,總共為80個樣本。
對信號進行小波變換,選擇復morlet小波作為小波基,獲得四類時頻譜圖像并對其灰度化,灰度等級為256,如圖2。圖中橫向為時間坐標,縱向為頻率坐標,由圖2可得,四類圖像具有良好的時頻聚焦性,不同狀態(tài)的圖像頻率分布差異體現在圖像紋理的差異上。正常狀態(tài)與其他三類狀態(tài)灰度分布差異較大,可以明顯區(qū)分;但是滾動體故障狀態(tài)灰度分布與內圈故障、外圈故障狀態(tài)灰度分布存在相似的地方,容易造成人工誤判。因此,通過加入可體現圖像輪廓狀態(tài)的梯度信息,以實現時頻譜圖差異特征的有效提取。
采用sobel算子計算灰度圖像的梯度陣,并進行正規(guī)化,設定正規(guī)化最大灰度和梯度值為64。計算四類圖像的灰度-梯度共生矩陣,提取小梯度優(yōu)勢(T1)、大梯度優(yōu)勢(T2)、灰度分布不均勻性(T3)、梯度分布不均勻性(T4)等15個特征量,生成維數為80×15的特征矩陣。由于每個特征分量的物理意義和特征范圍不同,對特征矩陣進行零均值歸一化處理,圖3為80個樣本的前4個紋理特征值分布。由圖3可得,T1、T3和T4能較好的區(qū)分正常、外圈和滾動體故障,T2能較好區(qū)分正常、外圈和內圈故障;但不同特征量存在一定的冗余現象,T1、T3、T4中內圈故障與滾動體故障特征值分布存在重疊,T2中正常和外圈故障較難區(qū)分。因此,為提升識別的效率,先利用主成分分析選擇特征,累計貢獻率高于95%的前兩主成分作為IWO-KFCM算法的特征輸入。
利用雜草算法對優(yōu)化已知狀態(tài)特征從而獲取初始聚類中心。隨機選擇40個特征,每類樣本10個,設定初始種群個體數40,最大種群個體數80,問題維數2,最大種子數3,最小種子數1,調和指數3,最大和最小方差為0.5和0.01,循環(huán)次數20。在雜草競爭排斥過程中,選擇每類前20個適應度最高的子代進行下一代的繁殖,迭代20次后,計算每次雜草種群可分性測度和如圖4所示。由圖4可得,雜草經過8次迭代后可分性測度和便趨于平穩(wěn),到20次時測度和差值為1.85×10-8,達到穩(wěn)定。此時,輸入的特征樣本分布及四類特征中心如圖5,結果收斂。
采用IWO-KFCM算法進行聚類分析。選擇剩余40個樣本作為測試樣本,設定聚類數n=4,隸屬度參數m=2,高斯核參數?滓=1.5,隸屬度誤差?著=10-5,最大迭代次數為100,以圖2優(yōu)化的初始聚類中心作為輸入建立核聚類模型。為了驗證所提算法的優(yōu)越性,選擇迭代次數、運行時間和聚類準確率作為評價指標,以隨機選擇樣本作為初始聚類中心(即傳統(tǒng)的KFCM算法)和以訓練樣本各類中心作為聚類中心(半監(jiān)督KFCM算法)進行對比計算,交叉驗證10次,計算時間和迭代次數對比結果如表1。由表1可得,KFCM的平均迭代次數和計算時間較另外兩種方法高,這是因為隨機設定中心可能使得初始聚類中心與收斂中心相差較遠,導致搜索成本增加;IWO-KFCM的平均計算時間和迭代次數少于KFCM,略優(yōu)于半監(jiān)督KFCM,說明經IWO優(yōu)化中心的半監(jiān)督模糊核聚類能更快的達到收斂結果,且算法的穩(wěn)定性也較高。統(tǒng)計三種方法的平均聚類正確率,同時對比文獻[10]所提的IWO-FCM算法,結果如圖6所示。由圖6可得,KFCM是一種無監(jiān)督的算法,其聚類準確率較低;半監(jiān)督KFCM和IWO-FCM算法利用了有標簽樣本的初始中心對聚類模型進行指導,其聚類精度均較高;IWO-KFCM算法通過核函數將特征非線性映射至高維空間進行聚類,較IWO-FCM算法降低了對噪聲和野點的敏感程度,多次聚類的準確率均達到100%,較其他三類算法的精度高,多次交叉驗證也說明其具有良好的魯棒性。
5? 總結
將軸承故障診斷問題轉化為故障時頻圖像狀態(tài)識別問題,針對KFCM算法對初始聚類中心敏感問題,提出一種IWO-KFCM算法用于軸承譜圖識別。構造基于可分性測度的雜草適應度函數,選擇適應性最好的特征獲取其類別中心,以此作為KFCM初始聚類中心。對四類軸承時頻圖像狀態(tài)進行聚類識別,對比KFCM算法、半監(jiān)督KFCM算法、IWO-FCM算法,總結如下:
①灰度-梯度共生矩陣能有效地提取圖像紋理特征,但特征信息存在冗余,通過PCA可以實現差異特征選擇。②基于可分性測度的適應度函數在迭代過程中保留了類內距離最小、類間距離最大的特征樣本,從而實現初始聚類中心的優(yōu)化。③IWO-KFCM算法較IWO-FCM算法具有較好的聚類精度,同時其計算效率較KFCM、半監(jiān)督KFCM算法高。
參考文獻:
[1]李巍華,林龍,單外平.基于廣義S變換與雙向2DPCA的軸承故障診斷[J].振動.測試與診斷,2015(03):499-506,592.
[2]唐燕雯.模糊核聚類在船舶故障診斷中的應用[J].艦船科學技術,2016,38(24):151-153.
[3]Rong Zhang, Alexander I. Rudnicky. A Large Scale Clustering Scheme for Kernel K-Means[J]. Computer Science Department, 2002, 4:289-292 vol.4.
[4]孫兆丹,鄭直,張何,姜萬錄.局部均值分解和形態(tài)譜的液壓泵故障診斷方法[J].噪聲與振動控制,2020,40(02):96-101.
[5]于蕾,周忠良,鄭麗穎.基于入侵性雜草優(yōu)化算法的圖像識別的研究[J].計算機工程與應用,2014(16):188-191.
[6]蘇守寶,方杰,汪繼文,王本有. 基于入侵性雜草克隆的圖像聚類方法[J].華南理工大學學報(自然科學版),2008(05):95-100,105.
[7]趙小強,周金虎.一種基于擴散映射的化工過程IWO—FCM數據挖掘算法[J].蘭州理工大學學報,2014,40(3):101-105.
[8]趙小強,周金虎.一種改進的IWO-FCM數據挖掘算法[C].第26屆中國控制與決策會議(2014 CCDC)論文集,2014:4997-5001.
[9]Zhao xiaoqiang, Zhou jinhu. Improved Kernel Possibilistic Fuzzy Clustering Algorithm Based on Invasive Weed Optimization[J]. Journal of Shanghai Jiaotong University(Science),2015,(02):164-170.
[10]潘宏俠,張玉學.基于SST時頻圖紋理特征的供輸彈系統(tǒng)故障診斷[J].振動與沖擊,2020,39(06):132-137,175.
[11]宋偉杰,關山,龐弘陽.基于S變換時頻圖紋理特征的刀具磨損狀態(tài)識別[J].組合機床與自動化加工技術,2018(07):100-103.
[12]Mehrabian A R, Lucas C. A novel numerical optimization algorithm inspired from weed colonization[J]. Ecological Informatics, 2006, 1(4):355-366.
[13]盧洋,王世剛,趙文婷,趙巖.基于離散Shearlet類別可分性測度的人臉表情識別方法[J].吉林大學學報(工學版),2019,49(05):1715-1725.
[14]魏維格,董辛旻,韓捷,郝旺身,王成明.基于圖像識別的齒輪故障診斷方法研究[J].煤礦機械,2016,37(05):166-169.
[15]LOPARO K A . Bearings vibration data set.[2009].[DB/OL]. http://csegroups.case. edubearingdatacenter/pages/welcome-case-western-reserve-university-bearing-data-center-website.