孟洪顏,胡玉坤,馮 雙,周 冬,王艷春,*
(1.齊齊哈爾大學(xué) 通信與電子工程學(xué)院,黑龍江 齊齊哈爾 161006;2.黑龍江大學(xué) 電子工程學(xué)院,哈爾濱 150080;3.朝陽師范高等??茖W(xué)校,遼寧 朝陽 122600;4.齊重?cái)?shù)控裝備股份有限公司電控設(shè)計(jì)部,黑龍江 齊齊哈爾 161005)
滾動(dòng)軸承作為機(jī)械工業(yè)的關(guān)鍵基礎(chǔ)部件,廣泛應(yīng)用于航空航天、冶金、電力汽車工業(yè)、數(shù)控機(jī)床等領(lǐng)域。滾動(dòng)軸承是旋轉(zhuǎn)機(jī)械中容易發(fā)生故障的零部件之一[1]。在工業(yè)物聯(lián)網(wǎng)大型機(jī)械的故障中,軸承缺陷占比達(dá)40%;在小型機(jī)械故障中,軸承缺陷的占比為90%[2]。滾動(dòng)軸承一般由內(nèi)圈、外圈、滾動(dòng)體和保持架組成,當(dāng)出現(xiàn)部分損壞或缺陷時(shí),輕則設(shè)備產(chǎn)生噪聲、振動(dòng)異常,重則導(dǎo)致故障停機(jī),影響生產(chǎn),造成財(cái)產(chǎn)和經(jīng)濟(jì)損失,因此對(duì)于旋轉(zhuǎn)機(jī)械的軸承進(jìn)行及時(shí)的監(jiān)測和故障診斷至關(guān)重要[3]。
依據(jù)數(shù)據(jù)是否有標(biāo)簽,機(jī)器學(xué)習(xí)的方式可分為有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。有監(jiān)督學(xué)習(xí)方法在訓(xùn)練模型時(shí)需要特征數(shù)據(jù)和數(shù)據(jù)所對(duì)應(yīng)的標(biāo)簽。而無監(jiān)督學(xué)習(xí)方法只需要特征數(shù)據(jù),不再需要與之對(duì)應(yīng)的標(biāo)簽,省去了大量人工標(biāo)注的工作[4-5]。聚類算法是無監(jiān)督學(xué)習(xí)中常用的算法,已有研究采用K-means及改進(jìn)的K-means聚類算法進(jìn)行軸承故障診斷的模式識(shí)別,在此基礎(chǔ)上進(jìn)行神經(jīng)網(wǎng)絡(luò)的無監(jiān)督學(xué)習(xí)或半監(jiān)督學(xué)習(xí)。文獻(xiàn)[6-7]介紹了采用K-means方法從振動(dòng)信號(hào)中學(xué)習(xí)特征,用來降低特征參數(shù)的空間維數(shù)。文獻(xiàn)[8-10]研究的高速列車或旋轉(zhuǎn)部件的軸承,采用不同的信號(hào)特征提取方法。文獻(xiàn)[11-13]針對(duì)軸承振動(dòng)數(shù)據(jù)量大,K-means聚類的局限,分別提出了Bi-K-Mean聚類算法、基于Spark的并行蟻群優(yōu)化(ACO)-K-Means聚類算法、K-means++的無監(jiān)督學(xué)習(xí)機(jī)制和改進(jìn)的混合遺傳算法K 值聚類,提高聚類的效率,并用于軸承系統(tǒng)的診斷。文獻(xiàn)[14]從軸承振動(dòng)信號(hào)提取時(shí)頻域信號(hào),用K-means聚類算法定義不同的退化狀態(tài),建立卷積神經(jīng)網(wǎng)絡(luò)識(shí)別模型。文獻(xiàn)[15]采用自編碼器結(jié)構(gòu)進(jìn)行特征提取,將距離度量學(xué)習(xí)和K-means聚類方法集成到無監(jiān)督學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,該方法不僅在標(biāo)記數(shù)據(jù)較少的半監(jiān)督學(xué)習(xí)任務(wù)中取得了良好的診斷性能,而且適用于純無監(jiān)督學(xué)習(xí)問題。文獻(xiàn)[16]針對(duì)從原始數(shù)據(jù)中提取的特征值,使用K-means算法獲取標(biāo)簽,將原始振動(dòng)數(shù)據(jù)轉(zhuǎn)換為小正方形圖像,送入到設(shè)計(jì)的CNN神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行旋轉(zhuǎn)系統(tǒng)的磨損水平分類和診斷。雖然上述和K-means有關(guān)的算法已用于軸承的故障的模式識(shí)別,但相關(guān)的K-means算法實(shí)現(xiàn)復(fù)雜或收斂不佳。
針對(duì)上述問題,考慮到實(shí)際工作場景中,面對(duì)軸承振動(dòng)數(shù)據(jù)量大,占用資源較多等問題,提出基于改進(jìn)的K-means聚類和深度神經(jīng)網(wǎng)絡(luò)的軸承故障診斷算法,針對(duì)K-means采用隨機(jī)初始化聚類中心,易造成故障類別間重疊、分類隨機(jī)的缺點(diǎn)。擬采用抽取小樣本分層聚類,采用濾波和統(tǒng)計(jì)密度的方法找出簇的中心點(diǎn),進(jìn)行初始化中心的K-means聚類。同時(shí),建立基于聚類偽標(biāo)簽的深度神經(jīng)網(wǎng)絡(luò)滾動(dòng)軸承故障診斷的模型,使用具有偽標(biāo)簽的新數(shù)據(jù)集對(duì)模型進(jìn)行訓(xùn)練和優(yōu)化;使用常用的聚類評(píng)價(jià)指標(biāo)和加入噪聲的方法,研究了提出算法的聚類性能和模型的準(zhǔn)確性、穩(wěn)定性。
K均值聚類算法是 Macqueen 在 1976 年提出的一種無監(jiān)督學(xué)習(xí)方法[4,17],該算法需要隨機(jī)生成或指定k個(gè)中心點(diǎn),可通過對(duì)數(shù)據(jù)的迭代計(jì)算找出聚類中心,依據(jù)樣本間的相似性將樣本聚集到k個(gè)簇中,簡單高效地找出簇與簇的中心。
算法的基本流程如下:
1)設(shè)樣本X= (x1,x2,…,xn),每個(gè)樣本有m個(gè)維度的特征,Xi=(x1,x2,…,xm),樣本為n*m的矩陣。隨機(jī)選取(指定)k個(gè)樣本數(shù)據(jù),得到初始聚類中心集C= {c1,c2,…,ck} 。
2)計(jì)算每個(gè)樣本到每個(gè)初始聚類中心的歐氏距離:
(1)
式中:xi為第i個(gè)樣本 (1≤i≤n);cj為第j個(gè)簇中心,1≤j≤k;xit為第i個(gè)樣本的第t個(gè)特征,1≤t≤m;cjt為第j個(gè)簇中心的第t個(gè)特征。
3)按照樣本到簇中心距離的大小分配到距離最近的簇中心所在的簇內(nèi),得到k個(gè)簇{C1,C2,…,Ck} 。
重新計(jì)算簇的中心點(diǎn),中心點(diǎn)坐標(biāo)就是簇內(nèi)所有樣本的各維度的均值,計(jì)算公式為
(2)
式中:cl為第l個(gè)聚類中心,1≤l≤k;|Cl|為第l個(gè)類簇中樣本的個(gè)數(shù);xi為第l個(gè)簇中第i個(gè)樣本,1≤i≤Cl。
4)重復(fù)步驟2)和步驟3),直至類中簇的中心無變化或達(dá)到指定迭代次數(shù)。
K-means聚類算法是一種典型的無監(jiān)督機(jī)器學(xué)習(xí)方法,但在對(duì)滾動(dòng)軸承振動(dòng)數(shù)據(jù)進(jìn)行聚類時(shí),發(fā)現(xiàn)聚類中心隨機(jī)、故障類別重疊等問題。針對(duì)上述問題,提出隨機(jī)從樣本中抽取5%的小樣本進(jìn)行分層聚類,對(duì)簇中的數(shù)據(jù)進(jìn)行濾波操作,濾除簇的邊緣點(diǎn),統(tǒng)計(jì)濾波后每個(gè)簇的數(shù)據(jù)的密度,選取密度最大的點(diǎn)為K-means聚類的初始中心點(diǎn),然后按照1.1節(jié)中K-means聚類算法進(jìn)行數(shù)據(jù)聚類。改進(jìn)的K-means算法的流程如下:
1)輸入樣本集D={x1,x2,…,xm};簇?cái)?shù)為k。
2)初始化每個(gè)樣本為1簇,Cj={xj,j∈{1,2,…,m}},計(jì)算兩個(gè)點(diǎn)的歐氏距離d(Ci,Cj),得到距離矩陣M。
3)如果當(dāng)前簇個(gè)數(shù)q大于k時(shí),找出距離矩陣中最近的兩個(gè)簇Ci*和Cj*,將兩者進(jìn)行合并Ci*=Ci*∪Cj*,將j*后面的簇的序號(hào)j=j*+1,并進(jìn)行更新。
4)刪除距離矩陣M中的j*行和j*列,重新計(jì)算Ci*到其它簇的距離,更新距離矩陣M。
5)將q=q-1,循環(huán)步驟3)~步驟5),直到q=k,返回樣本簇的劃分集合C={C1,C2,…,Ck}。
6)對(duì)每一個(gè)簇Ci∈{C1,C2,…,Ck},計(jì)算簇內(nèi)兩個(gè)點(diǎn)的歐氏距離d(xi,xj),其中{xi∈Ci,xj∈Ci;i≠j},得到距離矩陣M。
7)獲取簇Ci類內(nèi)最大距離di_max,設(shè)置過濾的半徑Ri=0.2*d_max,統(tǒng)計(jì)d(xi,xj) 8)獲取簇Ci的ρi中最大的密度ρimax,對(duì)應(yīng)的樣本即是簇的中心點(diǎn)xip。 9)依次獲取所有簇的中心點(diǎn),創(chuàng)建Points={x1p,x2p,…,xkp}。 10)初始化K-means聚類算法的中心點(diǎn)為Points,執(zhí)行1.1中的2)~4)直到聚類完成。 通過觀察上述的算法流程,可得:步驟1)~步驟5)實(shí)現(xiàn)小樣本的分層聚類功能,步驟6)和步驟7)實(shí)現(xiàn)簇的濾波,濾除簇的邊緣噪聲點(diǎn)。步驟8)~步驟10)實(shí)現(xiàn)初始化中心的K-means聚類,返回樣本的所有分類,簇的序號(hào)即是數(shù)據(jù)集的偽標(biāo)簽,偽標(biāo)簽可進(jìn)行基于偽標(biāo)簽的半監(jiān)督學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)建模。 深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)與神經(jīng)網(wǎng)絡(luò)區(qū)別在于:包含多個(gè)隱含層,網(wǎng)絡(luò)變深,具有強(qiáng)大的學(xué)習(xí)能力,能夠?qū)W習(xí)數(shù)據(jù)深層次的特征。1986年,Hinton G E提出了反向傳播算法(Back propagation)[18],解決了多層感知機(jī)的復(fù)雜計(jì)算問題,為后來提出的各種深度神經(jīng)網(wǎng)絡(luò)的研究和發(fā)展給出了理論指導(dǎo)和計(jì)算公式。深度神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)見圖1。包含輸入層、2個(gè)隱含層和輸出層,每層之間通過全連接的方式連接,隱含層的層數(shù)可根據(jù)實(shí)際需要設(shè)計(jì)。 圖1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Neural network structure diagram 由圖1可見,多層神經(jīng)網(wǎng)絡(luò)模型,其中包括:輸入層X={x1,x2,…,xn};隱含層Y={y1,y2,…,yn};輸出層O={o1,o2,…,ol};隱含層與輸出層之間的權(quán)重W={w1,w2,…,wj,…,wl}。深度神經(jīng)網(wǎng)絡(luò)工作中的前饋網(wǎng)絡(luò)和方向傳播原理為 1)前饋網(wǎng)絡(luò) 對(duì)于隱含層,各隱含層神經(jīng)元輸出yj有: (3) 對(duì)于輸出層,各個(gè)輸出層神經(jīng)元ok有: (4) 式(3)、式(4)中,神經(jīng)元的激活函數(shù)f(·)根據(jù)應(yīng)用的需要可選擇Relu函數(shù),Tanh函數(shù)和Sigmoid函數(shù)等,共同構(gòu)成了多層神經(jīng)網(wǎng)絡(luò)的前饋網(wǎng)絡(luò)的模型。 2)反向傳播 當(dāng)神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果O與實(shí)際結(jié)果D存在誤差,誤差的定義為 (5) 由式(5)可知,神經(jīng)網(wǎng)絡(luò)的輸出誤差E是關(guān)于各層的權(quán)值的函數(shù),因此可通過調(diào)整各層權(quán)值來改變誤差E的大小。采用梯度下降的方式對(duì)w和v進(jìn)行求解,即求得w和v使得誤差E最小。 (6) (7) 其中,η為學(xué)習(xí)率,j=0,1,2,…,n;k=1,2,3,…,l;i=0,1,2,…,n。 提出了基于偽標(biāo)簽的半監(jiān)督深度神經(jīng)網(wǎng)模型,訓(xùn)練該模型使用的是1.3節(jié)中提出的改進(jìn)K-means聚類算法得到的偽標(biāo)簽數(shù)據(jù),用訓(xùn)練好的的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行無標(biāo)簽驗(yàn)證集分類,將調(diào)優(yōu)后的網(wǎng)絡(luò)模型用于滾動(dòng)軸承的故障診斷?;趥螛?biāo)簽的半監(jiān)督深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程見圖2。 圖2 半監(jiān)督學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)程序訓(xùn)練流程Fig.2 Deep Neural network training flowchart for semi-supervised learning 技術(shù)路線是建立在改進(jìn)的K-means聚類算法和基于偽標(biāo)簽的半監(jiān)督深度神經(jīng)網(wǎng)絡(luò)算法研究之上,主要包括:數(shù)據(jù)的預(yù)處理模塊、改進(jìn)的K-means聚類算法模塊、基于偽標(biāo)簽的半監(jiān)督深度神經(jīng)網(wǎng)絡(luò)算法模塊和算法的評(píng)價(jià)4個(gè)部分,見圖3。 圖3 技術(shù)路線的流程Fig.3 Flow chart of the technical route 數(shù)據(jù)來源于美國凱斯西儲(chǔ)大學(xué)提供的標(biāo)準(zhǔn)的軸承測試數(shù)據(jù)(CWRU Bearing Data Center)[17]。對(duì)CWRU軸承數(shù)據(jù)進(jìn)行預(yù)處理,包括:讀取CWRU軸承數(shù)據(jù),選取6種典型的故障,每種故障建立400*300維的數(shù)據(jù)向量,對(duì)上述數(shù)據(jù)向量進(jìn)行時(shí)域和頻域的信號(hào)處理,得到28維特征向量;利用改進(jìn)的K-means聚類算法處理特征向量,得到特征向量的偽標(biāo)簽,建立特征向量和偽標(biāo)簽相對(duì)應(yīng)的新數(shù)據(jù)集;用具有偽標(biāo)簽的數(shù)據(jù)集訓(xùn)練基于偽標(biāo)簽的半監(jiān)督深度神經(jīng)網(wǎng)絡(luò),訓(xùn)練并優(yōu)化該神經(jīng)網(wǎng)絡(luò);通過向特征向量中加入噪聲,研究算法的聚類效果和抗噪聲的性能。 仿真實(shí)驗(yàn)數(shù)據(jù)取自美國凱斯西儲(chǔ)大學(xué)提供的標(biāo)準(zhǔn)的軸承測試數(shù)據(jù)[17]。選取的是SKF60205軸承,在轉(zhuǎn)速1 797 r·min-1(約30 r·s-1)時(shí),對(duì)正常、滾動(dòng)體故障、內(nèi)圈故障、外圈3點(diǎn)鐘故障、外圈6點(diǎn)鐘故障、外圈12點(diǎn)鐘故障的6種軸承振動(dòng)信號(hào)進(jìn)行分析。故障直徑為0.007英寸,數(shù)據(jù)采集的頻率為12 kHz。軸承旋轉(zhuǎn)一圈約采樣12 kHz/30 r·s-1=400個(gè)數(shù)據(jù),可作為有故障的一個(gè)周期公共的長度,實(shí)驗(yàn)中6類故障數(shù)據(jù)的讀取最大長度為120 000個(gè)數(shù)據(jù),每一類可將數(shù)據(jù)截取為400*300的數(shù)據(jù)集合。 軸承的振動(dòng)數(shù)據(jù)是一維的時(shí)序信號(hào),采用時(shí)域信號(hào)處理的方法獲16個(gè)時(shí)域特征指標(biāo),再將信號(hào)變換到頻域,得到12個(gè)頻域指標(biāo)[17,19]。16個(gè)時(shí)域特征指標(biāo)(F1~F16)具體包括:平均值、絕對(duì)均值、最大值、最小值、峰峰值、方根幅值、平方均方根、方差、標(biāo)準(zhǔn)差、偏度、峭度、波形因子、裕度因子、脈沖因子、峰值因子、變異指數(shù)。時(shí)域特征中平均值、均方根值的穩(wěn)定性好,對(duì)早期故障不敏感;峭度、峰值、裕度因子和脈沖因子對(duì)故障比較敏感,但穩(wěn)定性差。12個(gè)頻域指標(biāo)(F17~F28)包括:平均能量、重心頻率、均方頻率、頻率方差、均方根頻率、幅值方差、幅值偏度指標(biāo)、幅值峭度指標(biāo)、頻率標(biāo)準(zhǔn)差、頻率歪度、頻率峭度、平方根比率。頻域特征中平均能量反應(yīng)了振動(dòng)能量的大小,重心頻率、均方頻率、頻率方差反應(yīng)了主頻帶的位置,最后的8特征反應(yīng)了頻譜的集中程度。由此可見,提取的時(shí)域和頻域的信號(hào)代表了信號(hào)的不同的特征,由此也可反向推斷出故障的類型。提取時(shí)域、頻域指標(biāo)參數(shù)見表1。 表1 時(shí)域頻域指標(biāo) 分別使用K-means算法和改進(jìn)的K-means算法對(duì)表1中的特征數(shù)據(jù)進(jìn)行聚類,并加入噪聲后的數(shù)據(jù)再次進(jìn)行改進(jìn)K-means聚類。K均值算法的運(yùn)算中,聚類結(jié)果與初始化的簇中心有關(guān),而類內(nèi)距離(Within Cluster Distance,WC)和類間距離(Between Cluster Distance,BC)是評(píng)價(jià)聚類效果的評(píng)價(jià)標(biāo)準(zhǔn),同時(shí)總體的衡量聚類模型的優(yōu)劣指標(biāo)score,給出三者的計(jì)算公式[20]。聚類算法中,WC越小越好,相反BC越大越好,score越大越好。三者的實(shí)驗(yàn)結(jié)果見表2,對(duì)比可知K-means的聚類效果更好,改進(jìn)的K-means次之,有噪聲的最差。其降維可視化后的結(jié)果見圖4、圖5和圖6。 表2 兩種聚類結(jié)果評(píng)價(jià) 圖4 真實(shí)標(biāo)簽的聚類Fig.4 Clustering of true labels 圖5 K-means聚類Fig.5 K-means clustering 圖6 改進(jìn)的K-means聚類Fig.6 Improved K - means clustering (8) (9) (10) 由圖4、圖5和圖6對(duì)比可見,K-means聚類將原本屬于一類的分成了兩類,將原本屬于兩類的分成了一類,相比之下提出的改進(jìn)K-means聚類算法較好的區(qū)分出了所有的類別,改進(jìn)的K-means算法分類效果優(yōu)于K-means算法。 深度神經(jīng)網(wǎng)絡(luò)模型采用的多層全連接的神經(jīng)網(wǎng)絡(luò)模型,包括1個(gè)輸入層,5個(gè)全連接的隱含層、4個(gè)drop_out層和1個(gè)輸出成,drop_out層的設(shè)置是為了防止模型的過擬合,丟棄率設(shè)置為0.2。其結(jié)構(gòu)見表3。輸入的數(shù)據(jù)是經(jīng)過PCA降維后的前9個(gè)維度,每1個(gè)隱含單元(包括全連接層和drop_out)可視為一個(gè)特征提取單元,輸出層的輸出是每種故障的概率。 表3 神經(jīng)網(wǎng)絡(luò)模型參數(shù) 對(duì)比圖7和圖8的數(shù)據(jù)可見,輸入為有噪聲數(shù)據(jù)的改進(jìn)K-means網(wǎng)絡(luò)模型收斂速度最快,3種模型在訓(xùn)練集上的精度均達(dá)到98%,并保持穩(wěn)定,說明改進(jìn)K-means聚類深度神經(jīng)網(wǎng)絡(luò)故障診斷模型收斂速度快、精度高、具有較好的魯棒性。 圖7 訓(xùn)練精度變化曲線Fig.7 Training accuracy curves with iterations 圖8 損失函數(shù)變化曲線Fig.8 Loss function value curves with iterations 模型訓(xùn)練好后,用驗(yàn)證集的數(shù)據(jù)集對(duì)模型進(jìn)行驗(yàn)證,記錄相應(yīng)的精度和損失率,同時(shí)用真實(shí)標(biāo)簽映射到偽標(biāo)簽,得出相對(duì)于真實(shí)標(biāo)簽數(shù)據(jù)的準(zhǔn)確率,驗(yàn)證集測試結(jié)果見表4。由表4可見,用改進(jìn)的K-means聚類算法訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型在偽標(biāo)簽的數(shù)據(jù)集上的準(zhǔn)確率為98%,比K-means聚類的模型的98.7%低0.7%,但是在映射到真實(shí)數(shù)據(jù)上的準(zhǔn)確率為96%,比K-means聚類的提高了4.7%。提出的模型對(duì)于加入噪聲的數(shù)據(jù)具有更好的精度、損失率和真標(biāo)簽的準(zhǔn)確率。 表4 驗(yàn)證集測試結(jié)果 綜上所述,加入噪聲的改進(jìn)深度神經(jīng)網(wǎng)絡(luò)模型在驗(yàn)證集上表現(xiàn)的性能更好,充分說明了改進(jìn)的K-means聚類算法分類的性能優(yōu)于K-means算法,同時(shí)加入噪聲后的聚類模型的魯棒性更好,在進(jìn)行驗(yàn)證集測試時(shí),精度均大于訓(xùn)練集的測試精度。 在改進(jìn)K-means的性能探究中,雖然提出的改進(jìn)K-means算法在WC、BC和score 3個(gè)指標(biāo)上均比K-means算法要稍差一些,但提出的算法與真實(shí)數(shù)據(jù)的聚類輪廓更為接近。出現(xiàn)上述現(xiàn)象的原因是:改進(jìn)的算法中指定了聚類的中心阻礙了K-means隨機(jī)尋找最優(yōu)聚類的幾率,避免在全部數(shù)據(jù)上的過擬合。實(shí)驗(yàn)中發(fā)現(xiàn),優(yōu)化初始聚類中心點(diǎn)、在數(shù)據(jù)中加入噪聲均使WC、BC和score不佳,出現(xiàn)這樣異常結(jié)果的原因可能是噪聲數(shù)據(jù)使得數(shù)據(jù)的質(zhì)量變差,同時(shí)降低了K-means算法和提出的改進(jìn)K-means算法的聚類性能,但提出的算法去除了噪聲點(diǎn)干擾和收斂性更好,因此使得訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型的魯棒性得以提高。 在深度神經(jīng)網(wǎng)絡(luò)模型的性能探究中,通過觀察和實(shí)驗(yàn)結(jié)果分析,可得出加入噪聲的改進(jìn)K-means聚類深度神經(jīng)網(wǎng)絡(luò)故障診斷模型表現(xiàn)出了優(yōu)越的性能,在收斂速度和預(yù)測準(zhǔn)確率(真實(shí)標(biāo)簽)表現(xiàn)較為突出,說明該模型具有良好的魯棒性;也再次證明了本文提出加入噪聲的改進(jìn)K-means聚類算法在滾動(dòng)軸承故障診斷問題上具有良好的性能。 結(jié)合分層聚類和K-means聚類的特點(diǎn),提出了加入噪聲的改進(jìn)K-means聚類算法進(jìn)行高維度的軸承振動(dòng)特征數(shù)據(jù)的聚類處理。通過對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),指定K-means聚類中心、在數(shù)據(jù)中加入高斯白噪聲會(huì)降低WC、BC和score聚類評(píng)價(jià)指標(biāo),但可降低了K-means聚類的隨機(jī)誤差,加速算法的收斂速度和防止過擬合,提高分類的準(zhǔn)確性。同時(shí),在聚類偽標(biāo)簽的基礎(chǔ)上建立深度神經(jīng)網(wǎng)絡(luò)模型,通過半監(jiān)督學(xué)習(xí)的方式進(jìn)行了模型的訓(xùn)練和驗(yàn)證,實(shí)驗(yàn)結(jié)果顯示模型的準(zhǔn)確率高達(dá)96.2%,能夠100%的區(qū)分軸承的正常狀態(tài)和故障狀態(tài),具有較高的穩(wěn)定性。1.3 深度神經(jīng)網(wǎng)絡(luò)模型
1.4 基于偽標(biāo)簽的半監(jiān)督深度神經(jīng)網(wǎng)絡(luò)模型
1.5 本文的技術(shù)路線
2 實(shí)驗(yàn)研究
2.1 改進(jìn)K-means算法的性能研究
2.2 深度神經(jīng)網(wǎng)的性能研究
2.3 實(shí)驗(yàn)結(jié)果分析
3 結(jié) 論
黑龍江大學(xué)工程學(xué)報(bào)2023年4期