張忠文,彭 翀,車眾元,薛瑞娟,王賀東
(北京航空航天大學(xué)a.機(jī)械工程及自動(dòng)化學(xué)院;b.自動(dòng)化科學(xué)與電氣工程學(xué)院,北京 100191)
數(shù)控系統(tǒng)是數(shù)控機(jī)床的核心部件,被稱為機(jī)床的大腦,在深入實(shí)施制造強(qiáng)國(guó)的戰(zhàn)略發(fā)展規(guī)劃中占據(jù)著重要的地位[1]。數(shù)控系統(tǒng)可靠性建模作為可靠性評(píng)估的重要方法,具有非常重要的研究?jī)r(jià)值[2]。數(shù)控系統(tǒng)故障數(shù)據(jù)由于采集方式直觀、建模難度較小、研究成果較多,在數(shù)控系統(tǒng)的可靠性評(píng)估中經(jīng)常被使用。許多學(xué)者在數(shù)控系統(tǒng)可靠性建模方面進(jìn)行了相關(guān)研究。LIU等[3]提出了一種基于故障相關(guān)度的可靠性建模方法,并將故障相關(guān)因子引入?yún)?shù)估計(jì)部分,以充分反映可靠性建模中全生命周期中故障數(shù)據(jù)的可靠性信息。VERSHININ等[4]通過安裝故障檢測(cè)裝置對(duì)數(shù)控系統(tǒng)的運(yùn)行狀態(tài)進(jìn)行監(jiān)測(cè),研究數(shù)控機(jī)床及其控制單元的故障和失效原因,以提高機(jī)電系統(tǒng)可靠性分析的效率。但是這些方法所考慮的對(duì)數(shù)控系統(tǒng)故障影響的原因較為單一,當(dāng)面對(duì)故障原因較為復(fù)雜的數(shù)控系統(tǒng)時(shí),其適用范圍受到嚴(yán)重的限制,因此亟需一種能滿足數(shù)控系統(tǒng)可靠性分析的方法。
隨著數(shù)控系統(tǒng)可靠性測(cè)試水平的提高與測(cè)試方法的完善,可靠性測(cè)試數(shù)據(jù)的內(nèi)容日漸豐富,規(guī)模日益增長(zhǎng),充分利用數(shù)據(jù)信息可以很大程度地提高可靠性模型的準(zhǔn)確性。此外,由于大數(shù)據(jù)技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘[5]方法應(yīng)用也趨于成熟。很多學(xué)者利用數(shù)據(jù)挖掘方法進(jìn)行了研究。WANG等[6]改進(jìn)SDT算法,相比原有算法更加適合和高效。BORCH等[7]在醫(yī)學(xué)研究中提出了一種基于稀有模式的異常點(diǎn)檢測(cè)方法(RPOD),經(jīng)過比較性能評(píng)估后證實(shí)了RPOD方法優(yōu)于現(xiàn)有的孤立點(diǎn)挖掘方法。鮑軍鵬等[8]探討了在多核CPU和GPU的典型異構(gòu)計(jì)算節(jié)點(diǎn)中對(duì)時(shí)序數(shù)據(jù)挖掘過程進(jìn)行并行優(yōu)化的多種策略。結(jié)果表明,針對(duì)不同任務(wù)情況綜合使用多種優(yōu)化策略具有顯著提升效果。
本文將數(shù)據(jù)挖掘技術(shù)應(yīng)用于數(shù)控系統(tǒng)可靠性數(shù)據(jù)處理,結(jié)合Weibull分布建立了考慮故障關(guān)聯(lián)因子的可靠性模型,充分融合了挖掘信息,使得模型具有更加精確的預(yù)測(cè)能力。
TELIKANI等[9]提出的FP-Growth算法是一種基于分治策略的頻繁模式增長(zhǎng)的經(jīng)典關(guān)聯(lián)規(guī)則挖掘算法。FP-Growth算法是通過將數(shù)據(jù)集存儲(chǔ)在FP(frequent pattern)樹上發(fā)現(xiàn)頻繁項(xiàng)集,F(xiàn)P-Growth算法只需要對(duì)數(shù)據(jù)庫進(jìn)行兩次掃描,該算法發(fā)現(xiàn)頻繁項(xiàng)集的過程是:
(1)構(gòu)建FP樹;
(2)從FP樹中挖掘頻繁項(xiàng)集。
利用FP-Growth算法掃描數(shù)據(jù)集涉及到提升度(Lift),提升度定義為:“包含X的事務(wù)中同時(shí)包含Y的事務(wù)的比例”與“包含Y的事務(wù)的比例”的比值,表達(dá)式如下:
Lift=P(X∩Y)/P(X)/P(Y)
(1)
提升度反映了關(guān)聯(lián)規(guī)則中的X與Y的相關(guān)性,提升度大于1且越高表明正相關(guān)性越高,提升度小于1且越低表明負(fù)相關(guān)性越高,提升度等于1表明沒有相關(guān)性。
關(guān)聯(lián)規(guī)則挖掘[10]是數(shù)據(jù)挖掘方法中重要的方法之一,由于其能有效發(fā)掘大規(guī)模數(shù)據(jù)中的隱含關(guān)系信息,已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域中一個(gè)非常重要的手段[11-12]。該方法十分適合處理大量數(shù)控系統(tǒng)可靠性測(cè)試數(shù)據(jù)。如果兩個(gè)或多個(gè)數(shù)據(jù)項(xiàng)重復(fù)且概率很高,則它們之間具有某種相關(guān)性,通過這些相關(guān)性可以生成相對(duì)應(yīng)的關(guān)聯(lián)規(guī)則:
設(shè)I={i1,i2,…,in}為整體項(xiàng)集,T={t1,t2,…,tm}為事件數(shù)據(jù)集,T≠?,T?I,X?I,Y?I。
關(guān)聯(lián)規(guī)則定義和其相關(guān)參數(shù)定義如下:
定義1:X≠?,Y≠?,X∩Y=?,若有X?Y,則X?Y是一條關(guān)聯(lián)規(guī)則;
定義2:關(guān)聯(lián)規(guī)則X?Y在事件數(shù)據(jù)集T中存在置信度(confidence),則置信度為在事件數(shù)據(jù)集T中含有X也含有Y的可能性,表示為:
Confidence(X?Y)=P(X|Y)
(2)
定義3:支持度為描述關(guān)聯(lián)規(guī)則X?Y在事件數(shù)據(jù)集T中同時(shí)存在X和Y的可能性,定義事件數(shù)據(jù)集T中存在支持度(support),支持度的公式為:
Support(X?Y)=P(X∪Y)
(3)
定義4:關(guān)聯(lián)規(guī)則X?Y的置信度為:
(4)
為了簡(jiǎn)化了對(duì)事件數(shù)據(jù)集的掃描,提升頻繁項(xiàng)集挖掘效率。本文利用FP-Growth算法建立關(guān)聯(lián)規(guī)則。其過程如圖1所示。
圖1 關(guān)聯(lián)規(guī)則
該過程的目的是找到一個(gè)關(guān)聯(lián)規(guī)則,要求其既滿足最小支持度(minsupport)又滿足最小置信度(minconfidence)。其中,支持度和置信度越高,關(guān)聯(lián)度越好。
關(guān)聯(lián)規(guī)則建立過程如下:
(1)第一次掃描故障數(shù)據(jù),得到所有頻繁項(xiàng)集的計(jì)數(shù)。然后刪除支持度低于閾值的項(xiàng),將頻繁項(xiàng)集放入項(xiàng)頭表,并按照支持度降序排列;
(2)第二次掃描故障數(shù)據(jù),將讀到的原始數(shù)據(jù)剔除非頻繁項(xiàng)集,并按照支持度降序排列。通過兩次掃描數(shù)據(jù)建立項(xiàng)頭表;
(3)構(gòu)建FP樹。讀入排序后的數(shù)據(jù)集,插入FP樹,插入時(shí)按照排序后的順序,插入FP樹中,排序靠前的節(jié)點(diǎn)是父節(jié)點(diǎn),而靠后的是子節(jié)點(diǎn)。如果有共同的鏈表,則對(duì)應(yīng)的公用父節(jié)點(diǎn)計(jì)數(shù)加1。插入后,如果有新節(jié)點(diǎn)出現(xiàn),則項(xiàng)頭表對(duì)應(yīng)的節(jié)點(diǎn)會(huì)通過節(jié)點(diǎn)鏈表鏈接上新節(jié)點(diǎn)。直到所有的數(shù)據(jù)都插入到FP樹后,F(xiàn)P樹的建立完成;
(4)挖掘頻繁項(xiàng)集。從項(xiàng)頭表的底部項(xiàng)依次向上找到項(xiàng)頭表項(xiàng)對(duì)應(yīng)的條件模式基。從條件模式基遞歸挖掘得到項(xiàng)頭表項(xiàng)的頻繁項(xiàng)集,同時(shí)返回頻繁項(xiàng)集對(duì)應(yīng)的節(jié)點(diǎn)計(jì)數(shù)值;
(5)在滿足要求的頻繁項(xiàng)集的基礎(chǔ)上,得到具有最小置信度的關(guān)聯(lián)規(guī)則。
故障總時(shí)間法[13](total testing time,TTT)是一種用于數(shù)據(jù)變換的方法,可以較好的解決單個(gè)數(shù)控系統(tǒng)故障樣本數(shù)目較少的問題。經(jīng)過長(zhǎng)時(shí)間使用后該方法在指數(shù)型檢驗(yàn)、模型選擇、維修策略等方面得到了應(yīng)用。因此本文采用故障總時(shí)間法對(duì)其故障時(shí)間數(shù)據(jù)進(jìn)行預(yù)處理,故障總時(shí)間的原理圖如圖2所示。
圖2 故障總時(shí)間法原理
根據(jù)故障總時(shí)間法原理,假設(shè)采集的現(xiàn)場(chǎng)故障數(shù)據(jù)來自于m套數(shù)控系統(tǒng),其中第i套數(shù)控系統(tǒng)采集的故障時(shí)間區(qū)間為(0,tis],i=1,2,…,m,共發(fā)生ni次故障,每次故障發(fā)生時(shí)間為tij(j=1,2,…,ni)。則各故障點(diǎn)所對(duì)應(yīng)的故障總時(shí)間計(jì)算方法為:
T(tij)=tij×p(tij)+Ts
(5)
式中,p(tij)為tij時(shí)刻觀察到的未截尾數(shù)控系統(tǒng)的數(shù)量;Ts為tij時(shí)刻觀察到的所有已截尾數(shù)控系統(tǒng)截尾時(shí)間之和。
將得到數(shù)據(jù)從小到大排序得時(shí)間序列0 (6) 故障間隔時(shí)間的累積故障分布F(t)采用中位秩的方法進(jìn)行計(jì)算,第i個(gè)故障數(shù)據(jù)的序號(hào)ri為: (7) 式中,N為故障總數(shù)(不含截尾數(shù)據(jù));n′=N+1;j為采集的所有數(shù)據(jù)(包含截尾數(shù)據(jù))的順序號(hào);i為故障數(shù)據(jù)的順序號(hào)。 得故障間隔時(shí)間的累計(jì)故障分布F(t)為: (8) Weibull分布是一種傳統(tǒng)可靠性模型,雙參數(shù)Weibull分布可以用于分析具有小樣本故障數(shù)據(jù)產(chǎn)品的可靠性。 采用Weibull分布對(duì)數(shù)控系統(tǒng)的可靠性進(jìn)行建模: Weibull分布的故障率函數(shù)為: (9) Weibull分布的故障概率密度函數(shù)為: (10) Weibull分布的可靠度函數(shù)為: (11) 式中,β為形狀參數(shù)(shape),表示函數(shù)的走勢(shì),β>1表示故障率隨時(shí)間增加,β<1表示故障率隨時(shí)間減小;θ為尺寸參數(shù)(scale),影響函數(shù)分布的平均值。 為分析β與θ對(duì)于分布的影響,通過取不同的值就Weibull分布的概率密度函數(shù)進(jìn)行了繪制,如圖3所示。 圖3 Weibull分布的形狀參數(shù)與尺寸參數(shù)關(guān)系 由圖中可以看出隨著尺寸參數(shù)θ與形狀參數(shù)β的變化,所得到的失效概率密度函數(shù)曲線也會(huì)隨之變化,可以表征整個(gè)產(chǎn)品全生命周期(浴盆曲線)的磨合階段、穩(wěn)定磨損階段,以及劇烈磨損階段。設(shè)置θ不變,當(dāng)0<β<1時(shí),概率密度曲線可模擬產(chǎn)品全生命周期的磨合階段;當(dāng)β=2時(shí),可模擬產(chǎn)品全生命周期的穩(wěn)定磨損階段;當(dāng)β>4的時(shí)候可模擬產(chǎn)品全生命周期的劇烈磨損階段,可以看出形狀參數(shù)β控制分布函數(shù)形狀的變化。若設(shè)置β不變,隨著θ的增大,可以看出曲線的幅值與期望均發(fā)生了變化,故尺度參數(shù)θ控制分布函數(shù)的幅度及期望。由于Weibull分布模型的上述特點(diǎn),本研究選取該模型進(jìn)行改進(jìn),并與改進(jìn)后的模型進(jìn)行對(duì)比。 以關(guān)聯(lián)規(guī)則和關(guān)聯(lián)強(qiáng)度為基礎(chǔ),計(jì)算數(shù)控系統(tǒng)故障關(guān)聯(lián)因子,并將其引入到可靠性建模參數(shù)估計(jì)過程中,可以獲取包含關(guān)聯(lián)信息的數(shù)控系統(tǒng)可靠性修正模型。 故障關(guān)聯(lián)因子α表示為: (12) 式中,η為關(guān)聯(lián)規(guī)則對(duì)應(yīng)的關(guān)聯(lián)強(qiáng)度;n為同一故障模式對(duì)應(yīng)關(guān)聯(lián)規(guī)則個(gè)數(shù)。 考慮故障關(guān)聯(lián)度之后,采用極大似然估計(jì)法估計(jì)參數(shù),并將故障關(guān)聯(lián)因子引入到似然函數(shù)并得到對(duì)數(shù)似然函數(shù): (13) (14) 通過令式(13)的一階導(dǎo)數(shù)為0來對(duì)形狀參數(shù)β和尺寸參數(shù)θ進(jìn)行估計(jì)。 獲得了上述參數(shù)之后引入均方誤差(RMSE)對(duì)模型的擬合度進(jìn)行判斷: (15) 通過中位秩法計(jì)算經(jīng)驗(yàn)可靠度: (16) 式中, (17) 本文的研究?jī)?nèi)容使用的可靠性數(shù)據(jù)來源于實(shí)驗(yàn)室兩期近十年可靠性測(cè)試研究。原始數(shù)據(jù)采集于實(shí)驗(yàn)室數(shù)十臺(tái)數(shù)控系統(tǒng)中,涵蓋了數(shù)控系統(tǒng)運(yùn)行數(shù)據(jù)、指令數(shù)據(jù)、報(bào)警數(shù)據(jù)、故障記錄、負(fù)載電流等上萬條可靠性信息。對(duì)測(cè)試數(shù)據(jù)進(jìn)行整理與篩選,剔除異常數(shù)據(jù),合并重復(fù)數(shù)據(jù),提取數(shù)控系統(tǒng)的故障時(shí)間、故障模式和故障原因,生成故障數(shù)據(jù)集。其中,X為故障模式,Y為故障原因。表1為故障模式及故障原因?qū)φ毡怼?/p> 表1 故障模式、故障原因?qū)φ毡?/p> 針對(duì)故障數(shù)據(jù)集利用聯(lián)規(guī)則挖掘計(jì)算,去除置信度小于0.1的結(jié)果,獲取的故障模式與故障原因間的關(guān)聯(lián)規(guī)則和置信度結(jié)果如表2所示。 表2 關(guān)聯(lián)規(guī)則和置信度 通過帶入式(12)可以得到各次故障對(duì)應(yīng)的關(guān)聯(lián)規(guī)則信息、故障關(guān)聯(lián)因子,剔除置信度小于0.2的結(jié)果如表3所示。 表3 關(guān)聯(lián)規(guī)則與故障關(guān)聯(lián)因子 將統(tǒng)計(jì)好的可靠性數(shù)據(jù)代入到式(14)中計(jì)算未引入故障關(guān)聯(lián)因子的Weibull模型相關(guān)模型參數(shù)。然后,引入故障關(guān)聯(lián)因子,經(jīng)過MATLAB數(shù)值計(jì)算即可獲得經(jīng)過改進(jìn)模型的模型參數(shù)。應(yīng)用故障樣本數(shù)據(jù)進(jìn)行擬合度驗(yàn)證,獲得的改進(jìn)模型和Weibull模型的RMSE,結(jié)果如表4所示。 表4 模型參數(shù)估計(jì)值與RMSE 利用表4中的參數(shù)估計(jì)值,繪制各個(gè)改進(jìn)模型和Weibull模型的可靠度函數(shù)圖,如圖4所示。利用表數(shù)據(jù)繪制各模型可靠度函數(shù)圖,可看出改進(jìn)模型對(duì)數(shù)據(jù)的擬合程度更好,同時(shí)從均方根誤差可以看出,引入故障關(guān)聯(lián)因子的改進(jìn)模型比一般Weibull模型均方根誤差要小的多。 圖4 故障數(shù)據(jù)和擬合模型對(duì)比圖 由表4可知,考慮故障關(guān)聯(lián)因子的改進(jìn)模型RMSE為0.068 2,遠(yuǎn)小于Weibull模型的0.112,擬合優(yōu)度更高。通過圖4可得,雖然Weibull模型在試驗(yàn)早期(小于200 h)具有更加優(yōu)秀的擬合能力,但是在完整的試驗(yàn)周期中,整體擬合效果遠(yuǎn)差于改進(jìn)模型。這是由于在實(shí)驗(yàn)早期,故障數(shù)據(jù)樣本小,相關(guān)的關(guān)聯(lián)規(guī)則不明確,改進(jìn)模型的特性不能明顯體現(xiàn)。隨著測(cè)試時(shí)間的增長(zhǎng),故障樣本數(shù)據(jù)逐漸增加,關(guān)聯(lián)規(guī)則逐漸明確,故障關(guān)聯(lián)因子對(duì)模型的修正作用逐漸加強(qiáng),使得修正模型能夠更加符合理論故障數(shù)據(jù)的變化趨勢(shì),局部偏離度小,擬合優(yōu)度更高。而且隨著試驗(yàn)時(shí)間的增長(zhǎng),考慮故障關(guān)聯(lián)因子的修正模型的預(yù)測(cè)能力會(huì)明顯提高。 本研究通過考慮故障模式與故障原因的關(guān)聯(lián)程度,采用數(shù)據(jù)挖掘技術(shù),以在故障數(shù)據(jù)對(duì)應(yīng)的故障時(shí)間、故障模式與故障原因構(gòu)成數(shù)據(jù)集,利用FP-Growth算法搜索得到頻繁項(xiàng)集,結(jié)合最小置信度得到關(guān)聯(lián)規(guī)則,計(jì)算得到故障關(guān)聯(lián)因子,并引入到數(shù)控系統(tǒng)可靠性模型參數(shù)估計(jì)過程中,從而獲得了修正的可靠性模型。結(jié)論如下: 引入故障關(guān)聯(lián)因子修正的可靠性模型,具有更加為突出的擬合優(yōu)度,對(duì)理論故障數(shù)據(jù)的變化趨勢(shì)具有一定的適應(yīng)性,能夠更加準(zhǔn)確的對(duì)數(shù)控系統(tǒng)全生命周期的可靠性進(jìn)行預(yù)測(cè)。并且隨樣本數(shù)據(jù)的增長(zhǎng),預(yù)測(cè)能力會(huì)逐漸增強(qiáng)。2.2 數(shù)控系統(tǒng)可靠性建模
2.3 考慮故障關(guān)聯(lián)因子的可靠性模型參數(shù)評(píng)估
3 實(shí)例驗(yàn)證
4 結(jié)論