趙雪松 謝倩嫻 尹仕紅 侯 婧 張日取
(1.深圳供電局有限公司計(jì)量管理所,廣東 深圳 430223;2.華立科技股份有限公司,浙江 杭州 310023)
隨著智能電網(wǎng)發(fā)展和智能計(jì)量設(shè)備的普及應(yīng)用,智能計(jì)量設(shè)備運(yùn)行可靠性的問題越來越多,對(duì)計(jì)量貿(mào)易結(jié)算造成了重大影響[1]。目前全國眾多計(jì)量設(shè)備生產(chǎn)單位對(duì)智能計(jì)量設(shè)備的可靠性進(jìn)行了研究,例如物料平臺(tái)健全管控、自動(dòng)化檢測(cè)測(cè)試、間歇性故障研究、設(shè)計(jì)可靠性、零部件篩選以及生產(chǎn)工藝控制等,但這些研究以各企業(yè)自己的產(chǎn)品為研究對(duì)象,研究對(duì)象單一;同時(shí),企業(yè)也不會(huì)公開發(fā)表相關(guān)的研究成果,因此不能推動(dòng)整個(gè)計(jì)量設(shè)備行業(yè)的發(fā)展,進(jìn)而嚴(yán)重影響了計(jì)量設(shè)備的健康發(fā)展[2-3]。隨著智能計(jì)量設(shè)備可靠性的發(fā)展,目前對(duì)馬爾可夫過程的研究也更加深入,馬氏過程模型的研究受到了越來越多的重視。在現(xiàn)實(shí)世界中,有很多過程都是馬爾可夫過程,從概率角度來看,對(duì)智能計(jì)量設(shè)備的可靠性水平進(jìn)行評(píng)估和預(yù)測(cè),可以保證通信模塊有效、安全地運(yùn)行[4]。該文從其最原始的數(shù)學(xué)定義出發(fā),逐步討論它的轉(zhuǎn)移概率矩陣、初始概率分布以及在時(shí)刻m的概率分布,詳盡闡述公式所表達(dá)的意義以及公式的應(yīng)用方法。目前,馬爾科夫過程的“無記憶性”(過去對(duì)于預(yù)測(cè)將來是無關(guān)的)已經(jīng)廣泛應(yīng)用于對(duì)相關(guān)行業(yè)可靠性的評(píng)價(jià)和預(yù)測(cè)等領(lǐng)域。該文從計(jì)量設(shè)備的可靠性出發(fā),基于計(jì)量設(shè)備通信模塊(計(jì)量終端上行通信模塊)的失效建立了失效數(shù)據(jù)分布數(shù)學(xué)模型,從而對(duì)失效進(jìn)行評(píng)價(jià)。
如果離散空間K和離散時(shí)間的隨機(jī)過程F(t)為K={k1,k2,…},那么對(duì)于任意時(shí)刻有0 ≤t1<t2<…<tn,在tn時(shí)概率可以由條件概率定義,如公式(1)所示。
設(shè)某隨機(jī)過程滿足馬爾科夫過程,即滿足公式(3)的要求。
對(duì)于由n個(gè)狀態(tài)組成的狀態(tài)空間,它的轉(zhuǎn)移概率可以表示為如式(4)所示的矩陣。
式中:A(Δt)為時(shí)間間隔Δt內(nèi)狀態(tài)空間轉(zhuǎn)移函數(shù);ann表示第n個(gè)狀態(tài)空間想第n狀態(tài)空間的轉(zhuǎn)移概率。
公式(4)具有的性質(zhì)如公式(5)所示。
式中:aij(Δt)為時(shí)間間隔Δt內(nèi)狀態(tài)ai與aj間的轉(zhuǎn)移概率函數(shù)。
如果t1,t2,t3…tn的時(shí)間間隔(Δt)相同,那么根據(jù)齊次性,概率矩陣A如公式(6)所示。
式中:aij為該狀態(tài)的概率;A為該空間整體樣本狀態(tài)概率。當(dāng)樣本數(shù)量趨向于無窮大時(shí),可根據(jù)ti及ti+1時(shí)刻狀態(tài)的變化,獲得滿足誤差要求的系統(tǒng)狀態(tài)轉(zhuǎn)移概率矩陣A。每增加1組樣本,矩陣A內(nèi)就可能會(huì)有一行值發(fā)生變化,行數(shù)對(duì)應(yīng)ti時(shí)刻的系統(tǒng)狀態(tài),理論上,當(dāng)樣本數(shù)量足夠大時(shí),A的統(tǒng)計(jì)值就可以無限接近于真實(shí)值。
在實(shí)際運(yùn)行時(shí),智能計(jì)量設(shè)備通信模塊發(fā)生的某種故障可能是由1種或多種故障模式造成的,其故障機(jī)理過程是物理、化學(xué)、機(jī)械或生物等組合在一起的過程。通過故障機(jī)理分析,從根本上提高計(jì)量終端通信模塊的可靠性[5]。智能計(jì)量設(shè)備的典型故障都是由軟件、硬件引起的,下面以計(jì)量終端上行通信模塊為例,通過失效機(jī)理分析,對(duì)通信模塊進(jìn)行分類,見表1。
表1 通信模塊故障表
將通信模塊安裝在運(yùn)行現(xiàn)場(chǎng)后,當(dāng)通信模塊處于或趨近于不滿足可靠性準(zhǔn)則要求的運(yùn)行狀態(tài)時(shí),運(yùn)維人員將采取必要措施,確保智能計(jì)量設(shè)備的通信恢復(fù)到可以接受的水平。可以根據(jù)通信模塊的生命周期,對(duì)其不同狀態(tài)進(jìn)行分類,根據(jù)通信的實(shí)際情況,可以將其運(yùn)行狀態(tài)分為正常狀態(tài)、故障狀態(tài)和風(fēng)險(xiǎn)狀態(tài)。當(dāng)出現(xiàn)正常狀態(tài)和故障狀態(tài)時(shí),都需要采取必要的措施,但是目前無有效措施可以對(duì)風(fēng)險(xiǎn)狀態(tài)進(jìn)行管控[6]。狀態(tài)1(運(yùn)行狀態(tài)):在該狀態(tài)下,通信模塊無故障,通信正常。狀態(tài)2(風(fēng)險(xiǎn)狀態(tài)):在該狀態(tài)下,存在部分出現(xiàn)失效風(fēng)險(xiǎn)的模塊,需要進(jìn)行排除才能保證通信正常。狀態(tài)3(故障狀態(tài)):在該狀態(tài)下,通信模塊出現(xiàn)失效,智能計(jì)量設(shè)備通信異常,需要維修或更換通信模塊。
通信模塊的3運(yùn)行狀態(tài)模型的狀態(tài)空間為K={1,2,3},其狀態(tài)轉(zhuǎn)移過程如圖1所示,其轉(zhuǎn)移矩陣如公式(7)所示。
式中:aij為通信模塊從i狀態(tài)轉(zhuǎn)移到j(luò)狀態(tài)的概率。
行向量Π(i)為ti時(shí)刻的通信模塊通信狀態(tài)分布,其定義如公式(8)所示。
式中:Π(i)為ti時(shí)刻的通信模塊通信狀態(tài)分布橫向量;πα(t)為ti時(shí)刻的通信模塊α狀態(tài)分布;T為終止時(shí)刻;T為終止時(shí)刻;[F(i)=k1]為i狀態(tài)下的概率為ki。
假設(shè)通信模塊的初始狀態(tài)為Π(0),由狀態(tài)轉(zhuǎn)移概率矩陣A的定義,經(jīng)過Δt后,下一個(gè)時(shí)刻的通信模塊狀態(tài)分布,如公式(9)所示。
顯然,再經(jīng)過Δt后通信模塊狀態(tài)轉(zhuǎn)移,如公式(10)所示。
以此類推,經(jīng)過m個(gè)Δt后的通信模塊轉(zhuǎn)態(tài)轉(zhuǎn)移如公式(11)所示。
在已知Π(0)和A的前提下,可以通過快速解析來獲得未來每隔Δt時(shí)間間隔后通信模塊狀態(tài)分布的失效率。
當(dāng)時(shí)間間隔的數(shù)量n→∞時(shí)(模塊理論壽命),通信模塊的可靠性趨近于某一穩(wěn)定值,即通信模塊的生命周期最終失效率如公式(12)所示。
式中:An為n次迭代。
理論上,開始狀態(tài)概率表示通信模塊投入運(yùn)行,此時(shí)失效率為0,但是存在部分風(fēng)險(xiǎn)狀態(tài)的通信模塊,此時(shí)的失效概率接近于πi(0),可以該根據(jù)電子產(chǎn)品的可靠性壽命串聯(lián)模型對(duì)該數(shù)據(jù)進(jìn)行預(yù)計(jì)(參考SN29500標(biāo)準(zhǔn)),如公式(13)所示。
式中:λ為產(chǎn)品失效率;λref為元器件基本失效率;πU為電壓影響因子;πI為電流影響因子;πL為環(huán)境影響因子;πQ為元器件固有質(zhì)量影響因子。
圖1 通信模塊狀態(tài)轉(zhuǎn)移過程圖
當(dāng)通信模塊開始狀態(tài)概率存在時(shí)(如公式(14)所示)。
式(13)有如下等效變換,如公式(15)所示。
由于公式(14)的n個(gè)方程中只有n-1個(gè)獨(dú)立,因此,需要與公式(15)聯(lián)立求解,得到通信模塊的正常狀態(tài)概率,如公式(16)所示。
根據(jù)通信模塊的運(yùn)行情況,將其狀態(tài)空間K分為通信狀態(tài)W(工作狀態(tài))和故障狀態(tài)U,記為W={e1.e2},U={e3}。
通信模塊可用度D(i)定義為ti時(shí)刻通信模塊處于通信狀態(tài)概率,如公式(17)所示。
因此,公式(7)可以表示為相應(yīng)的矩陣形式,如公式(18)所示。
式中:B為通信模塊在通信狀態(tài)時(shí)失效概率的二階方陣;C為通信模塊從風(fēng)險(xiǎn)狀態(tài)向故障狀態(tài)轉(zhuǎn)移的概率;D為通信模塊失效概率向風(fēng)險(xiǎn)狀態(tài)轉(zhuǎn)移概率;E為通信模塊故障狀態(tài)向通信狀態(tài)的轉(zhuǎn)移概率,即修復(fù)概率。
將通信模塊的故障狀態(tài)置為靜止?fàn)顟B(tài),即令公式(19)中的D=0,就可以得到一個(gè)新的馬爾科夫模型,那么通信模塊首次失效前的平均時(shí)間如公式(19)所示。
該算例只為驗(yàn)證智能計(jì)量設(shè)備通信模塊運(yùn)行的馬爾科夫特性,根據(jù)標(biāo)準(zhǔn)要求,通信模塊壽命為5 a,因此設(shè)Δt時(shí)間間隔內(nèi)通信模塊故障率為0.0002,修復(fù)概率為0.01,其他故障概率均為0。通過對(duì)某批次通信模塊的狀態(tài)及在Δt時(shí)間間隔內(nèi)的分布和相鄰時(shí)間間隔通信狀態(tài)的變化進(jìn)行了300次統(tǒng)計(jì),結(jié)果見表2。
表2 通信模塊狀態(tài)轉(zhuǎn)移數(shù)據(jù)
由表2可以獲得通信模塊轉(zhuǎn)態(tài)轉(zhuǎn)移概率矩陣,如公式(20)所示。
通信模塊狀態(tài)概率轉(zhuǎn)移矩陣的物理意義為:假設(shè)通信模塊狀態(tài)在上一個(gè)時(shí)間間隔處于狀態(tài)1,那么在下一個(gè)時(shí)間間隔有0.990454的概率保持在狀態(tài)1,有0.007383的概率轉(zhuǎn)移到狀態(tài)2,有0.006035的概率轉(zhuǎn)移到轉(zhuǎn)態(tài)3。
因?yàn)槊看谓y(tǒng)計(jì)后都會(huì)對(duì)通信模塊進(jìn)行修復(fù),所以后續(xù)運(yùn)行都為通信完好狀態(tài),即每次從狀態(tài)1開始,如公式(21)所示。
將公式(20)、公式(21)代入公式(9)和公式(11),經(jīng)過300次矩陣乘法運(yùn)算,可以快速得到Π(1)-Π(300)的值,利用公式(22)獲得每個(gè)時(shí)間斷面解析值與統(tǒng)計(jì)值的誤差。
式中:δi(j)為各時(shí)間斷面解析值與統(tǒng)計(jì)值的誤差;πi(j)為第j狀態(tài)的概率。
當(dāng)i=1,2,3,…,300時(shí),那么20個(gè)時(shí)間斷面的平均誤差如公式(23)所示。
利用公式(22)和公式(23)可以求得300個(gè)時(shí)間斷面通信模塊狀態(tài)處于狀態(tài)1、狀態(tài)2和狀態(tài)3的統(tǒng)計(jì)值與解析值的平均誤差,分別為1.38%、1.06%和12.49%。當(dāng)通信模塊處于狀態(tài)3時(shí),誤差較大的原因?yàn)闃颖緮?shù)量較少,造成πi'(j)基數(shù)較小,從而導(dǎo)致誤差較大。利用公式(14)、公式(16)可以求得該算例通信模塊的可靠性失效概率為Π(∞)=[0.998403 0.001416 0.000183],該結(jié)果滿足智能計(jì)量設(shè)備壽命不少于5 a的要求,且與統(tǒng)計(jì)數(shù)據(jù)相符。由上述分析可知,由狀態(tài)轉(zhuǎn)移概率矩陣A和當(dāng)前通信模塊狀態(tài)直接獲得通信模塊在下一階段的失效概率,其預(yù)計(jì)值在誤差范圍之內(nèi),說明通信模塊的通信失效的隨機(jī)過程具有馬爾科夫性。
該文對(duì)智能計(jì)量設(shè)備通信模塊的運(yùn)行狀態(tài)進(jìn)行分類并得到了3種狀態(tài),論證通信模塊失效過程具有馬爾科夫性,在足夠數(shù)量的樣本的支持下,可以統(tǒng)計(jì)出通信模塊失效的概率轉(zhuǎn)移矩陣A,由A和當(dāng)前通信模塊狀態(tài),可以快速解析獲得未來時(shí)間段的通信模塊失效概率及變化,根據(jù)Δt的取值不同,可以將其分別應(yīng)用于通信模塊的運(yùn)行、檢修及規(guī)劃,同時(shí)還可以完成計(jì)量設(shè)備的周期輪換等工作,從而提升了產(chǎn)品的可靠性。