趙先浩,劉 飛
(安徽南瑞繼遠(yuǎn)電網(wǎng)技術(shù)有限公司,安徽 合肥 230088)
分布式控制系統(tǒng) (Distributed Control System)的各種信號通道均由輸入輸出(Input/Output)卡件提供,I/O卡件連接DCS中分散處理單元(Distributed Processing Unit)與現(xiàn)場的生產(chǎn)過程,其故障率很大程度上決定了DCS系統(tǒng)的性能、可靠性。目前I/O卡件的可靠性數(shù)據(jù)不足,對I/O卡件故障率的研究不多,DCS系統(tǒng)本身可靠性監(jiān)測在電力企業(yè)應(yīng)用也不多。
文獻(xiàn)[1]通過將DCS基本控制單元分解為基本的儀表系統(tǒng),構(gòu)建可靠性狀態(tài)圖及馬爾可夫可靠性數(shù)學(xué)模型,并進(jìn)行了可靠性定量分析,需要大量數(shù)據(jù)求取故障率;文獻(xiàn)[2-3]分析了運(yùn)行過程中DCS的故障和安全隱患等問題以及影響I/O卡件故障率的因素,文中雖提出了解決問題的策略,但沒有定量分析I/O卡件的故障率;由于貝葉斯理論使用大量的先驗(yàn)信息及樣本信息,可提高可靠性評估的準(zhǔn)確性,因其發(fā)展成熟,貝葉斯理論廣發(fā)應(yīng)用于各種評估及決策中,如航空、電力、機(jī)械[4-8]等領(lǐng)域。在DCS各系統(tǒng)可靠性監(jiān)測系統(tǒng)的基礎(chǔ)上,利用貝葉斯分析方法,獲取樣本數(shù)據(jù),結(jié)合先驗(yàn)信息對壽命服從指數(shù)分布的I/O卡件故障率進(jìn)行分析研究。
基于某電廠的Ovation系統(tǒng),進(jìn)行DCS可靠性監(jiān)測系統(tǒng)的研究。數(shù)據(jù)采集環(huán)節(jié)中,采用內(nèi)部協(xié)議從Ovation數(shù)據(jù)庫分別獲取I/O卡件狀態(tài)數(shù)據(jù)及環(huán)境溫度的相關(guān)數(shù)據(jù)。在監(jiān)控平臺部分,針對OPC-Server利用OPC-Client進(jìn)行數(shù)據(jù)對接,并將實(shí)時(shí)數(shù)據(jù)對應(yīng)到組態(tài)軟件的實(shí)時(shí)數(shù)據(jù)庫,實(shí)時(shí)數(shù)據(jù)庫模塊負(fù)責(zé)實(shí)時(shí)數(shù)據(jù)庫的數(shù)據(jù)讀寫,完成基礎(chǔ)的數(shù)據(jù)解析,邏輯推理算法模塊完成系統(tǒng)整體推理和進(jìn)程推演,組態(tài)畫面,歷史數(shù)據(jù)訪問模塊可訪問查詢歷史數(shù)據(jù)及存儲歷史數(shù)據(jù)。如圖1所示為DCS可靠性監(jiān)測平臺,能記錄I/O各卡件各種異常狀態(tài)信息以及其故障、離線等狀態(tài)發(fā)生的時(shí)間,并統(tǒng)計(jì)記錄故障發(fā)生的次數(shù)等詳細(xì)信息,為DCS系統(tǒng)可靠性提供參考依據(jù)。
圖1 DCS可靠性監(jiān)測系統(tǒng)
圖1所示,通過實(shí)時(shí)數(shù)據(jù)庫及歷史數(shù)據(jù)庫,可以詳細(xì)獲取卡件故障時(shí)間等數(shù)據(jù)。I/O卡件故障發(fā)生的時(shí)間變量用 x(i)表示,即 X=[x(1),x(2),…,x(n)],其中i=1,2,…,n表示I/O卡件第i次發(fā)生的故障,時(shí)間的表示方式形如“x(i)=年 /月 /日 時(shí) /分 /秒”,例如 x(6)=2015/3/11 09∶33∶24,對于可修復(fù)的設(shè)備,修復(fù)設(shè)備需要的時(shí)間遠(yuǎn)小于其正常運(yùn)行時(shí)的時(shí)間,并且其修復(fù)如新,因此修復(fù)時(shí)間可以忽略不計(jì),此時(shí)設(shè)備相鄰兩次故障之間的時(shí)間間隔MTBF以h為單位則
以時(shí)間T表示產(chǎn)品的壽命,以ts表示規(guī)定的時(shí)間,產(chǎn)品可靠度的數(shù)學(xué)表達(dá)式為
故障率λ是指某一設(shè)備在運(yùn)行過程中單位時(shí)間內(nèi)出現(xiàn)故障的次數(shù),常用來表示可靠性,其表達(dá)式為
式中:Ttotal為所有元件運(yùn)行時(shí)間的總和;N為Ttotal時(shí)間內(nèi)失效元件的總數(shù)。
反映設(shè)備故障率隨時(shí)間變化情況的威布爾分布[9]將設(shè)備故障分為早期故障、偶發(fā)故障和耗損故障3個(gè)階段,設(shè)備故障浴盆曲線如圖2所示。早期故障階段,設(shè)備出現(xiàn)的原因基本上是設(shè)計(jì)錯(cuò)誤、工藝缺陷等,其故障率隨著設(shè)備工作時(shí)間的增加而逐漸降低。偶然故障階段,設(shè)備故障率較低,此時(shí)故障率近似穩(wěn)定為某一不變的常數(shù)。耗損故障階段,設(shè)備經(jīng)歷了長時(shí)間運(yùn)行,一些元件老化、磨損嚴(yán)重,此階段隨著時(shí)間的增加,設(shè)備的故障率急速上升。
圖2 設(shè)備故障浴盆曲線
投入運(yùn)行之前,廠家的產(chǎn)品一般都進(jìn)行試運(yùn)行,使得產(chǎn)品運(yùn)行過程加快,盡可能早的渡過早期故障階段,從而降低設(shè)備的故障率,提高可靠性。以某電廠實(shí)際情況為例,其I/O卡件渡過了早期故障階段,但遠(yuǎn)未到達(dá)耗損故障階段,目前仍處在偶然故障階段,因此I/O卡件壽命服從指數(shù)分布,產(chǎn)品故障率為一近似穩(wěn)定的常值。產(chǎn)品壽命t服從指數(shù)分布的函數(shù),其表達(dá)式為
此時(shí)故障率密度函數(shù)為
基于在線監(jiān)測系統(tǒng),獲取實(shí)時(shí)監(jiān)測的I/O卡件的故障時(shí)間數(shù)據(jù),用貝葉斯方法修正I/O卡件故障率。
貝葉斯方法將待估計(jì)的參數(shù)看作某種先驗(yàn)概率分布的隨機(jī)變量。貝葉斯估計(jì)法[10-11]通過待估參數(shù)的先驗(yàn)分布和樣本觀測值,求出待估參數(shù)的后驗(yàn)分布,然后求出后驗(yàn)分布的數(shù)學(xué)期望值即是待估計(jì)參數(shù)的貝葉斯估計(jì)數(shù)值。
式(6)便是貝葉斯公式,式中f(t|λ)是樣本對λ的條件密度。從上式可以看出后驗(yàn)分布的結(jié)果依賴于在線監(jiān)測的數(shù)據(jù),可以通過在線監(jiān)測手段獲得在線數(shù)據(jù),持續(xù)更新設(shè)備故障率。
設(shè)故障失效的時(shí)間 t={t1,t2,…,tn}服從指數(shù)分布,其似然函數(shù)為
設(shè)待估參數(shù)為λ,t∈Ω,Ω為參數(shù)空間。在取樣之前λ在Ω上的分布稱為先驗(yàn)分布,通常用π(λ)表示先驗(yàn)分布的概率密度,是實(shí)驗(yàn)前可以提供的信息。 λ 對樣本 t=(t1,…,tn)的條件分布為后驗(yàn)分布,它集中了樣本與先驗(yàn)信息λ有關(guān)的全部信息,表示為
先驗(yàn)信息的正確反映以及推斷的前提在于先驗(yàn)分布的選取。目前先驗(yàn)分布的選取方法有共軛分布法、自助法(Bootstrap)、最大熵原則、Jeffreys原則等[12]。本文運(yùn)用共軛先驗(yàn)分布選取合適的先驗(yàn)分布,故障率λ的先驗(yàn)分布為伽馬分布Gamma(α,β),則其后驗(yàn)分布為
由上節(jié)知,故障率λ的先驗(yàn)分布為Gamma(α,β),其中 α,β為超參數(shù)。 本文利用先驗(yàn)矩方法[13],充分利用先驗(yàn)信息求解超參數(shù)。驗(yàn)前信息的來源較多,可以通過理論分析或仿真實(shí)驗(yàn)、專家信息及工程經(jīng)驗(yàn)、歷史實(shí)驗(yàn)數(shù)據(jù)、相似系統(tǒng)信息獲取驗(yàn)前信息?,F(xiàn)已獲取 I/O 卡件的故障率數(shù)據(jù) λ1,λ2,…,λk,則其均值和方差分別為:
故障率λ的先驗(yàn)分布形式如下
可知λ的均值和方差分別為[9]:
其中通過已有的信息即大批I/O卡件故障率的數(shù)據(jù),統(tǒng)計(jì)得到其均值和方差,即可求解到 α,β的值。
以通用數(shù)據(jù)作為先驗(yàn)數(shù)據(jù),統(tǒng)計(jì)相同機(jī)組、相同廠家的相同設(shè)備的故障率數(shù)據(jù),求解其均值和方差,代入式(13)和式(14),可求出超參數(shù) α,β的值。以電廠DCS各系統(tǒng)可靠性監(jiān)測系統(tǒng)收集到的現(xiàn)場數(shù)據(jù)作為樣本數(shù)據(jù)。故障率λ服從Gamma分布,由式(9)知λ的后驗(yàn)值為
以某電廠600 MW機(jī)組的DCS為例。收集同種I/O卡件故障間隔時(shí)間的歷史信息,計(jì)算均值及方差,通過圖1DCS各系統(tǒng)可靠性監(jiān)測平臺,可獲取同種I/O卡件的故障時(shí)間,如表1所示。
表1 某類型I/O卡件故障統(tǒng)計(jì)表
已知先驗(yàn)信息,由式(10)和(11),可求得 α=2.98,β=3.84×105,如表1可看作該電廠3次實(shí)驗(yàn),每次的MTBF為故障時(shí)間與故障I/O卡件使用時(shí)間之差,失效次數(shù) n1=n2=n3=1, 運(yùn)行時(shí)間 t1=17 376 h,t2=31 272 h,t3=34 080 h。利用得到的樣本數(shù)據(jù)及先驗(yàn)信息,由式(15)求得故障率λ的后驗(yàn)值為1.3×10-5/h。
對于壽命服從指數(shù)分布的I/O卡件,首先根據(jù)共軛分布方法將逆伽馬分布作為指數(shù)總體分布均值θ的先驗(yàn)分布,采用先驗(yàn)矩的方法確定超參數(shù),借助DCS各系統(tǒng)可靠性監(jiān)測平臺獲取實(shí)時(shí)樣本數(shù)據(jù),利用貝葉斯方法求出I/O卡件故障率,綜合先驗(yàn)及樣本信息更新了I/O卡件的故障率,得到了更加合理、更加真實(shí)的故障率。可為DCS故障診斷、壽命管理及預(yù)防性檢修提供依據(jù)。隨著DCS各系統(tǒng)可靠性監(jiān)測系統(tǒng)長期投入使用,將不斷積累更多的樣本數(shù)據(jù)來更新I/O卡件的故障率,對先驗(yàn)信息的依賴性更小,得到更為準(zhǔn)確的故障率。