蔣 敏 鄒德智 陳 庚 盧其龍
(91913部隊 大連 116041)
隨著科學(xué)技術(shù)的快速發(fā)展,特別是數(shù)字技術(shù)及各種超大規(guī)模集成電路的廣泛應(yīng)用,電子裝備尤其是測控電子裝備結(jié)構(gòu)越來越復(fù)雜,功能越來越完善,自動化程度也越來越高[1]。隨著靶場職能使命的拓展,測控裝備在試驗中發(fā)揮越來越重要的作用。同時,在裝備使用過程中,發(fā)生故障在所難免,裝備發(fā)生故障后,就會使裝備的效益受損,同時也會產(chǎn)生測試流程復(fù)雜、測試時間長、維修保障困難、維修費用高等諸多問題,嚴(yán)重影響了電子裝備的完好性和壽命周期。如何有效地對裝備進行故障定位分析,及時高效地排除裝備故障,實現(xiàn)測控裝備的科學(xué)化、精細(xì)化管理,為裝備建設(shè)提供優(yōu)質(zhì)高效的決策信息,對于提高裝備的保障能力具有重要的意義[2]。
目前,測控裝備主要有遙測、雷測、光測、通信等電子裝備,主要擔(dān)負(fù)飛行器的飛行軌跡測量、光學(xué)跟蹤、時統(tǒng)通信等使命任務(wù),但是受諸多因素影響,裝備也呈現(xiàn)了不同程度的故障率,嚴(yán)重影響了裝備的效益,甚至?xí)绊懺囼炄蝿?wù)的順利完成。一般來說,裝備故障的成因主要有以下幾個因素。
1)人為操作不當(dāng)引起故障
對于測控裝備來說,其操作順序都有嚴(yán)格的要求,不能隨意操作,特別是對于事關(guān)安全的操作來說,更要慎之又慎。進行裝備操作時,未熟練掌握操作規(guī)程的操作手、錯誤的操作、參數(shù)設(shè)定等因素都有是損壞裝備的最直接“殺手”。例如:部分崗位操作手沒有經(jīng)過嚴(yán)格的培訓(xùn)就上崗,或者對裝備的基本操作規(guī)程不熟悉;沒有進行開機前的通電三檢查;忽視警告標(biāo)志、警告信號;操作錯誤,機械超速運轉(zhuǎn);沒有檢查電源相序;沒有及時觀察裝備的天線角度信息導(dǎo)致天線限位等,這些都是由于人為的操作不當(dāng)引起的裝備故障。
2)環(huán)境因素引起的故障
環(huán)境因素主要表現(xiàn)為溫度對裝備的影響[3]。很多測控裝備長期處于溫差變化很大的復(fù)雜環(huán)境,受溫差影響較大,當(dāng)溫度在上、下限溫度循環(huán)時,電子裝備交替膨脹和收縮,會使裝備中產(chǎn)生熱應(yīng)力和應(yīng)變。如果某些電子裝備產(chǎn)品內(nèi)部有瞬時的熱梯度(溫度不均勻性),或產(chǎn)品內(nèi)部鄰接材料的熱膨脹系數(shù)不匹配,則這些熱應(yīng)力和應(yīng)變將會加劇。這種應(yīng)力和應(yīng)變在缺陷處最大,它起著應(yīng)力集中的作用。這種循環(huán)加載使缺陷長大。最終可大到能造成結(jié)構(gòu)故障并產(chǎn)生電性能故障。
3)設(shè)計不合理引起的故障
由于技術(shù)知識水平所限,經(jīng)驗不足,可能沒有采取必要的措施而犯了設(shè)計考慮不周或疏忽大意的錯誤。裝備設(shè)計不合理包括硬件和軟件兩個方面。硬件設(shè)計不合理主要有:強度計算不準(zhǔn),材料選用不當(dāng),裝備外觀不安全,結(jié)構(gòu)不合理,操縱機構(gòu)不當(dāng),未設(shè)計安全裝置等。即使設(shè)計人員選用的操縱器是正確的,如果在控制板上配置的位置不當(dāng),也可能使操作工混淆而發(fā)生操作錯誤,或增加了操作工的反應(yīng)時間而忙中出錯。軟件設(shè)計不合理主要有:功能設(shè)計不完善,存在破壞正常運行能力的問題或隱藏的功能缺陷;操作界面布局不合理,易遭受病毒攻擊,風(fēng)險估計不足等,這些都有可能導(dǎo)致裝備發(fā)生故障。
4)裝備使用磨損引起的故障
測控裝備在使用過程中,由于輸進能量而運轉(zhuǎn),產(chǎn)生摩擦、振動,致使相對運動的零部件實體產(chǎn)生磨損,這種有形磨損即稱為使用磨損[4]。使用磨損結(jié)果的一般表現(xiàn)為,裝備零部件尺寸、幾何外形改變,裝備零部件之間公差配合性質(zhì)改變,導(dǎo)致工作精度和性能下降,甚至零件損壞,引起相關(guān)其他零部件損壞而導(dǎo)致事故。例如,裝備在轉(zhuǎn)場至野外站點便會由于摩擦、振動等因素導(dǎo)致裝備受損;裝備在野外站點或內(nèi)場進行調(diào)試時也會產(chǎn)生使用磨損。
除以上因素外,測控裝備壽命期內(nèi),由于自然氣力的作用或因保管不善而造成的銹蝕、老化、腐朽,自然環(huán)境的變化,維修不專業(yè)等都可能導(dǎo)致故障。
從裝備管理的角度來說,有很多技術(shù)可以實現(xiàn)對裝備故障的定位、診斷、分析以及排故,現(xiàn)在主要介紹兩種方法。
1)基于OLE技術(shù)的故障診斷軟件平臺
目前,很多測控裝備都有相應(yīng)的軟件平臺對其進行故障診斷、定位以及分析?;贠LE技術(shù)的故障診斷軟件平臺的主要機理:針對不同型號的測控裝備,根據(jù)故障分析理論融合先進的虛擬儀器測試技術(shù)、人工智能分析方法、專家知識庫,采用OLE、COM等先進的技術(shù),通過COM接口搭建功能框架,然后在框架內(nèi)根據(jù)需求添加各種功能模塊,從而研發(fā)一套可以進行實時診斷的故障診斷軟件平臺[5]。此平臺可以完成測控裝備故障電路板型號統(tǒng)計和元器件統(tǒng)計分析、故障趨勢分析和預(yù)測試功能,實現(xiàn)故障診斷測試、信息分析反饋的融合,達到對各類型數(shù)字、模擬及數(shù)?;旌想娐钒暹M行測試、分析和診斷的目的。這類軟件平臺各模塊的添加具有相對的獨立性,通過主框架程序進行數(shù)據(jù)交換,并且可進一步改進或者添加新的功能模塊。
2)基于故障樹的裝備排故訓(xùn)練方法
故障樹是將抽象的樹形結(jié)構(gòu)以圖形化的方式顯示出來,使用戶可以更直觀地看到排故思路[6]。操作信息則是用戶在拖動排故工具到檢測點時,系統(tǒng)反饋給用戶的提示。為增強排故模塊的實用性,采用以單臺裝備的信息流程圖為基準(zhǔn),采用頁面腳本技術(shù)模擬整顆故障樹,實現(xiàn)了在一系列裝備實物圖片上通過虛擬儀器工具完成故障檢測、定位與修復(fù)的功能。仿真過程中,以歷史故障現(xiàn)象作為節(jié)點,以裝備信息流程為主線,映射可能引起故障的相關(guān)節(jié)點,以不同類型的裝備為單位生成一整顆故障樹,故障樹的各級子節(jié)點包含了各種故障原因分析和檢測修復(fù)方法。由于故障樹的操作存在大量的人機交互需求,所以,一般采用頁面腳本技術(shù)來模擬整顆故障樹,以實現(xiàn)裝備排故的技術(shù)仿真[7]。
對于裝備的狀態(tài)來說,可以將其定義為兩種狀態(tài):正常狀態(tài)和故障狀態(tài)。在正?;蚬收蠣顟B(tài)下,裝備可以集中體現(xiàn)為一系列測量信號特性的集合,如電流變化情況、AGC電壓值等,我們將這些可以測量的部位稱為測量點,測量點測得的信號特性為測量值(測量點和測量值一般不止一個)。當(dāng)裝備處于正常工作狀態(tài)時,各測量點的測量值是一定的;當(dāng)裝備處于某一故障狀態(tài)時,我們可以測得一系列測量點的測量值,對于不同的故障點,各測量值也不盡相同[8]。結(jié)合以往裝備的故障特點,假設(shè)裝備的測量點有n個,經(jīng)過對以往故障樣本進行統(tǒng)計分析,當(dāng)裝備共發(fā)生過m起故障時,即裝備共有m個故障點,我們可以定義如下矩陣Fm×n,用來描述不同的故障點,如式(1)所示:
其中,aij(i=1,2,…m,j=1,2,…n)表示裝備第i個故障點第 j個測量值。
裝備在不同故障點的n個測量值是裝備發(fā)生故障的客觀反映,故障定位的實質(zhì)是多屬性決策問題,是一個“黑箱”或者說是“灰箱”問題,之所以不能明確地分配各屬性之間的權(quán)重,是因為不能明確地描述它們之間的關(guān)系,更無法用定量關(guān)系式來表達它們之間的權(quán)重。所能提供的只是某個故障點的測量值(根據(jù)已知測量數(shù)據(jù)獲得訓(xùn)練樣本)。如果僅根據(jù)這些訓(xùn)練樣本就能對故障進行定位,就可以把故障定位時的不確定因素降到最低,這正是所需要的,也正是神經(jīng)網(wǎng)絡(luò)可以做到的,因此可以用神經(jīng)網(wǎng)絡(luò)方法建立數(shù)學(xué)模型[9]。
基于以上分析,我們可以構(gòu)建故障矩陣,用單位矩陣表示,如式(2)所示:
其中,矩陣Rm×m的第 j列表示裝備處于第 j個故障點(j=1,2,…m)。
需要說明的是,用單位矩陣表示裝備處于哪一故障,是神經(jīng)網(wǎng)絡(luò)建模的常用方法,例如,對于矩陣Rm×m來說,第 j列的第 j個數(shù)用“1”表示,其他數(shù)值用“0”表示,其意義為裝備處于第 j個故障,而不屬于其他故障。其實這一概念是所謂有競爭的學(xué)習(xí),設(shè)想這樣一種輸出模式[10]:對應(yīng)任何一組輸入,所有輸出單元中,只允許有一個處于激發(fā)態(tài),即取值為1,其它輸出單元均被抑制,即取值為0。一種形象的說法是,對應(yīng)任何一組輸入,要求所有的輸出單元彼此競爭,唯一的勝利者贏得一切,失敗者一無所獲,形成這樣一種輸出機制的網(wǎng)絡(luò)學(xué)習(xí)過程,稱為有競爭的學(xué)習(xí)。建立有競爭的網(wǎng)絡(luò)學(xué)習(xí)方法,由此產(chǎn)生的網(wǎng)絡(luò)可用來將一組輸入樣品自動劃分類別,相似的樣品歸于同一類別,因而激發(fā)同一輸出單元,這一分類方式,是網(wǎng)絡(luò)自身通過學(xué)習(xí),從輸入數(shù)據(jù)的關(guān)系中得出的。
根據(jù)以上分析,我們可以按照如下步驟建立基于神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型[11]。
1)選取訓(xùn)練樣本。樣本是以往歷史數(shù)據(jù)的集合,它直接關(guān)系到計算結(jié)果的可信度問題,可以對其進行合理的取舍,為了使計算的結(jié)果符合實際,文章以各故障點的一系列測量值Fm×n為神經(jīng)網(wǎng)絡(luò)輸入值,以構(gòu)建的單位矩陣Rm×m作為輸出值。
2)歸一化訓(xùn)練樣本
在神經(jīng)網(wǎng)絡(luò)訓(xùn)練之前,為使得各訓(xùn)練樣本度量單位統(tǒng)一,首先應(yīng)對原始樣本做歸一化處理,各指標(biāo)在[0,1]間取值。
3)定義網(wǎng)絡(luò)誤差和最大訓(xùn)練次數(shù)
在訓(xùn)練的過程中,必須度量網(wǎng)絡(luò)收斂到期望值的程度即為網(wǎng)絡(luò)誤差。對于給定的訓(xùn)練樣本集合來說,期望值是已知的。當(dāng)網(wǎng)絡(luò)誤差小于事先給定值時,神經(jīng)網(wǎng)絡(luò)滿足精度要求,此時神經(jīng)網(wǎng)絡(luò)具備了識別能力。
最大訓(xùn)練次數(shù)的選取應(yīng)該根據(jù)訓(xùn)練誤差的收斂情況進行合理取值,取值過大,收斂速度慢,取值過小,則有可能達不到網(wǎng)絡(luò)允許的誤差要求。因此,需要在樣本訓(xùn)練過程中實時進行調(diào)整。
4)進行神經(jīng)網(wǎng)絡(luò)訓(xùn)練
編寫神經(jīng)網(wǎng)絡(luò)應(yīng)用程序,利用反向傳播算法進行訓(xùn)練,反向傳播算法的基本思想是調(diào)整權(quán)值使網(wǎng)絡(luò)誤差最小,也稱梯度下降法[12]。為驗證建立的神經(jīng)網(wǎng)絡(luò)模型的精確性,可以重新將樣本數(shù)據(jù)Fm×n作為模型的輸入,然后求得其輸出值,與構(gòu)建的單位矩陣Rm×m進行匹配,對其進行方差分析。
通過有競爭的學(xué)習(xí),建立神經(jīng)網(wǎng)絡(luò)模型后,我們最終的目的是通過對以往的測量值(樣本數(shù)據(jù))進行分析,找出他們之間內(nèi)在關(guān)系,當(dāng)裝備發(fā)生故障時,獲取測量點的信號特性,得到一系列測量值作為神經(jīng)網(wǎng)絡(luò)模型的輸入,得到輸出結(jié)果,對其進行判斷分析,找到裝備的故障點,從而可以達到故障定位的目的[13]。
文章根據(jù)測控裝備故障特點,提出了一種基于有競爭的學(xué)習(xí)方式的神經(jīng)網(wǎng)絡(luò)建模方法,此模型考慮了收斂速度、擬合效果等多種因素。這種方法比較適用于故障樣本數(shù)量比較多的情況,此方法具有定位速度快、效率高的特點,同時較好地解決了在裝備定位過程中可控因素與不可控因素之間的關(guān)聯(lián),對于提高裝備故障管理水平、提高裝備的保障能力具有重要的意義。