劉海江,張 恒,汪 乾,劉勁松
(同濟大學 機械與能源工程學院,上海 201804)
高精密航天器由上千個節(jié)點、上萬個元器件組成,具有結構復雜、造價高、小批生產,運行穩(wěn)定性與可靠性要求極高的特點。其生產制造包含諸多工藝環(huán)節(jié);由于各類工藝技術的限制,在生產過程中難免引入多余物顆粒。當航天器在飛行過程中發(fā)生振動時,游離的多余物顆??赡軙茐暮教炱鲀鹊木軝C械結構或造成電子線路短路,影響航天器的正常工作,嚴重時可能造成航天器墜毀,導致無法挽回的損失。因此,需要準確判斷航天器內多余物的存在情況。
焊錫粒多余物是高精密航天器內部多余物的主要來源,也是使產品喪失主要功能、造成潛在致命故障的一種多余物類型。實現(xiàn)對焊錫粒多余物粒徑大小的識別,有助于細化評估多余物的危害度,指導改進生產環(huán)節(jié),同時為航天器開艙排查工作提供數(shù)據(jù)參考。
對于顆粒粒徑的檢測方法較多,主要包括直接測量法、篩分法、顯微鏡法、數(shù)字圖像分析法、沉降法、激光衍射法和聲發(fā)射檢測法等。前6 種方法均是在獲得顆粒的基礎上直接進行粒徑檢測。在不能直接獲得顆粒的情況下,可利用聲發(fā)射檢測方法對顆粒粒徑進行識別,其基本原理是通過對顆粒碰撞聲信號的分析來實現(xiàn)顆粒粒徑判別,具有高效性與實時性。戚樂在顆粒碰撞聲信號分析中提出基于混沌理論的多余物粒徑識別方法,通過選取3 種混沌特征量,應用聚類分析算法對4 種粒徑多余物進行了粒徑特征識別。
本文借鑒傳統(tǒng)粒子碰撞噪聲檢測(PIND)方法,基于信號時域與頻域分析技術,提取多個信號時域與頻域特征參數(shù),并通過Fisher 比量化各個特征參數(shù)對于粒徑識別的貢獻度,篩選出更有效的識別參量構建焊錫粒多余物粒徑特征識別模型,進而提高識別準確率;提出基于均值聚類的多余物粒徑識別模型,通過自適應類別數(shù)值的調整,利用歐氏距離進行多余物粒徑等級的分類。從而實現(xiàn)混合粒徑的識別,指導檢測人員進行多余物排查、工藝過程改進和危害性評估,以滿足航天器的高可靠性要求。
根據(jù)航天某院內部管控標準,考慮實際工程需要,將焊錫多余物粒徑等級范圍劃分為4 檔,見表1所列。
表1 多余物粒徑等級劃分Table 1 Grading of particle size for remnants
當航天器內存在多余物時,由于粒徑區(qū)分度僅為mm 級,且在同一粒徑等級下的多余物在航天器內的碰撞狀態(tài)呈現(xiàn)隨機性,將影響多余物粒徑特征識別,主要體現(xiàn)在:
1)粒徑區(qū)分度不足對焊錫多余物粒徑特征參數(shù)選擇的影響
粒徑區(qū)分度不足會使得同種材質下不同粒徑等級多余物碰撞所產生的聲脈沖信號具有一定的相似性,因此較難選取能夠有效區(qū)分多余物粒徑等級的特征參數(shù);同時,鑒于信號能量在頻域的分布變化有著較強的一致性,應更多考慮信號的其他時域和頻域特征信息。
2)多余物隨機碰撞產生的特征參數(shù)類間交叉對識別模型構建的影響
在實際試驗過程中,不同粒徑多余物由于碰撞速度、碰撞位置的不同,可能使相鄰粒徑等級的脈沖信號存在特征參數(shù)交叉;且4 個等級的粒徑尺寸之間具有連續(xù)性,故多余物隨機碰撞可能給相鄰粒徑等級的識別帶來特征參數(shù)類間交叉問題,降低對單個多余物脈沖粒徑分類的準確率。因此,需要設計一種可綜合每個多余物脈沖特征參數(shù)的粒徑識別模型。
根據(jù)某航天制造廠實際要求,單個多余物總體識別準確率應>80%,混合多余物總體識別準確率應>70%。針對第1 章所述影響多余物粒徑特征識別的2 個主要因素,我們提出一套針對多余物粒徑特征參數(shù)選擇與識別的方案,具體如下:
1)選取能夠有效區(qū)分粒徑的特征參數(shù)
從脈沖信號的時域與頻域分析出發(fā),通過對信號進行多層面分析,提取出多個可以較全面描述脈沖時域與頻域特征的參數(shù)。以波形的幅值變化、波形分布情況反映信號時域特性,以頻譜峰值頻率、頻譜質心與頻譜分布情況反映信號頻域特性,綜合二者即可構建初始粒徑特征參數(shù)向量。
2)基于Fisher 比的粒徑特征參數(shù)篩選
通過有監(jiān)督的特征篩選方式對每個特征對粒徑區(qū)分的能力大小進行度量。Fisher 比是用于衡量特征向量各維分量有效性的參數(shù),基于Fisher 比的特征分析方法可得到每個時域與頻域特征對粒徑區(qū)分能力的貢獻大小,再按照貢獻率從大到小的順序選取貢獻率之和超過90%的特征作為粒徑識別模型的輸入特征參數(shù),實現(xiàn)特征篩選。
3)基于均值聚類算法構建多余物粒徑識別模型
篩選出多余物粒徑識別特征參數(shù)后,根據(jù)多余物在航天器內部的隨機碰撞特性,基于同一粒徑等級下的多余物粒徑特征參數(shù)在多次試驗中應符合正態(tài)分布的假設,結合一個信號中的所有焊錫粒脈沖的綜合特征量進行分析后確定粒徑等級范圍,從而弱化特征參數(shù)類間交叉對粒徑識別的影響。
為充分利用每一個多余物在反映粒徑信息上的作用,采用均值聚類算法對眾多的不同粒徑多余物進行聚類分析,基于獲得的聚類中心值和4 種粒徑的理論中心值進行歐氏距離求解,依據(jù)一定的閾值區(qū)分多余物粒徑,從而實現(xiàn)粒徑的識別。均值聚類算法可對無標記的不同粒徑等級訓練樣本進行學習,能夠獲得不同粒徑等級下的特征參數(shù)分布規(guī)律,適用于需綜合所有樣本分布下的單類和混合粒徑的識別問題。
4)試驗驗證與數(shù)據(jù)分析
挑選4 種不同粒徑等級的焊錫多余物顆粒,針對航天器內含有單個和2 個多余物的14 種不同粒徑存在情況進行模型識別準確率驗證。
3.1.1 時域特征提取
時域信號包含的信息量大,具有直觀和易于理解等特點,是進行模式分類特征選擇常用的原始依據(jù)。通過分析時域波形的幅值變化、波形分布等,可以對不同粒徑進行初步特征構建。
1)信號峰值
對于信號(),其峰值表示的是信號動態(tài)范圍的最大值。對于多余物脈沖而言,其信號峰值描述的是一段信號的極限值情況,反映的是脈沖的幅值,其定義為
2)信號的均方值
均方值是評價一段動態(tài)信號強度的指標,反映了信號相對于零值的波動情況。幅值的平方可用于描述能量大小,因此均方值可代表單位時間內信號的平均功率,也稱為信號功率,其數(shù)學表達式為
3)峰值因子
信號的峰值與均方值分別反映信號的極限值和平均功率。除這2 種有量綱的時域特征,對信號的時域特征描述還經常采用無量綱指標來表征信號的分布特征。多余物脈沖信號是典型的突發(fā)型脈沖信號,具有明顯的高峰值特點。為了描述多余物脈沖信號在時域上的分布情況,采用峰值因子來表征峰值在波形中的極端程度,
式中表示信號有效值。
3.1.2 頻域特征提取
頻譜是信號在頻域上極為重要的特征,它能反映信號的頻率成分及其分布情況,通過對信號求解功率密度譜可以較為直觀且準確地反映頻譜特性。
1)峰值頻率
峰值頻率的定義為信號頻譜(功率密度譜)峰值處所對應的頻率,表示在一個信號的頻譜曲線上極大值所對應的頻率值。它表示的是組成這個脈沖波的所有簡諧成分中能量最強成分的頻率值。當一個信號的頻譜曲線為()時,其峰值頻率的定義為
2)頻譜質心
與時域特征中的信號峰值相似,峰值頻率是對脈沖波的能量最強成分的頻率值的描述,而對于整個頻譜,反映信號每個頻率成分的綜合體現(xiàn)也十分重要。頻譜質心可從一定程度上對信號脈沖分布的集中位置進行表征,是對各個頻率成分的綜合體現(xiàn),其定義式為
式中:表示頻譜質心;表示下限截止頻率;表示上限截止頻率。對于已知功率密度譜的離散信號,其頻譜質心為
式中:表示起始采樣點;表示終末采樣點。3)頻譜方差
頻譜方差是指頻譜數(shù)據(jù)的方差,表征的是頻譜的分散程度,是一種頻譜分布特征指標。頻譜分布集中的信號,其方差較小;頻譜分布離散的信號,其方差較大。頻譜方差的定義式為
3.1.3 基于Fisher 比的特征篩選
Fisher 比是用于衡量特征向量各維分量有效性的參數(shù),廣泛應用于特征篩選領域。某個特征分量的Fisher 比越高則表明該分量的類別區(qū)分度越好,
式中:表示特征分量的Fisher 比;表示特征分量的類內散度之和;表示特征分量的類間散度。和的定義分別為:
在得到初始特征向量中各維分量的Fisher 比后,選擇前個累計貢獻率達到90%的分量組合成維改進特征參數(shù),用作后續(xù)多余物粒徑識別特征參數(shù),其中貢獻率的定義為
3.1.4 多余物粒徑特征識別參數(shù)構建
對每個多余物脈沖求解時域與頻域特征參數(shù),構建初始參數(shù)向量=[,Ψ,,,,σ]。通過試驗,將有標簽的不同粒徑多余物初始參數(shù)向量經過有監(jiān)督的Fisher 特征篩選,得到每個特征的Fisher 比。
本文在4 個多余物粒徑等級(參見表1)內各選取100 組脈沖求解初始參數(shù)向量作為Fisher 比算法的輸入,得到每個特征的Fisher 比如圖1 所示。
圖1 初始參數(shù)向量R 中每個特征的Fisher 比Fig. 1 Fisher ratio of each feature in the initial parameter vector R
按照特征貢獻率的定義,當只考慮采用初始參數(shù)向量中的特征參數(shù)進行粒徑區(qū)分時,時域與頻域特征參數(shù)對多余物粒徑的區(qū)分貢獻率如圖2所示??梢钥闯?,第1 維(信號峰值)和第2 維(信號均方值Ψ)這2 個特征的粒徑區(qū)分貢獻率之和已超過90%,遠遠大于其他特征的貢獻率。這表明,多余物的粒徑信息主要集中于脈沖信號的時域特征內,給人的直觀感受是“粒徑越大,聲脈沖強度越大”。其原因是,同為焊錫材質使得不同粒徑脈沖的頻域分布具有極強相似性,導致較難利用頻域特征來區(qū)分粒徑等級。
圖2 初始參數(shù)向量R 中每個特征的粒徑區(qū)分貢獻率Fig. 2 The contribution rate of each feature in the initial parameter vector R
為提高計算效率和準確性,本文最終采用信號峰值和信號均方值Ψ構建最終的粒徑特征識別向量=[,Ψ]作為多余物粒徑識別模型的輸入量。
在對試驗獲得的信號進行脈沖提取與區(qū)分后,獲得每個焊錫粒脈沖的粒徑特征識別向量。為解決同一等級粒子在試驗中由于碰撞速度、部位等的不同所導致的在較小粒徑區(qū)分度下的特征參數(shù)部分重疊問題,可基于統(tǒng)計的特性,考慮所有脈沖信息進行綜合判斷。均值聚類就是一種基于無監(jiān)督學習的通過對所有無標記樣本進行數(shù)據(jù)內在性質和規(guī)律揭示的算法,因此本文選取該方法構建多余物粒徑識別模型。
3.2.1均值聚類原理
聚類屬于無監(jiān)督學習方法,是一個將在某些方面具有相似性的數(shù)據(jù)成員進行分類組織的過程,通過對無標記訓練樣本的學習來發(fā)現(xiàn)其內在結構的技術,屬于數(shù)據(jù)挖掘的重要手段之一。均值聚類是一種劃分聚類算法,原理簡單、易于實現(xiàn)、收斂速度快,被廣泛使用于故障診斷、模式識別等領域。均值聚類采用距離作為相似性度量,基于此發(fā)現(xiàn)給定數(shù)據(jù)集中個類別,且每個類的中心基于類中所有值的均值確定。
均值聚類算法的基本步驟如下:
5)計算點集中全部數(shù)據(jù)的平方誤差E,若|E–E|<,即質心基本穩(wěn)定不發(fā)生變化時結束算法,否則返回步驟2)再次計算。
3.2.2值確定
在均值聚類算法中,類別數(shù)的選擇是極其重要的,將直接影響聚類結果的準確性。
在粒徑種類識別中,類別數(shù)的選擇與航天器內多余物的個數(shù)直接相關。當航天器內的多余物僅有1 個時,多余物粒徑種類僅有1 種,可以視為聚類類別數(shù)=1 的特殊情況;當多余物數(shù)量超過1 個,為(>1)個時,該航天器內多余物粒徑種類最多為種,表示這個多余物的粒徑等級各不相同,此時取=才能保證對每類粒徑均可區(qū)分。因此,為充分區(qū)分多余物粒徑等級并提高區(qū)分度,可采用脈沖發(fā)生密度來判斷多余物個數(shù),從而實現(xiàn)值的自適應調整。
本文通過記錄多余物試驗信號里的多余物脈沖總數(shù)和外部回轉周期數(shù)來求解每個多余物試驗信號的脈沖發(fā)生密度,將其作為確定值的特征參數(shù)。脈沖發(fā)生密度=/,其中,表示一個測試信號中的有效多余物脈沖個數(shù),表示一次試驗中航天器的回轉圈數(shù),閾值的選取由試驗確定。
3.2.3 多余物粒徑識別模型
在得到個多余物脈沖粒徑特征識別向量組成的特征集后,首先按照不同的粒徑等級分類求得每個等級的粒徑中心值,計算公式為
取4 個粒徑等級各200 組數(shù)據(jù),共800 組數(shù)據(jù)歸一化后進行中心值計算,得到的4 個粒徑等級的中心值如表2 所示。
表2 不同等級多余物粒徑中心值Table 2 The central value of the particle size of different grades of unwanted matter
之后,通過脈沖發(fā)生密度確定好類別數(shù)的取值,將值作為關鍵參數(shù)輸入聚類模型,同時隨機選取初始聚類中心并采用歐氏距離作為樣本相似性度量。利用多余物試驗獲得的多余物脈沖求得特征識別向量集后,輸入構建好的均值聚類模型中即可完成對樣本的聚類劃分,并最終獲得每類簇的聚類中心。該聚類中心即是對該簇內每個脈沖粒徑特征的綜合表示。為排除異常值對聚類效果的影響,當完成聚類后,若屬于某一類的樣本個數(shù)小于總聚類個數(shù)的一定比例時,將該類作為異常簇處理,其聚類中心用最鄰近聚類簇的中心代替。該比例值需通過試驗確定,當=2 時,取該比例值為10%。
圖3 展示了=4 時,對4 種等級粒徑數(shù)據(jù)(各200 組數(shù)據(jù))的聚類效果;不同等級多余物聚類中心值見表3。從圖3 和表3 可以看出,不同粒徑等級的多余物在由信號峰值和信號均方值組成的二維特征平面內得到了較好的區(qū)分,且聚類中心與表2中的多余物粒徑等級中心值相對一致。
圖3 4 種等級粒徑聚類示意Fig. 3 Schematic diagram of four grades of particle size clustering
表3 不同等級多余物聚類中心Table 3 Cluster center values of different grades of remnant
在獲得每類簇的聚類中心后,需要將其與每個等級的中心值進行相似性度量。分別求解每類簇的聚類中心與4 個粒徑等級中心值的歐氏距離,根據(jù)距離最小原則,取距離粒徑等級中心最近的為該類簇的粒徑等級。最后將判別結果進行同類合并后得到最終粒徑等級的識別結果。
現(xiàn)有航天器生產過程已從多余物產生的源頭進行嚴格控制,因此總裝后還殘留多余物的航天器中多余物的數(shù)量極少,基本為1 個,少數(shù)情況會出現(xiàn)2 個。也就是說在絕大多數(shù)情況下,同一個試驗航天器內存在的不同多余物粒徑等級類別最多為2 種,因此本文的研究重心就放在航天器內僅含單個和2 個多余物的情況上。在模型實際應用過程中,含有2 個相同粒徑等級多余物的情況在完成聚類后,若僅通過歐氏距離進行判斷很可能會誤判為其他粒徑等級組合情況,例如含有2 個等級L3 的多余物極易與含有1 個等級L2 和1 個等級L3 或含有1 個等級L3 和1 個等級L4 的情況混淆。為提高此種情況下的識別準確率,本文采用中心區(qū)域樣本個數(shù)輔助歐氏距離進行判別。
設2 個粒徑等級簇聚類中心值為(,)和(,),中心(,)的坐標為((+)/2, (+)/2),定義距離=|–|/4,=|–|/4,則聚類中心區(qū)域為由點(–,+)、(+,+)、(–,–)和(+,–)組成的矩形區(qū)域。同樣,聚類中心區(qū)域為由點(–,+)、 (+,+)、(–,–)和(+,–)組成的矩形區(qū)域;中心區(qū)域為由點(–,+)、(+,+)、(–,–)和(+,–)組成的矩形區(qū)域。通過試驗確定,當中心區(qū)域中的樣本個數(shù)大于聚類中心區(qū)域和聚類中心區(qū)域的樣本平均個數(shù)的70%時,則認為聚類后的2 組樣本簇間存在連續(xù)性,以距離中心點(,)最小歐氏距離的粒徑等級中心值作為這2 個類簇的實際值。
本文針對多余物粒徑特征識別的基本需求,以高精密航天器為被測對象,借鑒典型顆粒碰撞噪聲檢測技術,采用一套回轉式多余物自動檢測系統(tǒng)進行多余物檢測。利用傳聲器對試驗信號進行采集,應用脈沖提取、參數(shù)分析、模式識別與聚類分析等算法實現(xiàn)多余物粒徑識別。
多余物自動檢測系統(tǒng)主要由機械與電氣控制集成系統(tǒng)和信號檢測系統(tǒng)2 部分構成,如圖4 所示。
圖4 高精密航天器多余物自動檢測系統(tǒng)Fig. 4 Automatic detection system of remnants inside high precision spacecraft
在多余物檢測信號中,除作為目標信號的多余物脈沖外,其余信號均為干擾聲信號。干擾信號的存在會影響多余物的檢測結果,需要對其進行消除或抑制。干擾信號的來源主要與檢測系統(tǒng)和航天器結構組成有關,包括:驅動裝置中電機、減速器產生的驅動裝置噪聲;由于航天器的裝夾存在間隙產生的工裝噪聲。此外,地面振動噪聲和環(huán)境噪聲也產生一定干擾。
對于工裝噪聲、地面振動噪聲和環(huán)境噪聲,可采用物理降噪方式予以抑制,如:在工裝夾具上加入彈性材料來消除不同類型航天器裝夾間隙產生的工裝噪聲;在設備機架與地基間安裝隔振材料來消除地面振動噪聲;采用隔音室消除環(huán)境噪聲。
由于檢測過程采用的是勻轉速回轉檢測方式,所以由電機、減速器產生的驅動裝置噪聲有著統(tǒng)計平穩(wěn)的特點,且為與碰撞聲信號不相關的加性噪聲。這類噪聲可采用降噪算法進行抑制,減弱其對多余物有/無檢測的干擾。
在多余物粒徑特征識別過程中,采用雙門限法提取多余物脈沖,排除干擾信號的影響,并基于脈沖的能量特征采用3原則剔除異常點,以確保不影響聚類模型的有效性。
經過物理降噪以及信號與數(shù)據(jù)處理降噪后,在聚類數(shù)據(jù)源中,相較于多余物脈沖,干擾信號的個數(shù)極少,對聚類模型的影響甚微。
本文針對航天器內最常出現(xiàn)的僅含單個和2 個多余物的情況進行粒徑識別方法的試驗驗證,每次測試在回轉機構轉速為勻轉速20 r/min 條件下測試150 s,識別結果如表4 所示。
表4 多余物粒徑識別試驗結果Table 4 Test results of particle size recognition for remnants
從試驗結果可以看出,在含單個和2 個多余物的情況下,本文所提出的多余物粒徑特征檢測方法的總體準確率為81.8%,滿足單個多余物總體識別準確率應>80%、混合多余物總體識別準確率應>70%的實際要求。
本文分析了焊錫粒多余物信號的時域、頻域特性,結合特征提取、Fisher 比特征篩選和均值聚類算法提出了一種航天器多余物粒徑識別方法,可對單類和混合粒徑多余物實現(xiàn)粒徑區(qū)分,主要研究內容包括:
1)從多余物脈沖的時域與頻域特性出發(fā),對信號進行多層面分析,提取出較全面描述其時域與頻域特征的參數(shù),構建初始參數(shù)向量。
2)通過基于Fisher 比的特征篩選方法對每個特征分量進行Fisher 比計算,得到每個特征對粒徑區(qū)分能力的貢獻率,再根據(jù)貢獻率大小選取信號峰值和信號均方值組合成為最終的粒徑特征識別向量。
3)提出基于均值聚類的多余物粒徑識別模型,通過自適應類別數(shù)值的調整,利用中心區(qū)域樣本個數(shù)輔助歐氏距離進行多余物粒徑等級的分類。
4)通過試驗驗證了在含單個和2 個多余物的情況下,本文所提出的多余物粒徑特征識別方法總體準確率為81.8%。該方法對其他材質的球形或類球形多余物的粒徑特征識別方法設計具有借鑒意義。