孫宇豪,李國(guó)通,3?,張鴿
(1 中國(guó)科學(xué)院微小衛(wèi)星創(chuàng)新研究院, 上海 201203; 2 中國(guó)科學(xué)院大學(xué), 北京 100049; 3 上海科技大學(xué), 上海 201210)(2019年10月18日收稿; 2020年1月21日收修改稿)
衛(wèi)星作為一個(gè)復(fù)雜度較高、涉及技術(shù)較廣且造價(jià)昂貴的綜合性系統(tǒng),由于所處空間環(huán)境的不確定性以及發(fā)射前測(cè)試的局限性,在軌運(yùn)行期間不可避免地會(huì)出現(xiàn)一些異?;蚬收?。在衛(wèi)星故障早期及時(shí)發(fā)現(xiàn)遙測(cè)數(shù)據(jù)異常對(duì)延長(zhǎng)衛(wèi)星使用壽命,保證衛(wèi)星通信、導(dǎo)航、遙感等任務(wù)的連續(xù)性,提高衛(wèi)星在軌運(yùn)行的安全性都具有重大意義。
目前,國(guó)內(nèi)工程上普遍采用設(shè)置閾值[1]的方法和專家系統(tǒng)[2]的方法對(duì)遙測(cè)數(shù)據(jù)進(jìn)行異常檢測(cè)。設(shè)置閾值的方法需要根據(jù)以往的工程經(jīng)驗(yàn)和專家經(jīng)驗(yàn)對(duì)部分遙測(cè)參數(shù)設(shè)定門限,將超出門限的數(shù)據(jù)標(biāo)記為異常數(shù)據(jù)。這種方法簡(jiǎn)單有效,誤檢率低,但是有許多故障發(fā)生時(shí)遙測(cè)參數(shù)并不會(huì)超出所設(shè)門限。而且這種方法需要耗費(fèi)大量的人力物力,可擴(kuò)展性低。專家系統(tǒng)需要依據(jù)大量的專家知識(shí)和以往的故障庫(kù)建立數(shù)學(xué)、物理模型,以此自動(dòng)檢測(cè)衛(wèi)星故障和數(shù)據(jù)異常。專家系統(tǒng)的異常檢測(cè)能力要遠(yuǎn)大于設(shè)置閾值的方法,但是衛(wèi)星設(shè)計(jì)結(jié)構(gòu)復(fù)雜,很難建立準(zhǔn)確且完備的模型,而且專家系統(tǒng)無(wú)法檢測(cè)到未知的異常。
隨著衛(wèi)星數(shù)量不斷增加,從衛(wèi)星傳到地面的數(shù)據(jù)也在源源不斷地增加,數(shù)據(jù)中包含的大量信息亟需挖掘?;跀?shù)據(jù)驅(qū)動(dòng)的異常檢測(cè)方法[3-6]從數(shù)據(jù)出發(fā),不需要專家知識(shí)和精確的數(shù)學(xué)物理模型,有較好的擴(kuò)展性?;跀?shù)據(jù)驅(qū)動(dòng)的異常檢測(cè)方法主要可以分為基于機(jī)器學(xué)習(xí)的檢測(cè)方法以及它們的衍生算法和基于統(tǒng)計(jì)的異常檢測(cè)方法。例如Ma和Perkins[7]以及Cohen等[8]使用單分類支持向量機(jī)(one-class SVM,OCSVM)[9]將數(shù)據(jù)映射到高維空間,尋求一個(gè)超平面將正常數(shù)據(jù)和異常數(shù)據(jù)以最大間隔分開,一旦數(shù)據(jù)越過(guò)該超平面即認(rèn)為發(fā)生異常。但是,尋求最優(yōu)超平面是個(gè)二次規(guī)劃問(wèn)題,計(jì)算量較大,當(dāng)數(shù)據(jù)不是球型時(shí)效果較差。針對(duì)大量具有相關(guān)性的多維遙測(cè)參數(shù),李楠等[10]利用主成分分析(principal component analysis, PCA)[11-12]方法分析衛(wèi)星不同的故障模式,通過(guò)檢測(cè)特征值之間相應(yīng)比例的變化進(jìn)行異常判決。但是PCA方法也有一些局限性,在非高斯分布情況下,PCA方法得出的主元可能并不是最優(yōu)的;針對(duì)變化的大規(guī)模數(shù)據(jù)源,聚類算法如增量聚類[13-14]可以有效解決原有類別與新加入數(shù)據(jù)不匹配的問(wèn)題,而且不需要很大的儲(chǔ)存空間,但是對(duì)參數(shù)敏感度比較高。
雖然國(guó)內(nèi)已經(jīng)開始結(jié)合機(jī)器學(xué)習(xí)等方法對(duì)在軌衛(wèi)星遙測(cè)數(shù)據(jù)智能化、自動(dòng)化的檢測(cè)進(jìn)行研究,但是目前仍處于理論階段,還沒(méi)有應(yīng)用到工程中去。對(duì)于在軌故障和遙測(cè)異常,主要還是通過(guò)設(shè)置的工程閾值來(lái)檢測(cè),但是許多隱藏在門限內(nèi)的故障征兆無(wú)法被及時(shí)檢測(cè)到,造成嚴(yán)重后果。如圖1所示,故障早期出現(xiàn)異常征兆但未超出報(bào)警門限。2018年,某在軌衛(wèi)星的擴(kuò)頻應(yīng)答機(jī)出現(xiàn)嚴(yán)重故障,與之相關(guān)的參數(shù)主要有溫度、電壓、電流、功率等,溫度參數(shù)具有強(qiáng)周期性,隨著衛(wèi)星繞地球運(yùn)行不斷發(fā)生變化,且升降幅度比較大,電壓等參數(shù)為穩(wěn)態(tài)型參數(shù),波動(dòng)非常小。該故障在早期已經(jīng)出現(xiàn)異常征兆,由于溫度參數(shù)的異常程度遠(yuǎn)小于自身的周期性升降幅度,雖然許多與溫度相關(guān)的參數(shù)也發(fā)生相應(yīng)改變,但是這些參數(shù)始終未超出所設(shè)門限,因此沒(méi)有及時(shí)預(yù)警,最終導(dǎo)致整顆衛(wèi)星失去功能,造成重大事故。
圖1 門限內(nèi)的故障早期征兆Fig.1 Signs of early failure within threshold
根據(jù)以往的工程經(jīng)驗(yàn),衛(wèi)星上許多故障都與溫度有關(guān),對(duì)于此類隱藏在門限內(nèi)且故障相關(guān)參數(shù)具有周期性和相關(guān)性的故障,設(shè)置更合理的閾值可以在一定程度上減輕問(wèn)題。但是只能針對(duì)單一參數(shù)做異常檢測(cè),無(wú)法挖掘多參數(shù)間相關(guān)性的異常變化。而且目前的理論研究多集中在檢測(cè)遙測(cè)參數(shù)的單點(diǎn)異常,而衛(wèi)星遙測(cè)數(shù)據(jù)量非常龐大,有時(shí)還會(huì)受到下傳錯(cuò)誤的影響,單點(diǎn)異常往往可信度較低。Ding等[15]提出潛在相關(guān)性的概念,通過(guò)假設(shè)高斯模型分析混凝土泵車每個(gè)工作時(shí)段內(nèi)參數(shù)間的相關(guān)性變化,檢測(cè)混凝土泵車的異常模式,具有較高的可靠性。Zhong等[16]使用相關(guān)系數(shù)替代特征值改進(jìn)模型,在高維空間對(duì)多元正態(tài)模型進(jìn)行3σ檢測(cè),并且在低維空間驗(yàn)證了該種方法的優(yōu)越性。
但是,衛(wèi)星故障往往需要涉及高維遙測(cè)參數(shù),這使得概率分布模型復(fù)雜度增加,計(jì)算難度增大。而且高維空間本身具有稀疏性,一維正態(tài)分布有68%的值落于正負(fù)標(biāo)準(zhǔn)差之間,而在十維空間上只有0.02%的值落于正負(fù)標(biāo)準(zhǔn)差之間,通常3σ檢測(cè)法則只適用于單參數(shù)的異常檢測(cè)。另外,以上模型雖然可以通過(guò)相關(guān)性的變化來(lái)檢測(cè)故障早期征兆,但是無(wú)法確定發(fā)生異常的具體參數(shù)。因此,本文在分析參數(shù)間相關(guān)性的基礎(chǔ)上融合主成分分析的原理,并做出相應(yīng)改進(jìn),應(yīng)用到在軌衛(wèi)星數(shù)據(jù)異常檢測(cè)中。通過(guò)提取遙測(cè)參數(shù)間的相關(guān)系數(shù)構(gòu)建相關(guān)概率模型,引入主成分分析的方法將高維模型映射到低維空間,并根據(jù)T2統(tǒng)計(jì)量檢測(cè)異常,檢測(cè)到異常后再重構(gòu)回原空間,通過(guò)計(jì)算重構(gòu)誤差比例確定發(fā)生異常的參數(shù)。
根據(jù)以往積累的工程經(jīng)驗(yàn),在衛(wèi)星故障早期,衛(wèi)星各項(xiàng)功能正常,但是某些遙測(cè)參數(shù)已經(jīng)開始發(fā)生緩慢變化,此時(shí)衛(wèi)星處于一種亞健康狀態(tài)。衛(wèi)星的一些遙測(cè)參數(shù)間存在某種相關(guān)性,衛(wèi)星處于正常狀態(tài)時(shí),這些遙測(cè)參數(shù)間的相關(guān)性保持穩(wěn)定或者變化較?。恍l(wèi)星處于異常狀態(tài)時(shí),與故障相關(guān)的遙測(cè)參數(shù)同時(shí)受到故障影響,其相關(guān)性可能會(huì)發(fā)生較大的變化。因此,針對(duì)這類故障前后相關(guān)性發(fā)生變化的故障,本文使用基于相關(guān)概率模型的異常檢測(cè)方法來(lái)檢測(cè)衛(wèi)星不同周期相關(guān)性的異常模式,主要包含以下幾個(gè)步驟。
衛(wèi)星遙測(cè)數(shù)據(jù)是一系列多元時(shí)間序列,而且許多遙測(cè)參數(shù)具有周期性,尤其是與溫度相關(guān)的遙測(cè)參數(shù)。不同周期參數(shù)間相關(guān)性的變化可能會(huì)反映出衛(wèi)星異常,而且相對(duì)于單點(diǎn)異常,較長(zhǎng)時(shí)段的異常具有更高的可信度。因此以衛(wèi)星繞地運(yùn)行一圈為一個(gè)工作單元,對(duì)遙測(cè)數(shù)據(jù)進(jìn)行劃分,一個(gè)工作單元的長(zhǎng)度剛好與大部分溫度參數(shù)一個(gè)周期的長(zhǎng)度相同。這樣,遙測(cè)數(shù)據(jù)便被劃分成一系列的工作單元,如圖2所示。
圖2 工作單元?jiǎng)澐质疽鈭DFig.2 Graph of work unit division
在一個(gè)工作單元內(nèi),各個(gè)遙測(cè)參數(shù)都是長(zhǎng)度相等的一元時(shí)間序列。計(jì)算相關(guān)性的方法有很多種[17]。由于同一數(shù)據(jù)集中的遙測(cè)參數(shù)具有不同的量綱,與協(xié)方差相比,相關(guān)系數(shù)更適合描述各種遙測(cè)參數(shù)之間的相關(guān)性,相關(guān)系數(shù)越大,相關(guān)性越強(qiáng)。本文通過(guò)計(jì)算皮爾遜相關(guān)系數(shù)來(lái)量化遙測(cè)參數(shù)間的相關(guān)性,計(jì)算公式為
(1)
之后,計(jì)算一個(gè)工作單元內(nèi)每2個(gè)遙測(cè)參數(shù)間的相關(guān)系數(shù),這些相關(guān)系數(shù)便構(gòu)成該工作單元的相關(guān)系數(shù)向量。
假定劃分了M個(gè)工作單元,即衛(wèi)星繞地運(yùn)行M圈,經(jīng)計(jì)算得到M個(gè)相關(guān)系數(shù)向量。正常情況下,衛(wèi)星每個(gè)運(yùn)行周期情景相似,考慮到地面上人為操作、空間環(huán)境不確定因素以及遙測(cè)數(shù)據(jù)下傳錯(cuò)誤等影響,總體來(lái)看,正常的相關(guān)系數(shù)向量占大多數(shù),異常的相關(guān)系數(shù)向量只占一小部分。由大數(shù)定律可知,當(dāng)M足夠大時(shí),相關(guān)系數(shù)向量漸近服從多元正態(tài)分布[16]。對(duì)于數(shù)據(jù)來(lái)源于多元正態(tài)總體的判斷,目前沒(méi)有很好的辦法,但是如果一個(gè)p維的向量服從p元正態(tài)分布,則它的每一個(gè)分量都服從一元正態(tài)分布。如圖3所示,將幾個(gè)遙測(cè)參數(shù)的相關(guān)系數(shù)向量的每一維作Q-Q圖。
圖3 相關(guān)系數(shù)向量的Q-Q圖Fig.3 Quantile-quantile plot of correlation coefficient vectors
要利用Q-Q圖鑒別數(shù)據(jù)是否近似于正態(tài)分布,只需看Q-Q圖上的點(diǎn)是否近似地在一條直線附近。圖3顯示,相關(guān)系數(shù)向量的每一個(gè)分量都來(lái)自于一個(gè)一元正態(tài)分布。
多維遙測(cè)數(shù)據(jù)建立相關(guān)概率模型后,可能會(huì)造成“維度災(zāi)難”,為后續(xù)檢測(cè)增大難度,而且相關(guān)系數(shù)向量的元素中存在一定的相關(guān)性,可能存在信息重疊,PCA方法可以將高維向量映射到低維空間來(lái)解決這一問(wèn)題。
PCA的實(shí)質(zhì)是從存在相關(guān)的多維度原始向量空間中抽取出幾個(gè)彼此正交的主成分代表原始數(shù)據(jù),從而簡(jiǎn)化分析模型,這些主成分包含原始數(shù)據(jù)大部分的信息。 為實(shí)現(xiàn)降維,就要使降維后的結(jié)果盡量分散(重疊太多就不能很好地復(fù)原回去),同時(shí),希望盡可能保留更多的原始信息,因此,投影后的各主成分之間是正交的,而且在投影后每一維度上方差最大。PCA方法的主要流程如下:
1) 將原始數(shù)據(jù)矩陣零均值化;
2) 求出協(xié)方差矩陣;
3) 計(jì)算協(xié)方差矩陣的特征值和對(duì)應(yīng)的特征向量;
4) 將特征向量按對(duì)應(yīng)特征值大小排列成矩陣,取前k個(gè)組成矩陣P(保留最大的k個(gè)特征向量);其中,主成分對(duì)應(yīng)的方差在總方差中的占比為該主成分的貢獻(xiàn)率,主成分λk的貢獻(xiàn)率表示為
(2)
按照所需貢獻(xiàn)率選擇主成分及其對(duì)應(yīng)的特征值和特征向量,最終得到的主元模型為
(3)
其中:X是原始高維數(shù)據(jù),A是轉(zhuǎn)換矩陣。
基于PCA的異常檢測(cè)通常使用T2統(tǒng)計(jì)量來(lái)檢測(cè)過(guò)程是否異常,T2統(tǒng)計(jì)量可以衡量變量在主成分空間的變化,檢測(cè)函數(shù)為
(4)
(5)
式中:Fk,p-k;α第一自由度為k,第二自由度為p-k的F分布,α通常取0.01、0.5和0.1。
通過(guò)上述方法檢測(cè)出異常后,再將低維空間的數(shù)據(jù)重構(gòu)到高維空間,并計(jì)算重構(gòu)高維數(shù)據(jù)和原始高維數(shù)據(jù)的重構(gòu)誤差和每個(gè)分量對(duì)重構(gòu)誤差的貢獻(xiàn)比例,貢獻(xiàn)比例越大,該分量出現(xiàn)異常的可能性就越高,交叉對(duì)比貢獻(xiàn)比例較大的分量可以大致確定發(fā)生異常的遙測(cè)參數(shù),進(jìn)而為后續(xù)的故障定位確定方向。
重構(gòu)誤差的計(jì)算公式為
(6)
(7)
計(jì)算每個(gè)分量對(duì)重構(gòu)誤差的比例,公式為
(8)
本文所提出的基于相關(guān)概率模型的異常檢測(cè)方法的流程如圖4所示。
本文以某型號(hào)在軌衛(wèi)星的擴(kuò)頻應(yīng)答機(jī)故障為故障案例,將與擴(kuò)頻應(yīng)答機(jī)相關(guān)的溫度、電壓、功率等共10個(gè)遙測(cè)參數(shù)作為待檢測(cè)參數(shù),選取2018年7月到10月的遙測(cè)數(shù)據(jù)為實(shí)驗(yàn)對(duì)象。樣本量為5 215 000條,遙測(cè)數(shù)據(jù)采樣率為1條/s,將7、8月份的正常數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),9、10月份故障發(fā)生前后的數(shù)據(jù)作為測(cè)試數(shù)據(jù),驗(yàn)證基于相關(guān)概率模型的PCA檢測(cè)方法的有效性,并和其他方法進(jìn)行比較。
對(duì)于衛(wèi)星這種具有高復(fù)雜度且造價(jià)昂貴的系統(tǒng),在故障早期檢測(cè)出系統(tǒng)異常具有重大意義,發(fā)現(xiàn)異常的時(shí)間越早,地面運(yùn)管人員進(jìn)行故障排除和遠(yuǎn)程指令修復(fù)就越及時(shí),造成的損失也就越小。因此,將檢測(cè)出系統(tǒng)參數(shù)異常的時(shí)間作為檢測(cè)方法的一個(gè)評(píng)價(jià)指標(biāo)。
圖4 基于相關(guān)概率模型的異常檢測(cè)方法流程圖Fig.4 Flow chart of anomaly detection method based on correlation probability model
另外,通過(guò)表1所示的混淆矩陣[18]計(jì)算檢測(cè)方法的準(zhǔn)確率(Accuracy)、虛警率(False Alarm)和召回率(Recall),計(jì)算公式分別如下:
(9)
表1 混淆矩陣Table 1 Confusion matrix
其中,TN為被正確識(shí)別出的正常數(shù)據(jù),F(xiàn)P為被誤判為異常數(shù)據(jù)的正常數(shù)據(jù);FN為被識(shí)別為正常數(shù)據(jù)的異常數(shù)據(jù),TP為被正確判別的異常數(shù)據(jù)。
2.2.1 異常檢測(cè)結(jié)果和對(duì)比
作為對(duì)照,本文采用基于PCA的異常檢測(cè)方法和基于相關(guān)系數(shù)向量的方法對(duì)同一數(shù)據(jù)集進(jìn)行異常檢測(cè),驗(yàn)證相關(guān)性變化可以反映早期故障征兆,以及工作單元的模式異常比遙測(cè)數(shù)據(jù)的單點(diǎn)異常具有更高的可靠性。
對(duì)于基于PCA的異常檢測(cè)方法,本文以采樣率1條/10 min對(duì)遙測(cè)數(shù)據(jù)進(jìn)行采樣,然后直接將訓(xùn)練數(shù)據(jù)映射到主元空間,分別計(jì)算T2控制限,置信度α分別取0.01、0.05和0.1,然后將測(cè)試數(shù)據(jù)映射到同一主元空間,計(jì)算測(cè)試數(shù)據(jù)的T2統(tǒng)計(jì)量并對(duì)T2統(tǒng)計(jì)量做異常檢測(cè)。
基于相關(guān)系數(shù)向量方法不需要建立模型,直接對(duì)1.2節(jié)中的相關(guān)系數(shù)向量進(jìn)行計(jì)算分析。它首先計(jì)算訓(xùn)練數(shù)據(jù)中相關(guān)系數(shù)向量的均值向量,然后求出訓(xùn)練數(shù)據(jù)中每個(gè)相關(guān)系數(shù)向量到均值向量的歐式距離,假設(shè)第k個(gè)樣本向量到均值向量的距離為lk,將距離從大到小排序,樣本量為m,閾值設(shè)定為d=l「αm?,其中,α=0.01、0.05、0.1。最后計(jì)算出測(cè)試數(shù)據(jù)中每個(gè)相關(guān)系數(shù)向量到訓(xùn)練數(shù)據(jù)的均值向量的距離,并分別與閾值進(jìn)行比較,超出閾值的則判為異常。
表2顯示3種方法在不同置信度下檢測(cè)到異常的時(shí)間,可以看出,3種辦法都可以提前20多天對(duì)故障進(jìn)行預(yù)警。
表2 檢測(cè)到異常的時(shí)間Table 2 Anomaly detection time
圖5(a)、5(b)、5(c)分別為基于相關(guān)概率模型的異常檢測(cè)結(jié)果、直接對(duì)遙測(cè)數(shù)據(jù)進(jìn)行PCA異常檢測(cè)結(jié)果和基于相關(guān)系數(shù)向量的異常檢測(cè)結(jié)果。基于PCA的異常檢測(cè)方法雖然能更早地檢測(cè)出數(shù)據(jù)異常,但是由于遙測(cè)數(shù)據(jù)中的溫度參數(shù)周期內(nèi)變化幅度大,占據(jù)最重要的主成分,雖然在故障早期有總體上升的趨勢(shì),但是異常程度遠(yuǎn)小于自身的變化幅度,而且在周期內(nèi)下降的過(guò)程中,又會(huì)被判定為正常,導(dǎo)致檢測(cè)結(jié)果極不可靠?;谙嚓P(guān)概率模型的異常檢測(cè)方法在置信度為0.1時(shí)最早檢測(cè)到異常,這種結(jié)果是合理的,因?yàn)榭煽啃院椭眯哦韧煞幢?,置信度α越小,檢測(cè)出異常數(shù)據(jù)的時(shí)間越晚,這是犧牲時(shí)間來(lái)提高檢測(cè)可靠性的結(jié)果,而且在3種置信度下,不同工作單元的異常模式大部分都能被檢測(cè)到?;谙嚓P(guān)系數(shù)向量的檢測(cè)方法雖然也能夠在早期檢測(cè)到異常,但是由于在高維空間檢測(cè)的局限性導(dǎo)致中間部分出現(xiàn)很多漏警的情況。
圖5 3種方法的檢測(cè)結(jié)果Fig.5 Detection results of three methods
進(jìn)一步分別計(jì)算3種方法的評(píng)價(jià)指標(biāo)如下,從表3可以看出,基于相關(guān)概率模型的檢測(cè)方法的準(zhǔn)確率和召回率分別明顯高于其他2種方法,而且虛警率也最低,具有較高的可靠性,證明通過(guò)分析參數(shù)間的相關(guān)性,能夠降低溫度參數(shù)作為主成分對(duì)檢測(cè)結(jié)果的負(fù)面影響,使檢測(cè)結(jié)果更加合理,而且工作單元的異常模式比單點(diǎn)異常更具可信度。
表3 檢測(cè)結(jié)果的評(píng)估Table 3 Evaluation of detection results %
2.2.2 進(jìn)一步確定異常遙測(cè)參數(shù)
在檢測(cè)出異常之后,計(jì)算相關(guān)系數(shù)向量的重構(gòu)誤差和每個(gè)分量(即某2個(gè)遙測(cè)參數(shù)的相關(guān)系數(shù))對(duì)重構(gòu)誤差的貢獻(xiàn)比例進(jìn)一步判定發(fā)生異常的遙測(cè)參數(shù)。
表4顯示相關(guān)系數(shù)向量的分量對(duì)重構(gòu)誤差的貢獻(xiàn)比例。由于劃分的工作單元和相關(guān)系數(shù)向量包含的分量都比較多,這里只選取某工作單元的幾個(gè)重要遙測(cè)參數(shù)間的相關(guān)系數(shù)。
表4 相關(guān)系數(shù)對(duì)重構(gòu)誤差的貢獻(xiàn)比例Table 4 Contribution ratio of correlation coefficient to reconstruction error
表4中,V5,A、V12,A分別代表擴(kuò)頻A的+5 V和+12 V電壓,TA、TB分別代表擴(kuò)頻A和擴(kuò)頻B的溫度,V5,B、V12,B分別代表擴(kuò)頻B的+5 V和+12 V電壓。擴(kuò)頻B并未發(fā)生故障,因此與之有關(guān)的遙測(cè)參數(shù)間的相關(guān)系數(shù)對(duì)重構(gòu)誤差的貢獻(xiàn)很小,幾乎可以忽略不計(jì)。而與擴(kuò)頻A+5 V電壓和擴(kuò)頻A溫度有關(guān)的遙測(cè)參數(shù)間的相關(guān)系數(shù)對(duì)重構(gòu)誤差的貢獻(xiàn)很大,因此可以判斷出遙測(cè)參數(shù)間的相關(guān)性發(fā)生了變化,通過(guò)進(jìn)一步地交叉對(duì)比可以發(fā)現(xiàn)是擴(kuò)頻A+5 V電壓和擴(kuò)頻A溫度這2個(gè)遙測(cè)參數(shù)發(fā)生嚴(yán)重異常。
如圖6(a)所示,正常情況下,擴(kuò)頻A+5 V電壓穩(wěn)定在5.07 V,偶爾會(huì)在5.07~5.10 V之間波動(dòng),擴(kuò)頻A溫度在23.2~32.9 ℃間呈周期性變化,擴(kuò)頻A+5 V電壓與擴(kuò)頻A溫度之間的相關(guān)性很弱。而在故障早期,擴(kuò)頻A溫度在25.6~35.5 ℃間呈周期性變化,較正常情況下,溫度整體小幅上升,而且擴(kuò)頻A+5 V電壓超出正常范圍的上限5.1 V,且在擴(kuò)頻A溫度的一個(gè)周期內(nèi),擴(kuò)頻A+5 V電壓隨著溫度的升高而增大,隨著溫度的降低而減小,即這2個(gè)遙測(cè)參數(shù)之間的相關(guān)性增強(qiáng)了。 圖6(b)對(duì)比在同一時(shí)間間隔內(nèi),正常情況下和故障早期擴(kuò)頻A+5 V和擴(kuò)頻A溫度之間的相關(guān)性,還是用相關(guān)系數(shù)表示2個(gè)遙測(cè)參數(shù)間的相關(guān)性,可以看出,在故障早期,二者之間的相關(guān)性總體上較正常情況下的相關(guān)性強(qiáng)。
圖6 正常情況和異常情況的對(duì)比圖Fig.6 Comparison of normal and abnormal conditionsn
故障發(fā)生前后,與故障相關(guān)的參數(shù)始終在閾值范圍內(nèi)波動(dòng),得益于遙測(cè)參數(shù)間相關(guān)性的敏感性。本文所采用的基于相關(guān)概率模型的異常檢測(cè)方法能夠在故障早期就捕捉到遙測(cè)參數(shù)間相關(guān)性的異常征兆,而且可以通過(guò)對(duì)重構(gòu)誤差的貢獻(xiàn)比例確定異常參數(shù),以便進(jìn)行下一步故障診斷,對(duì)衛(wèi)星的健康維護(hù)具有重大意義。
衛(wèi)星平臺(tái)的連續(xù)型遙測(cè)參數(shù)主要是電壓、電流、溫度等參數(shù)。根據(jù)以往的工程經(jīng)驗(yàn),與溫度相關(guān)的故障占很大比例,對(duì)于衛(wèi)星上與溫度相關(guān)的具有周期性的遙測(cè)參數(shù),工程上常用的方法無(wú)法在故障早期檢測(cè)出數(shù)據(jù)異常。本文采用一種基于相關(guān)概率模型的PCA異常檢測(cè)方法,根據(jù)衛(wèi)星的工作周期對(duì)數(shù)據(jù)進(jìn)行劃分,以工作單元的形式研究遙測(cè)參數(shù)間的相關(guān)性變化,比檢測(cè)單點(diǎn)異常更具信服力,并使用PCA的方法對(duì)多元分布模型進(jìn)行降維。而且,本文通過(guò)檢驗(yàn)T2統(tǒng)計(jì)量的方法對(duì)數(shù)據(jù)是否異常進(jìn)行判決,避免閾值設(shè)置的困擾。另外,在檢測(cè)出異常數(shù)據(jù)之后,還可以通過(guò)計(jì)算重構(gòu)誤差貢獻(xiàn)比例確定發(fā)生異常的遙測(cè)參數(shù),為后續(xù)的故障診斷確定大致方向。
實(shí)驗(yàn)證明,基于相關(guān)概率模型的PCA異常檢測(cè)方法可以快速、準(zhǔn)確地在故障早期檢測(cè)出遙測(cè)數(shù)據(jù)的異常,并進(jìn)行初步的故障定位,這對(duì)提高衛(wèi)星的可靠性和安全性具有重大意義。