王昊天,鄭棟毅,劉 芳,肖 儂
1.國(guó)防科技大學(xué),長(zhǎng)沙 410073
2.湖南大學(xué),長(zhǎng)沙 410006
多元時(shí)間序列數(shù)據(jù)已經(jīng)廣泛應(yīng)用于現(xiàn)實(shí)世界中各個(gè)領(lǐng)域,例如天氣數(shù)據(jù)分析和預(yù)測(cè)[1]、醫(yī)療保健[2]、金融[3]等[4-5]。異常檢測(cè)是多元時(shí)間序列分析中的一類(lèi)重要問(wèn)題,目的是檢測(cè)出不符合期望行為的序列數(shù)據(jù),是數(shù)據(jù)挖掘關(guān)鍵技術(shù)之一。隨著深度學(xué)習(xí)在學(xué)習(xí)復(fù)雜數(shù)據(jù)的特征表示方面表現(xiàn)出顯著的優(yōu)勢(shì)[6],近年來(lái)使用深度學(xué)習(xí)方法進(jìn)行異常檢測(cè)受到越來(lái)越多的關(guān)注。例如,深度自動(dòng)編碼高斯混合模型(DAGMM)[7]綜合考慮了深度自動(dòng)編碼器和高斯混合模型來(lái)對(duì)多維數(shù)據(jù)的密度分布進(jìn)行建模;LSTM編解碼器[8]利用長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)對(duì)時(shí)間序列中的時(shí)間相關(guān)性進(jìn)行建模取得了較好的泛化能力。
但是,目前多元時(shí)序數(shù)據(jù)異常檢測(cè)仍面臨挑戰(zhàn)。以飛行數(shù)據(jù)異常檢測(cè)為例,飛行數(shù)據(jù)是典型的多元時(shí)序數(shù)據(jù),有效的異常檢測(cè)將提高航空系統(tǒng)的安全性和可靠性,并改善著陸后的維修行動(dòng)組織。然而飛行數(shù)據(jù)具有高度商業(yè)機(jī)密性,造成了通用航空公司之間的數(shù)據(jù)壁壘;同時(shí),不同類(lèi)型、不同任務(wù)的飛行器生成的飛行數(shù)據(jù)具有高度不同的概率分布,使用單一的統(tǒng)一的檢測(cè)模型不能適用于所有場(chǎng)景。因此,目前存在的挑戰(zhàn)概括為以下兩點(diǎn):(1)由隱私安全帶來(lái)的數(shù)據(jù)孤島問(wèn)題,使得一些領(lǐng)域內(nèi)的數(shù)據(jù)難以融合,無(wú)法訓(xùn)練出高性能的異常檢測(cè)模型。(2)由于來(lái)自不同機(jī)構(gòu)的時(shí)序數(shù)據(jù)可能自發(fā)地呈現(xiàn)出非獨(dú)立同分布的特征,例如特征分布偏斜、標(biāo)簽分布偏斜和概念偏移[9]等,這種統(tǒng)計(jì)異構(gòu)性會(huì)導(dǎo)致嚴(yán)重的性能下降。
針對(duì)以上問(wèn)題,本文提出了FedPAD,用于多元時(shí)序數(shù)據(jù)異常檢測(cè)的個(gè)性化聯(lián)邦學(xué)習(xí)框架。FedPAD可以同時(shí)解決數(shù)據(jù)孤島和個(gè)性化問(wèn)題。通過(guò)聯(lián)邦學(xué)習(xí)[10]和同態(tài)加密[11],F(xiàn)edPAD聚合來(lái)自不同機(jī)構(gòu)的數(shù)據(jù),在云端構(gòu)建高性能的深度異常檢測(cè)模型,同時(shí)很好地保護(hù)了隱私數(shù)據(jù)。云模型建立后,F(xiàn)edPAD利用fine-tuning(微調(diào))進(jìn)一步為每個(gè)機(jī)構(gòu)訓(xùn)練出個(gè)性化異常檢測(cè)模型。
本文的主要貢獻(xiàn):(1)提出了一個(gè)面向多元時(shí)序數(shù)據(jù)的個(gè)性化聯(lián)邦異常檢測(cè)框架FedPAD,它在保護(hù)隱私安全的前提下聚合了來(lái)自不同機(jī)構(gòu)的數(shù)據(jù),并將LSTM時(shí)序預(yù)測(cè)模型與深度學(xué)習(xí)的fine-tuning技術(shù)結(jié)合,得到了相對(duì)個(gè)性化的檢測(cè)模型。(2)展示了FedPAD在NASA航天探器數(shù)據(jù)集上的異常檢測(cè)性能。實(shí)驗(yàn)表明,與基準(zhǔn)方法相比,該方法有效提高了精確率與召回率。
LSTM-NDT[12]使用長(zhǎng)短期記憶網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)高性能的時(shí)序數(shù)據(jù)預(yù)測(cè),同時(shí)保證了整個(gè)系統(tǒng)的可解釋性。模型生成預(yù)測(cè)數(shù)據(jù)后,使用一種非參數(shù)、動(dòng)態(tài)的閾值方法來(lái)評(píng)估殘差。具體來(lái)說(shuō),設(shè)yi為輸入序列第i時(shí)間步的信號(hào)值,為模型預(yù)測(cè)輸出的序列第i時(shí)間步的信號(hào)值,那么預(yù)測(cè)誤差為e i=y i-,用多個(gè)時(shí)間步的誤差來(lái)計(jì)算閾值序列ε:
其中,e s是多個(gè)時(shí)間步的誤差序列,μ(·)是均值,σ(·)是標(biāo)準(zhǔn)差,z是權(quán)重系數(shù)。每一個(gè)時(shí)間步的閾值εi是動(dòng)態(tài)變化的,取決于之前整個(gè)閾值序列ε的最大值,計(jì)算公式如下:
其中,e a是異常序列的誤差值,Eseq是異常序列中的連續(xù)異常的誤差值,表達(dá)式如下:
除此之外,還使用了剪枝方法來(lái)減少誤報(bào),將所有誤差序列中的最大值emax按照降序排列得到e s,然后遍歷序列計(jì)算下降百分比d i:
如果d i超過(guò)了最小百分比p,那么相關(guān)的異常序列仍為異常;如果d i和所有后續(xù)下降百分比都沒(méi)有超過(guò)p,那么這些誤差序列重新分類(lèi)為正常序列。
聯(lián)邦學(xué)習(xí)最早是在2016年由Google提出的[13]。其設(shè)計(jì)目標(biāo)是在保證數(shù)據(jù)交換過(guò)程中的信息安全、保護(hù)個(gè)人數(shù)據(jù)隱私、確保法律合規(guī)的前提下,在多個(gè)參與者或計(jì)算節(jié)點(diǎn)之間進(jìn)行高效學(xué)習(xí)。聯(lián)邦學(xué)習(xí)能夠有效地解決數(shù)據(jù)孤島問(wèn)題,在很多領(lǐng)域已經(jīng)有了實(shí)際應(yīng)用,例如,它對(duì)于移動(dòng)設(shè)備上的下一個(gè)單詞預(yù)測(cè)問(wèn)題表現(xiàn)出了良好的性能和魯棒性[14]。Bonawitz等人[15]提出一個(gè)可擴(kuò)展的系統(tǒng),在移動(dòng)設(shè)備上實(shí)現(xiàn)大規(guī)模的聯(lián)邦學(xué)習(xí)。Guo等人[16]在興趣點(diǎn)推薦任務(wù)中使用邊緣加速聯(lián)邦學(xué)習(xí)框架,在保護(hù)隱私的同時(shí),實(shí)現(xiàn)了高效的推薦性能。
機(jī)構(gòu)參與聯(lián)邦學(xué)習(xí)的主要?jiǎng)訖C(jī)是獲得更好的模型,然而,對(duì)于那些擁有足夠的本地?cái)?shù)據(jù)來(lái)訓(xùn)練高效模型的機(jī)構(gòu)來(lái)說(shuō),參與聯(lián)邦學(xué)習(xí)得到的全局模型可能并不適用于其本身的檢測(cè)任務(wù)。Yu等人[17]表明,對(duì)于許多任務(wù),由于全局共享模型不如局部模型精確,所以一些參與者可能無(wú)法通過(guò)聯(lián)邦學(xué)習(xí)來(lái)提高模型性能。Hanzely等人[18]對(duì)全局模型的性能提出了質(zhì)疑,由于跨客戶端的數(shù)據(jù)是非獨(dú)立同分布的,這種統(tǒng)計(jì)異構(gòu)性導(dǎo)致很難訓(xùn)練出一個(gè)對(duì)所有客戶都適用的單一模型。為了解決這種異構(gòu)性的挑戰(zhàn),規(guī)范的聯(lián)邦學(xué)習(xí)方法——聯(lián)邦平均法(FedAvg)被證明能夠處理某些非獨(dú)立同分布數(shù)據(jù)。然而,當(dāng)面對(duì)高度偏斜的數(shù)據(jù)分布時(shí),F(xiàn)edAvg可能會(huì)導(dǎo)致嚴(yán)重的性能下降。具體來(lái)說(shuō),一方面,非獨(dú)立同分布數(shù)據(jù)會(huì)導(dǎo)致聯(lián)邦學(xué)習(xí)過(guò)程和傳統(tǒng)集中式訓(xùn)練過(guò)程之間的權(quán)重差異,F(xiàn)edAvg最終將得到比集中式方法性能更差的模型[19]。另一方面,F(xiàn)edAvg只從數(shù)據(jù)中學(xué)習(xí)粗略的特征,而無(wú)法學(xué)習(xí)特定任務(wù)數(shù)據(jù)上的細(xì)粒度特征。
為了應(yīng)對(duì)統(tǒng)計(jì)異質(zhì)性和數(shù)據(jù)的非獨(dú)立同分布帶來(lái)的挑戰(zhàn),個(gè)性化的全局模型變得十分必要。大多數(shù)個(gè)性化技術(shù)[20]通常包括兩個(gè)步驟。第一步,以協(xié)作的方式訓(xùn)練一個(gè)全局模型。在第二步中,使用客戶端的私有數(shù)據(jù)為每個(gè)客戶端個(gè)性化全局模型。Arivazhagan等人[21]提出了FedPer,主張將深度學(xué)習(xí)模型視為基礎(chǔ)+個(gè)性化層,基礎(chǔ)層作為共享層,使用現(xiàn)有的聯(lián)邦學(xué)習(xí)方法以協(xié)作方式進(jìn)行訓(xùn)練,而個(gè)性化層是在本地培訓(xùn)的。Chen等人[22]首先通過(guò)傳統(tǒng)的聯(lián)邦學(xué)習(xí)訓(xùn)練一個(gè)全局模型,然后將訓(xùn)練好的全局模型傳遞回各個(gè)設(shè)備,相應(yīng)地,每個(gè)設(shè)備都能夠通過(guò)用其本地?cái)?shù)據(jù)精煉全局模型來(lái)構(gòu)建個(gè)性化模型。Hanzely等人[18]在傳統(tǒng)的全局模型和本地模型之間作權(quán)衡,每個(gè)設(shè)備可以從自己的本地?cái)?shù)據(jù)中學(xué)習(xí)本地模型,而無(wú)需任何通信。Zhang等人[23]為了實(shí)現(xiàn)個(gè)性化,沒(méi)有像FedAvg那樣計(jì)算模型參數(shù)的平均值,而是通過(guò)計(jì)算出一個(gè)客戶端可以從另一個(gè)客戶端的模型聚合中受益多少,得出每個(gè)客戶端的最優(yōu)加權(quán)模型組合。
{S1,S2,…,S N}代表來(lái)自N個(gè)不同的機(jī)構(gòu){Q1,Q2,…,Q N}的時(shí)序數(shù)據(jù),不同機(jī)構(gòu)的數(shù)據(jù)都有不同的分布。傳統(tǒng)集中式的方法使用全局?jǐn)?shù)據(jù)S=S1∪S2∪…∪S N訓(xùn)練一個(gè)統(tǒng)一的模型MALL。在本文的問(wèn)題背景中,希望使用所有的數(shù)據(jù)來(lái)訓(xùn)練一個(gè)聯(lián)邦異常檢測(cè)模型MFED,在模型訓(xùn)練過(guò)程中,任何機(jī)構(gòu)都不會(huì)相互公開(kāi)自己的數(shù)據(jù),模型訓(xùn)練目標(biāo)是提高聯(lián)邦異常檢測(cè)模型MFED的性能,使得異常檢測(cè)率接近或優(yōu)于MALL。
FedPAD旨在通過(guò)個(gè)性化聯(lián)邦學(xué)習(xí)實(shí)現(xiàn)高性能的異常檢測(cè),同時(shí)保護(hù)隱私安全。圖1給出了框架的概述,以飛行數(shù)據(jù)異常檢測(cè)為例(可以擴(kuò)展到其他場(chǎng)景),假設(shè)有三個(gè)通航公司,各有不同類(lèi)型的飛行器。該框架主要包括四個(gè)流程,首先,基于公共數(shù)據(jù)集訓(xùn)練服務(wù)器上的云模型。然后,云模型被分發(fā)給所有機(jī)構(gòu),每個(gè)機(jī)構(gòu)在云模型的基礎(chǔ)上使用本地?cái)?shù)據(jù)訓(xùn)練自己的模型。隨后,將機(jī)構(gòu)模型回傳到云端,通過(guò)FedAvg來(lái)更新云模型。重復(fù)以上流程,直到模型收斂或達(dá)到指定訓(xùn)練輪數(shù)。最后,每個(gè)機(jī)構(gòu)可以利用云模型和本地?cái)?shù)據(jù)來(lái)進(jìn)一步訓(xùn)練個(gè)性化模型。在這一步中,由于全局?jǐn)?shù)據(jù)和機(jī)構(gòu)的本地?cái)?shù)據(jù)之間存在很大的分布差異,所以通過(guò)微調(diào)方法使模型更適合本地?cái)?shù)據(jù)。在整個(gè)流程中,通過(guò)同態(tài)加密,所有參數(shù)共享過(guò)程都不會(huì)泄露用戶數(shù)據(jù)。
圖1 FedPAD框架概述Fig.1 FedPAD framework overview
FedPAD采用聯(lián)邦學(xué)習(xí)范式實(shí)現(xiàn)分布式加密模型訓(xùn)練和共享,解決數(shù)據(jù)隔離的問(wèn)題。這一步主要由兩個(gè)關(guān)鍵部分組成:云模型聚合和機(jī)構(gòu)模型訓(xùn)練。在FedPAD中,采用基于LSTM時(shí)序預(yù)測(cè)的神經(jīng)網(wǎng)絡(luò)作為云端和機(jī)構(gòu)模型。LSTM通過(guò)輸入機(jī)構(gòu)數(shù)據(jù)來(lái)進(jìn)行端到端的特征學(xué)習(xí)。云端模型和機(jī)構(gòu)端模型的學(xué)習(xí)目標(biāo)分別如式(7)、式(8)所示:
其中,ω和b表示要學(xué)習(xí)的所有參數(shù),即權(quán)重和偏差,l(·,·)表示損失函數(shù),j表示機(jī)構(gòu)編號(hào)表示來(lái)自全局?jǐn)?shù)據(jù)和第j個(gè)機(jī)構(gòu)的時(shí)序數(shù)據(jù)實(shí)例,n和n j表示數(shù)據(jù)集的大小。
對(duì)所有用戶模型f j進(jìn)行訓(xùn)練后,將其上傳到云端進(jìn)行聚合。使用聯(lián)邦平均算法[12]對(duì)齊用戶模型,在每輪培訓(xùn)中對(duì)M個(gè)用戶模型進(jìn)行平均,得到平均模型:
其中,(ω,b)表示神經(jīng)網(wǎng)絡(luò)參數(shù),M表示機(jī)構(gòu)數(shù)量,經(jīng)過(guò)足夠多輪的迭代,云端模型具有更好的泛化能力。
聯(lián)邦學(xué)習(xí)能夠解決數(shù)據(jù)孤島問(wèn)題,因此,F(xiàn)edPAD可以使用所有的機(jī)構(gòu)數(shù)據(jù)來(lái)構(gòu)建異常檢測(cè)模型。此外,另一個(gè)影響性能的重要因素是數(shù)據(jù)的統(tǒng)計(jì)異構(gòu)性。在特定機(jī)構(gòu)上直接使用云模型的性能仍然很差,這是由于單一機(jī)構(gòu)數(shù)據(jù)和全局?jǐn)?shù)據(jù)之間的分布差異。云端的通用模型只從所有機(jī)構(gòu)那里學(xué)習(xí)粗略的特征,而無(wú)法學(xué)習(xí)特定機(jī)構(gòu)數(shù)據(jù)的細(xì)粒度特征。Yosinski等人[24]證明在深度神經(jīng)網(wǎng)絡(luò)中,較低層的特征是高度可遷移的,因?yàn)樗鼈兗杏趯W(xué)習(xí)共同的和較低層次的特征,網(wǎng)絡(luò)中的較高層將學(xué)習(xí)任務(wù)中更具體的特征。因此,在獲得云模型之后,機(jī)構(gòu)使用fine-tuning方法來(lái)實(shí)現(xiàn)個(gè)性化的機(jī)構(gòu)模型,過(guò)程如圖2所示。神經(jīng)網(wǎng)絡(luò)由兩個(gè)LSTM層、兩個(gè)Dropout層、一個(gè)Dense層和一個(gè)Linear層組成。輸入是多元時(shí)序數(shù)據(jù),輸出是預(yù)測(cè)時(shí)序數(shù)據(jù)。FedPAD保持較低層(LSTM和Dropout)凍結(jié),并調(diào)整較高層(Dense和Linear)的參數(shù)。
圖2 FedPAD微調(diào)過(guò)程Fig.2 FedPAD fine-tuning process
在算法1中介紹了FedPAD的模型訓(xùn)練流程。當(dāng)機(jī)構(gòu)生成新的數(shù)據(jù)時(shí),F(xiàn)edPAD可以同時(shí)更新機(jī)構(gòu)模型和云模型。因此,使用FedPAD的時(shí)間越長(zhǎng),模型性能就越好。
算法1FedPAD模型訓(xùn)練流程
NASA開(kāi)源的專(zhuān)家標(biāo)注的真實(shí)世界航天器故障數(shù)據(jù)集[11]包括火星科學(xué)實(shí)驗(yàn)室好奇號(hào)(mars science laboratory rover,MSL)和土壤水分主動(dòng)被動(dòng)探測(cè)衛(wèi)星(soil moisture active passive,SMAP),共計(jì)82個(gè)通道、105個(gè)故障,數(shù)據(jù)集描述如表1所示。
表1 FedPAD模型訓(xùn)練流程Table 1 FedPAD model training process
為了與LSTM-NDT[12]提出的基準(zhǔn)進(jìn)行直接比較,采用序列數(shù)據(jù)異常檢測(cè)任務(wù)中常用的Point-based檢測(cè)指標(biāo),即當(dāng)預(yù)測(cè)異常與真實(shí)值有交集時(shí)記為true positive,預(yù)測(cè)異常與任何真實(shí)值均無(wú)交集時(shí)記為false positive,真實(shí)值與任何預(yù)測(cè)值均無(wú)交集時(shí)記為false negative,其中,精確率(Precision)、召回率(Recall)與F1值的計(jì)算均與一般的檢測(cè)任務(wù)相同:
其中,TP為真陽(yáng)性,F(xiàn)P為假陽(yáng)性,TN為真陰性,F(xiàn)N為假陰性。
NASA航天器數(shù)據(jù)集中,通道之間的時(shí)序數(shù)據(jù)具有相同的特征維度,但在特征分布上具有較大差異性,即統(tǒng)計(jì)異構(gòu)性,這符合本文的問(wèn)題背景。因此,將每一個(gè)通道的數(shù)據(jù)作為一個(gè)機(jī)構(gòu)的數(shù)據(jù),即在SMAP上的實(shí)驗(yàn)中有55個(gè)機(jī)構(gòu)節(jié)點(diǎn),在MSL上的實(shí)驗(yàn)中有27個(gè)機(jī)構(gòu)節(jié)點(diǎn),進(jìn)行FedPAD模型訓(xùn)練。LSTM-NDT方法使用每一個(gè)通道數(shù)據(jù)單獨(dú)訓(xùn)練一個(gè)模型,為了更直觀的比較,使用與LSTM-NDT相同的模型架構(gòu)和參數(shù),如表2所示。
表2 模型架構(gòu)及參數(shù)Table 2 Model architecture and parameters
將FedPAD與LSTM-NDT作比較,同時(shí)記錄了僅使用聯(lián)邦學(xué)習(xí)(FED)的性能。
如表3所示,與LSTM-NDT相比,僅使用聯(lián)邦學(xué)習(xí)進(jìn)行模型訓(xùn)練雖然能解決數(shù)據(jù)孤島問(wèn)題,但由于數(shù)據(jù)的統(tǒng)計(jì)異構(gòu)性,F(xiàn)ED模型的預(yù)測(cè)性能在兩個(gè)數(shù)據(jù)集上都出現(xiàn)了下降,整體預(yù)測(cè)誤差增加了1.2個(gè)百分點(diǎn)。同時(shí),F(xiàn)edPAD整體預(yù)測(cè)誤差下降了1.6個(gè)百分點(diǎn),比LSTMNDT方法表現(xiàn)得更好,這是因?yàn)槁?lián)邦學(xué)習(xí)可以間接學(xué)習(xí)到來(lái)自多個(gè)機(jī)構(gòu)的數(shù)據(jù)特征,進(jìn)而訓(xùn)練更好的模型,并且通過(guò)微調(diào),模型變得更加個(gè)性化,更能適應(yīng)每個(gè)機(jī)構(gòu)的數(shù)據(jù)特征。
表3 遙測(cè)預(yù)測(cè)誤差Table 3 Telemetry prediction error %
在LSTM-NDT方法中,剪枝參數(shù)p是控制精確率和召回率的重要參數(shù),通過(guò)調(diào)整參數(shù)p實(shí)現(xiàn)精確率和召回率的權(quán)衡。在本文的實(shí)驗(yàn)中,將p作為控制變量,比較三種方法在兩個(gè)數(shù)據(jù)集中異常檢測(cè)的性能表現(xiàn)。如圖3、4所示,在不同的參數(shù)p下,F(xiàn)ED方法性能最不穩(wěn)定,精確率和召回率無(wú)法同時(shí)達(dá)到較高水平。而Fed-PAD方法,僅在SMAP數(shù)據(jù)集中的p取較低值時(shí)性能略低于LSTM-NDT,其他情況下精確率和召回率均高于LSTM-NDT,這得益于fine-tuning提高了LSTM模型的預(yù)測(cè)性能。
圖3 三種方法在MSL數(shù)據(jù)集中的性能比較Fig.3 Performance comparison of three methods in MSL dataset
圖4 三種方法在SMAP數(shù)據(jù)集中的性能比較Fig.4 Performance comparison of three methods in SMAP dataset
如表4、5所示,記錄了三種方法在不同參數(shù)p下的平均性能表現(xiàn)。與LSTM-NDT相比,F(xiàn)ED在兩個(gè)數(shù)據(jù)集上的F1分?jǐn)?shù)分別下降了4.3%、10.9%,F(xiàn)edPAD在MSL數(shù)據(jù)集上的異常檢測(cè)F1分?jǐn)?shù)提高了10.1%,在SMAP數(shù)據(jù)集上提高了3.6%,平均F1分?jǐn)?shù)提高了6.9%。這再次證明了FedPAD在提高異常檢測(cè)性能上的有效性。其中的原因是,在聯(lián)邦學(xué)習(xí)和微調(diào)過(guò)程中,F(xiàn)edPAD中每個(gè)數(shù)據(jù)機(jī)構(gòu)上的異常檢測(cè)模型都可以學(xué)習(xí)到其他機(jī)構(gòu)的數(shù)據(jù)特征,提高了模型的推理性能。由于數(shù)據(jù)集的異構(gòu)性,使用統(tǒng)一的聯(lián)邦學(xué)習(xí)模型更容易出現(xiàn)誤報(bào)率增加或模型魯棒性降低的問(wèn)題。FedPAD能夠解決這些問(wèn)題,因?yàn)樗ㄟ^(guò)微調(diào)為每個(gè)數(shù)據(jù)機(jī)構(gòu)構(gòu)建了更加個(gè)性化的異常檢測(cè)模型。
表4 MSL數(shù)據(jù)集上的平均性能對(duì)比Table 4 Average performance comparison on MSL Datasets
表5 SMAP數(shù)據(jù)集上的平均性能對(duì)比Table 5 Average performance comparison on SMAP datasets
針對(duì)多元時(shí)序數(shù)據(jù)異常檢測(cè),提出了一種基于個(gè)性化聯(lián)邦學(xué)習(xí)的異常檢測(cè)框架FedPAD。FedPAD基于聯(lián)邦學(xué)習(xí)框架,能夠在不泄露數(shù)據(jù)和隱私的情況下,學(xué)習(xí)不同機(jī)構(gòu)的時(shí)序數(shù)據(jù)特征,在各自機(jī)構(gòu)端使用本地?cái)?shù)據(jù)對(duì)模型fine-tuning獲得個(gè)性化檢測(cè)模型。實(shí)驗(yàn)表明,通過(guò)檢測(cè)NASA航天器數(shù)據(jù)異常,F(xiàn)edPAD的異常檢測(cè)F1分?jǐn)?shù)比基準(zhǔn)方法平提高了6.9%。未來(lái),計(jì)劃使用更多的深度異常檢測(cè)模型來(lái)驗(yàn)證模型的可擴(kuò)展性,以及通過(guò)增量學(xué)習(xí)以實(shí)現(xiàn)更加靈活和個(gè)性化的異常檢測(cè)。