国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

核動力裝置運行數(shù)據(jù)的特征提取方法研究

2020-05-07 05:53:50彭彬森朱少民彭敏俊劉永闊馬心童
原子能科學技術(shù) 2020年3期
關(guān)鍵詞:核動力特征提取次數(shù)

彭彬森,夏 虹,朱少民,彭敏俊,劉永闊,馬心童

(哈爾濱工程大學 核安全與仿真技術(shù)國防重點學科實驗室,黑龍江 哈爾濱 150001)

隨著中國能源供給側(cè)進行深入的改革,核能在能源結(jié)構(gòu)中的占比越來越高。與此同時,大眾對核設施安全性的關(guān)注也越來越高,尤其是在日本福島核事故后,如何保障核動力裝置的安全性已成為影響核能發(fā)展的重要因素[1-2]。核動力裝置是一個非常復雜的動態(tài)時變系統(tǒng),主要是因其運行條件復雜可變[3]。一旦發(fā)生異常,操縱員需對異常情況進行分析,找出異常的原因,并及時采取措施降低事故的影響,確保核動力裝置的安全運行,否則將造成巨大的損失和影響,因此狀態(tài)監(jiān)測系統(tǒng)在保障核動力裝置安全性方面扮演著重要的角色。核動力裝置在運行過程中,監(jiān)測系統(tǒng)需對許多參數(shù)進行監(jiān)控,主要有溫度、壓力、水位等熱工參數(shù)以及機械振動參數(shù),同時同一過程中的不同變量間往往互相關(guān)聯(lián),這些運行數(shù)據(jù)主要有以下特點[4]:1) 來源多重性,數(shù)據(jù)源是多種多樣的,且大小不一的系統(tǒng)并存;2) 空間分布性,數(shù)據(jù)源在空間中的分布各不相同;3) 時間多尺度性,數(shù)據(jù)時間跨度大、差別很大;4) 實時交互性,各系統(tǒng)及設備的運行數(shù)據(jù)等可實時反映核動力裝置的運行狀態(tài);5) 數(shù)據(jù)的價值密度低,多數(shù)數(shù)據(jù)均是正常數(shù)據(jù),故障數(shù)據(jù)少。大量復雜的過程變量給操縱員對系統(tǒng)狀態(tài)的判斷帶來了困難。因此需將較多的過程變量壓縮為少數(shù)獨立的變量,智能特征提取方法自動編碼器是一種高維數(shù)據(jù)分析的有效手段,通過分析得到的低維特征變量很好地保留了原始數(shù)據(jù)的特征信息,摒棄了冗余信息,不僅降低了計算量,同時也提高了數(shù)據(jù)的識別精度[5]。因此本文采用稀疏自動編碼器(SAE)對核動力裝置產(chǎn)生的高維信號進行特征提取,并對提取后的數(shù)據(jù)進行異常識別。

1 SAE數(shù)據(jù)特征提取

1.1 自動編碼器(AE)

AE是一種人工神經(jīng)網(wǎng)絡,采用無監(jiān)督的學習方式從原始數(shù)據(jù)中提取特征信息[6]。AE作為構(gòu)建深度神經(jīng)網(wǎng)絡的基本結(jié)構(gòu),其特征之一是輸入節(jié)點的值等于輸出節(jié)點的值。另一個特征是隱藏層中的神經(jīng)元數(shù)量通常小于輸出層的,因此它具有通過非線性變換將輸入特性轉(zhuǎn)換到少量隱藏層神經(jīng)元中的優(yōu)點。使用自動編碼算法,不僅可減少數(shù)據(jù)維數(shù),省去了手動提取特征的麻煩,同時還能降低計算復雜度,減少計算資源的占用[7]。

AE由編碼器和解碼器組成,其結(jié)構(gòu)如圖1所示。輸入數(shù)據(jù)首先通過編碼器映射到低維空間,然后再通過解碼器將數(shù)據(jù)還原,還原的數(shù)據(jù)與原始數(shù)據(jù)的誤差越小,說明AE的效果越好。AE可從未標記的數(shù)據(jù)中提取特征值,并提供原始特征的表示。解碼器用于對原始輸入進行重構(gòu),原始輸入可視為編碼器的逆輸入[8]。

圖1 AE的簡化結(jié)構(gòu)Fig.1 Simplified structure of AE

如果輸入到AE的是矢量x,則編碼器可將矢量x映射到另一個矢量z,如下所示:

z=h(1)(w(1)x+b(1))

(1)

(2)

式中:上標(2)表示第2層;h(2):h(z)=z,為解碼器的線性傳遞函數(shù)(purelin函數(shù))。

為優(yōu)化AE的訓練效果,引入損失函數(shù)作為訓練的目標函數(shù),損失函數(shù)包括重構(gòu)誤差項和L2正則化項,如式(3)所示。

JAE(w,b)=err+λΩweights

(3)

式中:err為輸出的重構(gòu)值與輸入的實際值之間的均方誤差,其表達式如式(4)所示;Ωweights為L2正則化項,用于減少w(1),增加z(1),從而防止模型過度擬合;λ為式(5)中給出的L2正則化項的系數(shù)。

(4)

(5)

式中:L為隱藏層的層數(shù);N為訓練樣本的數(shù)據(jù)個數(shù);K為訓練數(shù)據(jù)中包含的參數(shù)個數(shù)。

1.2 SAE

大量研究表明,當生物視覺系統(tǒng)的主要處理區(qū)域?qū)π盘栠M行分析時,僅有少數(shù)神經(jīng)元處于激活狀態(tài),而大多數(shù)神經(jīng)元處于抑制狀態(tài),并且獲得的稀疏表達通常較其他表達更有效[8]。SAE是通過在AE的基礎上引入稀疏限制而建立的,其結(jié)構(gòu)如圖2所示[9]。如果激活函數(shù)為sigmoid函數(shù),當隱藏層神經(jīng)元的值接近1時,該神經(jīng)元被激活;當隱藏層神經(jīng)元的值接近0時,該神經(jīng)元被抑制。

圖2 SAE結(jié)構(gòu)簡圖Fig.2 Structure schematic of SAE

(6)

式中:n為訓練樣本的總數(shù);xj為第j個訓練樣本。

通過在式(3)中添加稀疏性正則化項,可得SAE損失函數(shù)為:

JSAE(w,b)=JAE(w,b)+βΩsparsity

(7)

(8)

1.3 訓練SAE

在SAE的訓練中,通常利用反向傳播(BP)算法來優(yōu)化神經(jīng)網(wǎng)絡的參數(shù),當代價函數(shù)達到誤差限值或迭代次數(shù)達到最大值時,停止訓練。其中權(quán)重和偏差在訓練過程中的迭代更新如下[12]:

(9)

(10)

1.4 核動力裝置數(shù)據(jù)特征提取

圖3 核動力裝置運行數(shù)據(jù)特征提取流程圖Fig.3 Flow chart of feature extraction for nuclear power plant operation data

根據(jù)核動力裝置的特點,設計如圖3所示的特征提取流程圖,主要包括3個階段:數(shù)據(jù)采集階段、數(shù)據(jù)處理階段和特征提取階段。首先在數(shù)據(jù)采集階段獲取不同設備的主要參數(shù)值,然后在數(shù)據(jù)處理階段對數(shù)據(jù)進行必要的預處理使數(shù)據(jù)符合要求,最后在特征提取階段將原始數(shù)據(jù)壓縮至低維特征空間,從而得到相應的特征值。

2 仿真測試與結(jié)果

為驗證該方法的可行性,將其應用到核動力裝置的狀態(tài)監(jiān)測中,狀態(tài)監(jiān)測方法為孤立森林方法[13]。為此用核動力裝置仿真軟件PCTRAN模擬了9種不同的運行工況(正常工況和異常工況),并獲得了相應的時間序列參數(shù)[14-15]。表1列出了工況類型與樣本數(shù)量。訓練數(shù)據(jù)樣本由4 000個數(shù)據(jù)組成,共包含64個參數(shù),其中異常數(shù)據(jù)有1 000個(故障程度范圍為5%~50%,破口事故故障程度為破口面積與總截面積比值,甩負荷事故故障程度為負荷與滿功率比值),100%滿功率下的正常數(shù)據(jù)有1 000個,90%滿功率下的正常數(shù)據(jù)有1 000個,80%滿功率下的正常數(shù)據(jù)有1 000個。為驗證該方法在單一正常工況下和多種正常工況下狀態(tài)監(jiān)測的有效性,考慮到實際情況下正常數(shù)據(jù)較異常數(shù)據(jù)多,按正常數(shù)據(jù)與異常數(shù)據(jù)的比例為9∶2從總樣本集中抽取1 100個數(shù)據(jù)組成訓練樣本。測試過程中共抽取了3組訓練樣本,第1組包含200個異常數(shù)據(jù),900個100%滿功率正常數(shù)據(jù);第2組包含200個異常數(shù)據(jù),450個100%滿功率正常數(shù)據(jù),450個90%滿功率正常數(shù)據(jù);第3組包含200個異常數(shù)據(jù),300

表1 工況類型與樣本數(shù)量Table 1 Condition type and sample count

個100%滿功率正常數(shù)據(jù),300個90%滿功率正常數(shù)據(jù),300個80%滿功率正常數(shù)據(jù)。

為體現(xiàn)SAE的優(yōu)勢,同時用不含稀疏項的AE作為對照,對相同的數(shù)據(jù)進行測試,相關(guān)參數(shù)設置列于表2。

表2 參數(shù)設置Table 2 Parameter setting

2.1 數(shù)據(jù)預處理

為更有效地提取特征和訓練狀態(tài)監(jiān)測模型,需對數(shù)據(jù)進行歸一化處理,通過歸一化既能消除量綱的影響同時又能保留數(shù)據(jù)的原始特征信息,本文采用極差歸一化法對原始數(shù)據(jù)進行預處理,其表達式為:

i=1,2,…,n,xi(t)∈[0,1]

(11)

式中,ximax(t)和ximin(t)分別為xi(t)的最大值和最小值。經(jīng)歸一化后,所有參數(shù)值均被限制在[0,1]范圍內(nèi),然后就能被用來訓練SAE模型和狀態(tài)監(jiān)測模型。

2.2 評價指標

通過設置SAE隱藏層神經(jīng)元的數(shù)量,可獲得與隱藏層神經(jīng)元數(shù)量對應的提取特征的維數(shù)。為評價提取特征的質(zhì)量,使用SAE訓練迭代收斂到相同誤差精度的迭代次數(shù)和受試者工作特性(ROC)曲線下的面積(AUC)作為評估標準。在優(yōu)先保證AUC足夠大的情況下,迭代次數(shù)越少,說明所提取特征的質(zhì)量越好。

2.3 特征提取結(jié)果

1) 案例1

該案例所用數(shù)據(jù)樣本包含200個異常數(shù)據(jù),900個100%滿功率正常數(shù)據(jù),共1 100個數(shù)據(jù)。圖4為案例1 AUC和訓練迭代次數(shù)與特征維度的關(guān)系。從圖4a可看出,AE的AUC在不同特征維度下的取值波動較大,且最大精度不超過96%,而SAE的AUC在不同特征維度下的取值比較穩(wěn)定,并能保持較高精度。從圖4b可看出,AE的收斂次數(shù)少,SAE的收斂次數(shù)較多,且隨特征維度的增加而明顯增加,結(jié)合圖4a的AUC,可認為AE易提前陷入局部最小值,而SAE盡管訓練收斂次數(shù)偏多,但更易找到全局最優(yōu)解。通過觀察圖4a中SAE的AUC與特征維度關(guān)系曲線可發(fā)現(xiàn),當特征維度取1時,AUC下降較明顯;當特征維度大于6時,AUC呈下降趨勢。當特征維度為3、4、5或6時,AUC能取到最大值1,這說明狀態(tài)監(jiān)測模型此時能有最大識別率??紤]到迭代次數(shù)應越小越好,因此當特征維度取3時,可認為是最佳情況。

圖5為特征維度分別為1、2和3時的可視化結(jié)果,可視化結(jié)果由等高線圖和散點圖組成。其中藍色區(qū)域為正常狀態(tài)區(qū)域,當異常分數(shù)接近于0時,藍色程度加深,這意味著該區(qū)域的數(shù)據(jù)為正常數(shù)據(jù)的可能性更高。黃色區(qū)域為異常區(qū)域,當異常分數(shù)接近于1時,黃色程度加深,這意味著該區(qū)域的數(shù)據(jù)為異常數(shù)據(jù)的可能性更高。如圖5a所示,為使可視化效果更好,當提取特征維度取1時,用極坐標圖對結(jié)果進行展示,半徑為特征參數(shù)的取值。圖5b、c的坐標軸參數(shù)為相應特征維度下的特征參數(shù)。

特征提取結(jié)果顯示經(jīng)特征提取后,正常數(shù)據(jù)都集中在原點區(qū)域,異常數(shù)據(jù)以離散形式分布在正常數(shù)據(jù)周圍。通過局部放大圖可發(fā)現(xiàn),當特征維度取1和2時,在正常數(shù)據(jù)周圍有一部分數(shù)據(jù)被錯誤分類,當特征維度取3時,無數(shù)據(jù)被誤判。因此可認為將數(shù)據(jù)壓縮至3維特征空間,可作為最佳維度去訓練狀態(tài)監(jiān)測模型。

圖4 案例1 AUC和訓練迭代次數(shù)與特征維度的關(guān)系Fig.4 AUC and training iteration under different feature dimensions for case 1

圖5 案例1當特征維度為1(a)、2(b)、3(c)時的可視化結(jié)果Fig.5 Visualization results for feature dimensions taken as 1(a), 2(b) and 3(c) for case 1

2) 案例2

該案例所用數(shù)據(jù)樣本包含200個異常數(shù)據(jù),450個100%滿功率正常數(shù)據(jù),450個90%滿功率正常數(shù)據(jù),共1 100個數(shù)據(jù)。圖6為案例2 AUC和訓練迭代次數(shù)與特征維度的關(guān)系。從圖6a可看出,該結(jié)果與案例1類似,AE的AUC在不同特征維度下的取值波動較大,而SAE的AUC在不同特征維度下的取值較穩(wěn)定,并能保持較高精度。從圖6b可看出,AE的收斂次數(shù)少,SAE的收斂次數(shù)較多,且隨特征維度的增加而明顯增加,結(jié)合圖6a的AUC,可認為AE易提前陷入局部最小值,而SAE盡管訓練收斂次數(shù)偏多,但更易找到全局最優(yōu)解。通過觀察SAE的訓練迭代次數(shù)與特征維度關(guān)系曲線可看出,提取特征維度越小,訓練迭代的次數(shù)越少,當提取特征維度小于16時,迭代次數(shù)有一明顯的下降趨勢。通過觀察SAE的AUC與提取特征維度關(guān)系曲線可發(fā)現(xiàn),當特征維度取1時,AUC下降較明顯;當特征維度大于7時,AUC呈下降趨勢。當特征維度為4時,AUC能取到最大值0.994 9,這說明狀態(tài)監(jiān)測模型此時具有最大識別率,同時又能取得較低的迭代次數(shù),因此當特征維度取4時,可認為是最佳的情況。

圖7為特征維度分別為1、2和3時的可視化結(jié)果。當特征維度取1時,在異常分數(shù)接近于0的區(qū)域,存在明顯的誤判,這說明1維特征不能反映數(shù)據(jù)的本質(zhì)特征。圖7b、c可發(fā)現(xiàn),正常數(shù)據(jù)主要集中在兩個區(qū)域,這說明了數(shù)據(jù)中包含兩類正常數(shù)據(jù),異常數(shù)據(jù)主要分布在正常數(shù)據(jù)周圍。通過局部放大圖可發(fā)現(xiàn),在正常數(shù)據(jù)周圍存在一些誤判。

3) 案例3

該案例所用數(shù)據(jù)樣本包含200個異常數(shù)據(jù),300個100%滿功率正常數(shù)據(jù),300個90%滿功率正常數(shù)據(jù),300個80%滿功率正常數(shù)據(jù),共1 100個數(shù)據(jù)。圖8為案例3 AUC和訓練迭代次數(shù)與特征維度的關(guān)系。從圖8可知,第3組數(shù)據(jù)集的結(jié)果與前兩組數(shù)據(jù)的結(jié)果基本類似,即SAE訓練收斂次數(shù)偏多,但更易找到全局最優(yōu)解;當特征維度取11時,AUC能取到最大值0.992 2,此時監(jiān)測精度為97.1%。因此可認為該組數(shù)據(jù)集的最佳特征維度為11。

圖9為特征維度分別為1、2和3時的可視化結(jié)果。當特征維度取1時,在異常分數(shù)接近于0的區(qū)域,存在明顯的誤判,這說明1維特征不能反映數(shù)據(jù)的本質(zhì)特征。圖9b、c可發(fā)現(xiàn),正常數(shù)據(jù)主要集中在3個區(qū)域,這說明了數(shù)據(jù)中包含3類正常數(shù)據(jù),異常數(shù)據(jù)主要分布在正常數(shù)據(jù)周圍,并且誤判主要集中在正常數(shù)據(jù)附近。

圖6 案例2 AUC和訓練迭代次數(shù)與特征維度的關(guān)系Fig.6 AUC and training iteration under different feature dimensions for case 2

圖7 案例2當特征維度為1(a)、2(b)、3(c)時的可視化結(jié)果Fig.7 Visualization results for feature dimensions taken as 1(a), 2(b) and 3(c) for case 2

圖8 案例3 AUC和訓練迭代次數(shù)與特征維度的關(guān)系Fig.8 AUC and training iteration under different feature dimensions for case 3

圖9 案例3當特征維度為1(a)、2(b)、3(c)時的可視化結(jié)果Fig.9 Visualization results for feature dimensions taken as 1(a), 2(b) and 3(c) for case 3

3 結(jié)論

本文提出了基于SAE的特征提取方法,并將其應用于核動力裝置狀態(tài)監(jiān)測中。在保證較高的狀態(tài)監(jiān)測精度和較低的訓練迭代次數(shù)的條件下,實現(xiàn)對原始數(shù)據(jù)的特征提取。在案例1中,將包含1種正常工況的原始數(shù)據(jù)壓縮成3維數(shù)據(jù),此時AUC可取到最大值1,并實現(xiàn)100%狀態(tài)監(jiān)測精度。在案例2中,將包含兩種正常工況的原始數(shù)據(jù)壓縮成4維數(shù)據(jù),此時AUC取到最大值0.994 9,并實現(xiàn)98%的監(jiān)測精度。在案例3中,將包含3種正常工況的原始數(shù)據(jù)壓縮成11維數(shù)據(jù),此時AUC取到最大值0.992 2,并實現(xiàn)97%的監(jiān)測精度。通過將3個案例中SAE與AE的特征提取結(jié)果進行對比可發(fā)現(xiàn),SAE得到的結(jié)果相對較穩(wěn)定,不易陷入局部最優(yōu)解。同時,通過可視化作圖,將降維結(jié)果與狀態(tài)監(jiān)測結(jié)果結(jié)合,可直觀分辨特征提取結(jié)果優(yōu)劣。綜上所述,基于SAE的特征提取方法的優(yōu)勢主要體現(xiàn)在:1) 可提取原始數(shù)據(jù)在低維空間中的特征,實現(xiàn)高維數(shù)據(jù)向低維空間的轉(zhuǎn)換,從而節(jié)約計算資源;2) 訓練過程中不易陷入局部最優(yōu)解;3) 將樣本的本質(zhì)特征信息凝聚到低維空間,從而提高狀態(tài)監(jiān)測的精確度。

猜你喜歡
核動力特征提取次數(shù)
俄羅斯基洛夫級核動力導彈巡洋艦
軍事文摘(2023年13期)2023-07-16 09:00:10
機場航站樓年雷擊次數(shù)計算
2020年,我國汽車召回次數(shù)同比減少10.8%,召回數(shù)量同比增長3.9%
商用汽車(2021年4期)2021-10-13 07:16:02
神劍(2021年3期)2021-08-14 02:29:40
一類無界算子的二次數(shù)值域和譜
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
核動力第一艦
依據(jù)“次數(shù)”求概率
Bagging RCSP腦電特征提取算法
倘若“菲萊”使用的是核動力
太空探索(2015年10期)2015-07-18 10:59:20
肇州县| 昌吉市| 荣昌县| 蒲城县| 宜兰市| 博客| 青岛市| 大厂| 池州市| 彝良县| 金山区| 东平县| 阜平县| 荆门市| 德格县| 云南省| 盐津县| 蒙自县| 岳池县| 沈丘县| 东至县| 嵊州市| 阳高县| 渭南市| 梁平县| 古丈县| 上犹县| 鄂托克前旗| 永和县| 留坝县| 嫩江县| 石棉县| 固安县| 含山县| 钟山县| 鄂温| 繁昌县| 会同县| 星子县| 鸡西市| 库伦旗|