周天澤 虞凱程 程懋松 戴志敏,3
1(上海科技大學(xué) 上海 201210)
2(中國科學(xué)院上海應(yīng)用物理研究所 上海 201800)
3(中國科學(xué)院大學(xué) 北京 100049)
熔鹽堆是第四代先進核能系統(tǒng)之一,其利用熔鹽作為燃料與冷卻劑,其研究始于20世紀(jì)40年代末的美國[1-2],美國橡樹嶺國家實驗室(Oak Ridge National Laboratory,ORNL)于1954年建造了2.5 MW空間動力試驗反應(yīng)堆(Aircraft Reactor Experiment,ARE),展示了很好的穩(wěn)定性以及易控制性[3]。熔鹽堆具備高溫、低壓、高化學(xué)穩(wěn)定性等特性,可被應(yīng)用于高溫制氫、放射性同位素制備、內(nèi)陸地區(qū)發(fā)電等場景[4-6]。在熔鹽堆運行過程中,需要及時識別可能的事故瞬態(tài)并采取措施,以防止事故瞬態(tài)進一步惡化,確保反應(yīng)堆安全。目前,核電站采用的瞬態(tài)識別方法主要依靠操作員根據(jù)監(jiān)測數(shù)據(jù)進行人為識別,這種方法存在著較大的人為因素[7]。為了盡量減少人為因素的引入,確保核電安全,可以采用機器學(xué)習(xí)方法建立核反應(yīng)堆系統(tǒng)瞬態(tài)識別模型,在較少的人為因素下對核反應(yīng)堆系統(tǒng)瞬態(tài)工況進行快速、準(zhǔn)確地識別。
目前,國內(nèi)外已有許多團隊進行了基于機器學(xué)習(xí)核電站系統(tǒng)瞬態(tài)識別模型的開發(fā)。哈爾濱工程大學(xué)Wang等[8]利用卷積神經(jīng)網(wǎng)絡(luò)提取輸入?yún)?shù)特征后再利用遷移學(xué)習(xí)降低不同功率水平下的特征分布差異,實現(xiàn)不同功率水平下的核電站系統(tǒng)瞬態(tài)識別。來自東北大學(xué)的Li等[9]提出了一種無監(jiān)督聚類方法,能夠自動準(zhǔn)確地匹配運行瞬態(tài)與預(yù)先設(shè)計的瞬態(tài),從而減少操作員主觀判斷瞬態(tài)類型帶來的誤差。Ramezani等[10]采用多種特征過濾方法以確定核電站瞬態(tài)識別的重要輸入?yún)?shù),以降低訓(xùn)練系統(tǒng)瞬態(tài)識別模型所帶來的計算成本,結(jié)果表明,采用鄰成分分析濾波方法進行特征過濾的系統(tǒng)瞬態(tài)識別模型擁有最好的性能,并確定了模型達(dá)到90%識別準(zhǔn)確率所需的最少輸入?yún)?shù)類型。dos Santos等[11]開發(fā)了一種基于5層深度整流神經(jīng)網(wǎng)絡(luò)的系統(tǒng)瞬態(tài)識別模型,用于巴西壓水堆瞬態(tài)事故識別,在識別12種瞬態(tài)事故與穩(wěn)態(tài)運行工況時的準(zhǔn)確率達(dá)到99.03%。Mendoza和Tsvetkov[12]利用主成分分析和支持向量機、深度神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)開發(fā)了故障檢測與診斷監(jiān)控系統(tǒng)FDDMS(Fault Detection and Diagnosis Monitoring System),可用于核電站功率調(diào)節(jié)瞬態(tài)識別,卷積神經(jīng)網(wǎng)絡(luò)在Raw類型的數(shù)據(jù)中可以達(dá)到99%以上的識別準(zhǔn)確率。Mena等[13]使用AutoML和TPOT等工具,基于6種機器學(xué)習(xí)方法建立了6種不同的系統(tǒng)瞬態(tài)識別模型,用于識別APR1400的系統(tǒng)瞬態(tài),并且6種模型均達(dá)到95%以上的識別準(zhǔn)確率,其中基于邏輯回歸的系統(tǒng)瞬態(tài)識別模型達(dá)到了98%以上的識別準(zhǔn)確率。目前,國內(nèi)外的相關(guān)研究主要集中在壓水堆、沸水堆等堆型,缺乏針對熔鹽堆的系統(tǒng)瞬態(tài)識別模型研究,鑒于熔鹽堆獨特的設(shè)計和運行方式,需要基于機器學(xué)習(xí)方法開發(fā)適用于熔鹽堆的系統(tǒng)瞬態(tài)識別模型。
為了減少熔鹽堆運行過程中人為因素,提高熔鹽堆運行安全,基于K近鄰(K-nearest Neighbor,KNN)機器學(xué)習(xí)方法,建立了熔鹽堆系統(tǒng)瞬態(tài)識別模型,并對系統(tǒng)瞬態(tài)識別模型在噪聲下的魯棒性進行詳細(xì)分析和優(yōu)化。
基于KNN的熔鹽堆系統(tǒng)瞬態(tài)識別模型的開發(fā)流程主要包括兩個部分:數(shù)據(jù)集生成和系統(tǒng)瞬態(tài)識別模型的建立,如圖1所示。使用熔鹽堆系統(tǒng)分析程序RELAP5-TMSR進行建模與仿真,獲得對應(yīng)瞬態(tài)工況的運行數(shù)據(jù),生成數(shù)據(jù)集并劃分為訓(xùn)練集與測試集。而系統(tǒng)瞬態(tài)識別模型的建立過程則基于前一過程中所得到的訓(xùn)練集與測試集。這一過程主要包含對系統(tǒng)瞬態(tài)模型的訓(xùn)練、優(yōu)化與測試:通過訓(xùn)練集訓(xùn)練及優(yōu)化基于KNN的系統(tǒng)瞬態(tài)識別模型的超參數(shù),然后使用測試集數(shù)據(jù)對優(yōu)化好的系統(tǒng)瞬態(tài)識別模型進行測試,并對系統(tǒng)瞬態(tài)識別模型的泛化能力進行評估。
圖1 熔鹽堆系統(tǒng)瞬態(tài)識別模型開發(fā)流程Fig.1 Development process of the system transient identification model
KNN是一種基于實例的監(jiān)督學(xué)習(xí)算法,可以用于分類和回歸問題[14];同樣是一種懶惰學(xué)習(xí)方法[15],它不需要訓(xùn)練階段,只需存儲訓(xùn)練數(shù)據(jù)集。
對于分類問題,KNN根據(jù)未知類別的樣本點的K個最近鄰樣本點中出現(xiàn)最多的類別來確定未知樣本點的類別。因此,在KNN算法中,K這一超參數(shù)的選取至關(guān)重要。通常情況下,如果K值過小,識別結(jié)果對近鄰點非常敏感,容易過擬合;如果K值過大,模型容易受到樣本分布的影響,導(dǎo)致欠擬合。KNN的優(yōu)點是可以快速對新的測試樣本進行分類;缺點是對于大規(guī)模數(shù)據(jù)集,計算距離的復(fù)雜度較高。如果采用暴力搜索(Brute Force)計算數(shù)據(jù)所有點之間的距離,在面對大量的高維數(shù)據(jù)時,將耗費大量時間和計算資源。采用K-D樹或球數(shù)等算法[16-17]可以解決暴力搜索的低效率問題。同時,在KNN方法中,近鄰點距離的計算方法也很重要[18]。歐氏距離和曼哈頓距離是兩種距離計算方法,n維空間點a(x11,x12,…,x1n)與b(x21,x22,…,x2n)之間的兩種距離數(shù)學(xué)表達(dá)d12E和d12M分別如式(1)和(2)所示:
在熔鹽堆系統(tǒng)瞬態(tài)識別模型中(圖2),KNN方法依據(jù)待識別瞬態(tài)樣本在多維空間中的K個最近鄰瞬態(tài)樣本,按照少數(shù)服從多數(shù)原則,確定待識別瞬態(tài)樣本的瞬態(tài)類型。
圖2 基于KNN的熔鹽堆系統(tǒng)瞬態(tài)識別模型Fig.2 KNN-based system transient identification model for the MSR system
基于KNN的系統(tǒng)瞬態(tài)識別模型的超參數(shù)選取也大致圍繞這幾方面進行展開,如表1所示,待優(yōu)化的超參數(shù)包含鄰近點數(shù)K(N_neighbors)、鄰近點查找方法(Algorithm)、距離計算方法(P)和鄰近點權(quán)重方式(Weights)。
基于KNN的系統(tǒng)瞬態(tài)識別模型框架如圖3所示。模型的輸入為N種熔鹽堆內(nèi)的系統(tǒng)運行參數(shù),如反應(yīng)堆功率、溫度、壓力和質(zhì)量流量等。模型的輸出是P種瞬態(tài)工況在對應(yīng)N種運行參數(shù)下的概率,最終模型從這些瞬態(tài)工況中選取概率最大的瞬態(tài)作為最終的識別結(jié)果。
圖3 基于KNN的系統(tǒng)瞬態(tài)識別模型框架Fig.3 Framework of the KNN-based system transient identification model
20世紀(jì)60年代,美國橡樹嶺國家實驗室設(shè)計并建造了熔鹽實驗堆(Molten Salt Reactor Experiment,MSRE),并于1965年成功運行。本文以MSRE為對象,建立和訓(xùn)練熔鹽堆系統(tǒng)瞬態(tài)識別模型。由于相關(guān)報告中的瞬態(tài)實驗數(shù)據(jù)不足,因此使用由中國科學(xué)院上海應(yīng)用物理研究所團隊[19-21]擴展開發(fā)的RELAP5-TMSR系統(tǒng)分析程序?qū)SRE的瞬態(tài)工況進行建模與仿真,產(chǎn)生所需數(shù)據(jù)集。MSRE的RELAP5-TMSR模型節(jié)點圖如圖4所示。
圖4 MSRE的RELAP5-TMSR節(jié)點圖Fig.4 RELAP5-TMSR nodalization of the MSRE
為了開展系統(tǒng)瞬態(tài)識別研究,參考ORNL的MSRE相關(guān)報告[22],選擇了表2中所列的瞬態(tài)工況,并使用RELAP5-TMSR程序進行建模與仿真。除了考慮瞬態(tài)工況的選擇,還需要選擇合適的熔鹽堆系統(tǒng)運行參數(shù)作為系統(tǒng)瞬態(tài)識別模型的輸入特征。在選取輸入特征時,參考實際熔鹽堆中操作人員容易獲得的一些參數(shù),選取了表3中所列的功率、堆芯出入口溫度、回路壓力和質(zhì)量流量等11種熔鹽堆運行參數(shù)。為了更好地測試系統(tǒng)瞬態(tài)識別模型的泛化能力,將熔鹽堆系統(tǒng)瞬態(tài)識別模型的數(shù)據(jù)集劃分為訓(xùn)練集與測試集,兩者獨立生成。為確保模擬結(jié)果的穩(wěn)定性和可靠性,相應(yīng)的瞬態(tài)工況在MSRE穩(wěn)態(tài)運行100 s后引入。訓(xùn)練集在1~8 MW的熱功率下均勻分成8種功率水平,在每個功率水平下對瞬態(tài)工況進行建模與仿真,每隔1 s提取對應(yīng)時刻的11種熔鹽堆運行參數(shù)作為熔鹽堆系統(tǒng)識別的特征參數(shù)。最終,獲取的訓(xùn)練數(shù)據(jù)集由72 356個數(shù)據(jù)點組成。測試數(shù)據(jù)集在1~8 MW的隨機反應(yīng)堆功率下的11種不同運行狀態(tài)生成,由25 055個數(shù)據(jù)點組成,以更全面地評估系統(tǒng)瞬態(tài)識別模型的性能和識別能力。
表2 MSRE運行工況類型Table 2 MSRE operation condition type
表3 熔鹽堆系統(tǒng)識別特征參數(shù)Table 3 Feature parameters of identification in MSR system
本節(jié)利用生成的數(shù)據(jù)集訓(xùn)練和優(yōu)化基于KNN的系統(tǒng)瞬態(tài)識別模型,進一步提高系統(tǒng)瞬態(tài)識別模型的識別準(zhǔn)確率和泛化能力。
2.2.1 超參數(shù)優(yōu)化
通過對超參數(shù)優(yōu)化,從超參數(shù)組合中尋找到最優(yōu)的超參數(shù)組合,使得基于KNN的系統(tǒng)瞬態(tài)識別模型在驗證集的性能最佳。采用5折交叉法和隨機搜索相結(jié)合的方式對超參數(shù)組合進行篩選。
在超參數(shù)優(yōu)化中,需要確定優(yōu)化指標(biāo)以評估不同超參數(shù)組合下的系統(tǒng)瞬態(tài)識別模型性能。在機器學(xué)習(xí)中,基于KNN的系統(tǒng)瞬態(tài)識別模型是一種分類模型,通常用表4的形式來表述二分類結(jié)果。真正例(True Positive,TP)是模型正確地將正例預(yù)測為正例的數(shù)量。假正例(False Positive,F(xiàn)P)是模型錯誤地將負(fù)例預(yù)測為正例的數(shù)量。真反例(True Negative,TN)是模型正確地將負(fù)例預(yù)測為負(fù)例的數(shù)量。假反例(False Negative,F(xiàn)N)是模型錯誤地將正例預(yù)測為負(fù)例的數(shù)量。這4個二分類指標(biāo)可以進一步組成不同的性能指標(biāo)。在熔鹽堆系統(tǒng)瞬態(tài)識別模型的超參數(shù)優(yōu)化中選用最常用的準(zhǔn)確率(Accuracy)作為評估指標(biāo),其數(shù)學(xué)表達(dá)形式如式(3)所示。
表4 二分類結(jié)果Table 4 Binary classification results
2.2.2 系統(tǒng)瞬態(tài)識別模型優(yōu)化結(jié)果
對表1所選取的超參數(shù)組合進行優(yōu)化,優(yōu)化結(jié)果如圖5所示。鄰近點查找方法、鄰近點數(shù)K、距離計算方法對于基于KNN的系統(tǒng)瞬態(tài)識別模型準(zhǔn)確率影響不明顯。但在鄰近點權(quán)重方式中,采用“distance”方式進行鄰近點權(quán)重略優(yōu)于采用“uniform”方式進行鄰近點權(quán)重。其中最優(yōu)超參數(shù)組合列于表5中。
表5 基于KNN的系統(tǒng)瞬態(tài)識別模型超參數(shù)優(yōu)化結(jié)果Table 5 Hyper-parameters optimization results of KNN-based system transient identification model
圖5 基于KNN的系統(tǒng)瞬態(tài)識別模型超參數(shù)優(yōu)化結(jié)果Fig.5 Hyper-parameter optimization results of the KNN-based system transient identification model
在評估系統(tǒng)瞬態(tài)識別模型時需要選擇評估指標(biāo),在上一小節(jié)的模型優(yōu)化過程中采用了準(zhǔn)確率,但是在某些情況下,單純依賴準(zhǔn)確率并不能完全反映系統(tǒng)瞬態(tài)識別模型的性能。在類別不平衡的情況下,即某一類別的樣本數(shù)量明顯少于另一類別時,僅使用準(zhǔn)確率評估分類器的性能會產(chǎn)生偏差,因為此時分類器可能會傾向于預(yù)測樣本數(shù)量較多的類別。在評估熔鹽堆系統(tǒng)瞬態(tài)識別模型時,需要引入其他指標(biāo)來更全面地對系統(tǒng)瞬態(tài)識別模型的性能進行評估。除準(zhǔn)確率外,額外選取了在機器學(xué)習(xí)分類方法中常用的其他三個評估指標(biāo):精確率(Precision)、召回率(Recall)和F1分?jǐn)?shù)(F1-score)[23],它們的具體數(shù)學(xué)表達(dá)形式如下:
精確率反映了被模型正確識別的正樣本數(shù)量占模型識別的所有正樣本數(shù)量的比例,精確率越高,說明模型正確識別出的正樣本數(shù)量越多。召回率反映了被模型正確識別的正樣本數(shù)量占總正樣本數(shù)量的比例,召回率越高,說明模型正確識別出的正樣本數(shù)量越接近于總正樣本數(shù)量。而F1分?jǐn)?shù)綜合考慮精確率和召回率,是精確率和召回率的調(diào)和平均數(shù)。
采用混淆矩陣(Confusion Matrix)評估系統(tǒng)瞬態(tài)識別模型在測試集上的識別性能。混合矩陣圖中的數(shù)字為樣本數(shù),橫坐標(biāo)為系統(tǒng)瞬態(tài)識別模型對瞬態(tài)的識別類別,縱坐標(biāo)為真實瞬態(tài)類別,位于對角線上的樣本為系統(tǒng)瞬態(tài)識別模型正確識別的樣本?;贙NN的熔鹽堆系統(tǒng)瞬態(tài)識別模型的測試結(jié)果如圖6所示。
圖6 基于KNN的系統(tǒng)瞬態(tài)識別模型混淆矩陣圖Fig.6 Confusion matrix for the KNN-based system transient identification model
基于KNN的系統(tǒng)瞬態(tài)識別模型的準(zhǔn)確率、精確率、召回率和F1分?jǐn)?shù)均為99.99%,如表6所示?;贙NN的系統(tǒng)瞬態(tài)識別模型正確識別了25 055個瞬態(tài)工況樣本中的25 054個瞬態(tài)工況,只有一例3根控制棒誤提升樣本被誤識別為2根控制棒誤提升。此外,單獨瞬態(tài)的F1分?jǐn)?shù)結(jié)果列于表7中,基于KNN的系統(tǒng)瞬態(tài)識別模型在測試集上表現(xiàn)出極佳的識別性能。這表明了本文建立的基于KNN的熔鹽堆系統(tǒng)瞬態(tài)識別模型能夠高效、準(zhǔn)確地識別MSRE中的多種瞬態(tài)工況。
表6 基于KNN識別模型測試結(jié)果Table 6 Test results of KNN-based identification models
表7 單獨瞬態(tài)的F1分?jǐn)?shù)Table 7 F1-score of individual transient
在熔鹽堆實際運行過程中,測量儀表的測量數(shù)值會受到不同程度的噪聲干擾。因此,在系統(tǒng)瞬態(tài)識別模型對熔鹽堆系統(tǒng)瞬態(tài)進行識別的過程中,需要考慮系統(tǒng)瞬態(tài)識別模型的輸入?yún)?shù)在實際應(yīng)用時的噪聲干擾,開展對熔鹽堆系統(tǒng)瞬態(tài)識別模型在噪聲下的魯棒性分析。測量儀表在t時刻測得的運行參數(shù)數(shù)值X(t)可以表示為[24]:
式中:S(t)是運行參數(shù)在t時刻的真實數(shù)值;D(t)是t時刻噪聲對測量儀表的干擾。這些噪聲干擾通常來自多個不同噪聲源,并且具有一定的隨機性。隨著噪聲源數(shù)量的增加,這些噪聲之和近似服從高斯分布,通過假設(shè)噪聲干擾的總和為高斯白噪聲以模擬未知的真實噪聲[25]。
噪聲的大小通常采用信噪比(Signal to Noise Ratio,SNR)來衡量[26],表示為:
式中:Psignal代表信號功率;Pnoise代表噪聲功率;Asignal代表信號幅度;Anoise代表噪聲幅度。在核電站內(nèi),測量儀表受到的噪聲干擾不會太大,最大噪聲干擾的SNR在30 dB左右[27]。本文通過在測試集中添加20~50 dB的高斯白噪聲干擾,分析基于KNN的系統(tǒng)瞬態(tài)識別模型的魯棒性。
基于KNN的系統(tǒng)瞬態(tài)識別模型在含噪聲測試集中的測試結(jié)果如圖7所示。4種評估指標(biāo)呈現(xiàn)出隨著SNR的增長而不斷上升的趨勢,在低SNR下較低,并在40 dB左右基本達(dá)到一致水平。其中準(zhǔn)確率在不同SNR下均高于其他三個評估指標(biāo);而精確率在低SNR時和準(zhǔn)確率保持一致,但是其上升趨勢較慢;召回率與F1分?jǐn)?shù)在不同SNR下基本保持一致,但均低于準(zhǔn)確率與精確率的數(shù)值。
圖7 魯棒性測試結(jié)果Fig.7 Robustness test results
對基于KNN的系統(tǒng)瞬態(tài)識別模型在30 dB SNR下的魯棒性進一步分析?;贙NN的系統(tǒng)瞬態(tài)識別模型在30 dB SNR下識別準(zhǔn)確率為97.41%,精確率達(dá)到94.47%,召回率和F1分?jǐn)?shù)也分別達(dá)到94.61%和94.31%,如表8所示,4項評估指標(biāo)均高于94%,具有較好的魯棒性。但是準(zhǔn)確率明顯高于精確率、召回率和F1分?jǐn)?shù),準(zhǔn)確率作為綜合指標(biāo),可能會忽略某幾種瞬態(tài)帶來的影響,而精確率、召回率和F1分?jǐn)?shù)考慮了單一瞬態(tài)帶來的影響,可以推斷是因為誤識別瞬態(tài)分布集中導(dǎo)致。相比較在無噪聲下達(dá)到99.99%的識別結(jié)果,在30 dB噪聲下的識別結(jié)果較低,需要進一步優(yōu)化系統(tǒng)瞬態(tài)識別模型的魯棒性。
表8 系統(tǒng)瞬態(tài)識別模型在30 dB SNR下的識別結(jié)果Table 8 Results of system transient identification model under 30 dB SNR
3.2.1 含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型
含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型通過在數(shù)據(jù)集中加入噪聲,使用含噪聲數(shù)據(jù)對基于KNN的系統(tǒng)瞬態(tài)識別模型重新訓(xùn)練,從而進一步優(yōu)化系統(tǒng)瞬態(tài)識別模型在噪聲下的魯棒性。在數(shù)據(jù)集中添加SNR為30 dB的噪聲,使得訓(xùn)練集中的數(shù)據(jù)含有噪聲,從而增加系統(tǒng)瞬態(tài)識別模型在噪聲下對瞬態(tài)工況的識別能力。
3.2.2 含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型優(yōu)化
與基于KNN的系統(tǒng)瞬態(tài)識別模型超參數(shù)優(yōu)化過程一樣,通過5折交叉法和隨機搜索相結(jié)合的方式對表1中的超參數(shù)組合進行篩選。含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型優(yōu)化結(jié)果如圖8所示,最優(yōu)超參數(shù)組合列于表9中。
表9 含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型超參數(shù)優(yōu)化結(jié)果Table 9 Hyper-parameters optimization results of system transient identification model trained by data with noise
圖8 含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型超參數(shù)優(yōu)化結(jié)果Fig.8 Hyper-parameter optimization results of the system transient identification model trained on noisy data
3.2.3 含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型測試及評估
同樣使用準(zhǔn)確率、精確率、召回率和F1分?jǐn)?shù)4個評估指標(biāo)對含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型的泛化能力進行評估。首先在不含噪聲的測試集上,對基于KNN的含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型的性能進行測試,其測試結(jié)果如圖9所示。
圖9 基于KNN的含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型在無噪聲測試集上的混淆矩陣圖Fig.9 Confusion matrix for the KNN-based system transient identification model trained using noisy data on noiseless test datasets
基于KNN含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型無噪聲測試集數(shù)據(jù)中的準(zhǔn)確率為99.69%、精確率為99.26%、召回率和F1分?jǐn)?shù)均為99.22%,如表10所示。其在無噪聲測試集上的4項評估指標(biāo)也均超過99%,具有較好的熔鹽堆系統(tǒng)瞬態(tài)識別性能。
表10 基于KNN含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型在無噪聲測試集上的測試結(jié)果Table 10 Results of KNN-based system transient identification model trained by data with noise on noiseless test datasets
但是無噪聲只是一種理想環(huán)境,在熔鹽堆實際運行過程中,儀表測量往往會受到環(huán)境噪聲干擾,因此主要在噪聲環(huán)境下對含噪聲模型進行分析。需要在有噪聲測試集上,對含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型進行測試。因為在訓(xùn)練集中添加的噪聲為30 dB SNR,所以在測試集上同樣添加了30 dB SNR的噪聲。采用混合矩陣評估含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型對含噪樣本的識別情況。基于KNN的含噪聲數(shù)據(jù)訓(xùn)練的瞬態(tài)模型在含噪測試集中的表現(xiàn)結(jié)果如圖10所示。
圖10 基于KNN的含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型在含噪聲測試集上的混淆矩陣圖Fig.10 Confusion matrix for the KNN-based system transient identification model trained using noisy data on noisy test datasets
基于KNN含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型在30 dB SNR的含噪聲測試集數(shù)據(jù)中的準(zhǔn)確率為99.89%、精確率為99.73%、召回率和F1分?jǐn)?shù)均為99.73%,如表11所示。含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型正確識別了25 055個瞬態(tài)工況樣本中的25 028個瞬態(tài)工況,其中27個被誤識別的瞬態(tài)工況均為控制棒誤提升瞬態(tài),有17例2根控制棒誤提升瞬態(tài)被誤識別為3根控制棒誤提升。使用含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型在含噪聲測試集上的識別性能非常優(yōu)越,具體單獨瞬態(tài)的F1分?jǐn)?shù)結(jié)果列于表12中。表明了本文建立的基于KNN的含噪聲數(shù)據(jù)訓(xùn)練的熔鹽堆系統(tǒng)瞬態(tài)識別模型能夠在30 dB SNR的噪聲環(huán)境下準(zhǔn)確地識別MSRE中的多種瞬態(tài)工況。
表11 基于KNN含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型測試結(jié)果Table 11 Results of KNN-based noise-added system transient identification model in test datasets
表12 基于KNN含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型識別單獨瞬態(tài)的F1分?jǐn)?shù)Table 12 F1-scores of individual transients using KNN-based system transient identification model trained by data with noise
3.2.4 含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型魯棒性分析
相較于不含噪聲數(shù)據(jù)的系統(tǒng)瞬態(tài)識別模型,使用含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型在30 dB SNR的高斯白噪聲下具有較高的魯棒性。但是考慮到熔鹽堆在實際運行中,儀表測量受到的噪聲干擾未知,30 dB SNR的高斯白噪聲僅能反映含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型在最大噪聲下具有較好的性能,仍需要對含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型在不同程度SNR的高斯白噪聲下的魯棒性進行分析?;贙NN的含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型在20~50 dB SNR噪聲下的魯棒性測試結(jié)果如圖11所示。
圖11 含噪聲數(shù)據(jù)訓(xùn)練的系統(tǒng)瞬態(tài)識別模型魯棒性測試結(jié)果Fig.11 Robustness test results of the system transient identification model trained on noisy data
4種評估指標(biāo)呈現(xiàn)出先隨著SNR的增長而不斷上升,再隨著SNR的增長而不斷緩慢降低的趨勢,轉(zhuǎn)折點在27 dB左右。準(zhǔn)確率在不同SNR下依舊高于其他三個評估指標(biāo),并且在高SNR下依舊明顯高于其他三個評估指標(biāo)。在低SNR下,精確率、召回率和F1分?jǐn)?shù)的差別較為明顯,精確率較高而F1分?jǐn)?shù)最差;在高SNR下,這三種指標(biāo)幾乎保持一致。相較于魯棒性優(yōu)化前的識別模型,魯棒性優(yōu)化后的系統(tǒng)瞬態(tài)識別模型在噪聲下具有更好的識別性能,這也表明了采用含噪聲數(shù)據(jù)訓(xùn)練方法可以有效提高識別模型在噪聲下的魯棒性,同時也證明了魯棒性優(yōu)化后的基于KNN的熔鹽堆系統(tǒng)瞬態(tài)識別模型在高斯白噪聲下具有極高的識別性能,可以在噪聲下準(zhǔn)確識別MSRE瞬態(tài)工況。
為了減少熔鹽堆系統(tǒng)瞬態(tài)識別過程中引入的人為因素,提高熔鹽堆運行安全,基于KNN方法建立了熔鹽堆系統(tǒng)瞬態(tài)識別模型。使用系統(tǒng)分析程序RELAP5-TMSR生成數(shù)據(jù)集進行系統(tǒng)瞬態(tài)識別模型的訓(xùn)練和超參數(shù)優(yōu)化,并對系統(tǒng)瞬態(tài)識別模型的性能進行了測試與評估??紤]到熔鹽堆實際運行中的測量儀表噪聲干擾,對系統(tǒng)瞬態(tài)識別模型在噪聲下的魯棒性進行了分析和優(yōu)化。結(jié)果表明:在無噪聲情況下,基于KNN方法建立的熔鹽堆系統(tǒng)瞬態(tài)識別模型識別性能極佳,在噪聲下識別性能同樣較好,表現(xiàn)出較高的魯棒性;通過魯棒性優(yōu)化,系統(tǒng)瞬態(tài)識別模型在噪聲下的識別性能進一步提升,魯棒性得到增強。上述結(jié)果表明,所開發(fā)的系統(tǒng)瞬態(tài)識別模型能夠有效識別MSRE系統(tǒng)瞬態(tài)工況,具有較大潛力和價值,可以進一步推廣至其他熔鹽堆系統(tǒng),提高熔鹽堆系統(tǒng)的運行安全性,并為熔鹽堆的智能運維提供有力支持。
作者貢獻聲明周天澤負(fù)責(zé)進行熔鹽堆系統(tǒng)瞬態(tài)識別模型的開發(fā)、分析及文章撰寫;虞凱程負(fù)責(zé)對文章的知識性內(nèi)容作批評性審閱及文章修訂;程懋松負(fù)責(zé)提出研究思路,文章審閱與修訂;戴志敏負(fù)責(zé)研究方案指導(dǎo)、研究進度監(jiān)督和研究項目管理。