国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Gradient Boosting算法的ERMS輻射數(shù)據(jù)預(yù)測(cè)①

2019-11-15 07:05:46朱武峰王廷銀林明貴蘇偉達(dá)李汪彪吳允平
關(guān)鍵詞:劑量率監(jiān)測(cè)站站點(diǎn)

朱武峰,王廷銀,林明貴,蘇偉達(dá),李汪彪,吳允平,3,4

1(福建師范大學(xué) 光電與信息工程學(xué)院,福州 350007)

2(福建省輻射環(huán)境監(jiān)督站,福州 350013)

3(數(shù)字福建環(huán)境監(jiān)測(cè)物聯(lián)網(wǎng)實(shí)驗(yàn)室,福州 350117)

4(福建省光電傳感應(yīng)用工程技術(shù)研究中心,福州 350000)

引言

核能發(fā)電不僅經(jīng)濟(jì)高效、排放無(wú)污染,而且原料來(lái)源廣泛,是當(dāng)今社會(huì)重要的電力能源之一[1],通常,核電站會(huì)圍繞自身建立輻射監(jiān)測(cè)系統(tǒng)(Radiation Monitoring System,RMS),以保障運(yùn)行安全[2];其中,環(huán)境輻射監(jiān)測(cè)系統(tǒng)(ERMS)是RMS 的一個(gè)重要組成部分;所謂ERMS,是為了保證核電站外圍環(huán)境安全,在核電站四周若干公里范圍內(nèi)設(shè)置若干個(gè)監(jiān)測(cè)站點(diǎn),每個(gè)監(jiān)測(cè)站點(diǎn)都會(huì)配備監(jiān)測(cè)儀器和通信裝置,以便通過(guò)網(wǎng)絡(luò)把數(shù)據(jù)傳到計(jì)算機(jī).其系統(tǒng)數(shù)據(jù)采集框架如圖1所示,監(jiān)測(cè)站采集設(shè)備主要分為輻射數(shù)據(jù)采集設(shè)備(如NaI 能譜探測(cè)儀和高壓電離室)和氣象數(shù)據(jù)采集設(shè)備(如雨量計(jì)、溫度傳感器、風(fēng)速傳感器等),采集的數(shù)據(jù)種類(lèi)主要有HPIC劑量率、雨量、氣溫、濕度及風(fēng)速風(fēng)向等;其中,HPIC劑量率是指示輻射監(jiān)測(cè)站點(diǎn)實(shí)時(shí)γ輻射空氣吸收劑量率的重要指標(biāo).

圖1 ERMS 系統(tǒng)數(shù)據(jù)采集系統(tǒng)框架圖

這些數(shù)據(jù)蘊(yùn)含著核電站運(yùn)行安全性的重要價(jià)值指示信息,一直以來(lái)都是各國(guó)保障核電安全的研究熱點(diǎn),具有重大的研究意義.

國(guó)外,2015年,Chen 等人[3]針對(duì)γ輻射劑量率的仿真模擬問(wèn)題,以蒙特卡羅方法為基礎(chǔ)提出一種可用于進(jìn)行曝光劑量估計(jì)的光譜測(cè)定G(E)函數(shù)方法,用于進(jìn)行γ劑量率的仿真模擬,獲得的仿真值與電離室測(cè)量的γ劑量率實(shí)際值之間最大偏差僅6.31%,對(duì)確保γ劑量率的可靠性具有很大應(yīng)用價(jià)值.2017年,印尼國(guó)家核安全局的Susila 等人[4]則對(duì)塞彭核設(shè)施周?chē)?年的序列輻射數(shù)據(jù)應(yīng)用關(guān)聯(lián)分析方法進(jìn)行分析,發(fā)現(xiàn)γ輻射劑量率的數(shù)值與空氣中碘和氬的放射性同位素含量具有較強(qiáng)的正相關(guān)關(guān)系;同年,Bossew 等人[5]指出空氣中的天然放射性元素氡與γ輻射劑量率也有較強(qiáng)關(guān)系,采用統(tǒng)計(jì)關(guān)聯(lián)方法對(duì)歐洲地區(qū)兩者之間進(jìn)行相關(guān)性研究,得出大部分地區(qū)氡對(duì)γ輻射劑量率的監(jiān)測(cè)結(jié)果的貢獻(xiàn)值低于5 nSv/h,部分地區(qū)則達(dá)到30 nSv/h,這對(duì)加強(qiáng)核輻射環(huán)境監(jiān)測(cè)的預(yù)警能力具有很好的參考意義.

國(guó)內(nèi),2015年,朱耀明、林明貴等人[6]提出要加強(qiáng)ERMS 數(shù)據(jù)應(yīng)用能力和人員配置管理問(wèn)題,指出對(duì)ERMS 管理維護(hù)上要安排專(zhuān)業(yè)工作人員,以便可以立時(shí)應(yīng)對(duì)不同緊急情況,如當(dāng)出現(xiàn)輻射數(shù)據(jù)異?;蚨鄠€(gè)站點(diǎn)γ輻射劑量率數(shù)值超高,觸發(fā)閾值報(bào)警時(shí),確保工作人員可以及時(shí)收到預(yù)警信息并迅速進(jìn)行處理,查找問(wèn)題根源以尋求解決.2017年,高澤泉等人[7]則應(yīng)用線性統(tǒng)計(jì)方法對(duì)序列輻射數(shù)據(jù)中降雨與γ輻射劑量率的相關(guān)性進(jìn)行分析發(fā)現(xiàn),降雨天氣時(shí),降雨會(huì)導(dǎo)致γ輻射劑量率的升高,造成γ輻射劑量率的實(shí)時(shí)數(shù)值的不準(zhǔn)確性,這對(duì)我們?cè)谌粘1O(jiān)測(cè)中進(jìn)行γ輻射劑量率數(shù)值的判斷是一個(gè)很好的參考指標(biāo).2018年,羅敦?zé)畹热薣8]也基于線性統(tǒng)計(jì)方法、關(guān)聯(lián)分析及可視化技術(shù)對(duì)日常監(jiān)測(cè)中γ輻射劑量率的特征影響因子進(jìn)行了更全面的挖掘分析,總結(jié)了眾多與γ輻射劑量率數(shù)據(jù)相關(guān)的特征影響因子,如宇宙射線、自然放射性物質(zhì)、溫濕度、風(fēng)向及氣壓等氣象因素,這對(duì)建立和完善γ輻射劑量率數(shù)值可靠性評(píng)價(jià)指標(biāo)具有很大意義.

總的來(lái)說(shuō),在ERMS日常監(jiān)測(cè)過(guò)程中,γ輻射監(jiān)測(cè)數(shù)值的影響因素較多,如上述的源相關(guān)的放射性物質(zhì)、降雨、溫濕度、風(fēng)向及氣壓等自然因素,還有設(shè)備老化故障等都會(huì)導(dǎo)致γ輻射監(jiān)測(cè)數(shù)據(jù)的不準(zhǔn)確性.近年,我國(guó)物聯(lián)網(wǎng)技術(shù)愈發(fā)成熟,數(shù)據(jù)資源獲取能力逐步增強(qiáng),圍繞ERMS 的設(shè)備可靠性、數(shù)據(jù)可信度以及源相關(guān)性等方面取了一些進(jìn)展,但ERMS 輻射數(shù)據(jù)分析卻仍以實(shí)時(shí)數(shù)據(jù)判定、事后報(bào)警為主;圍繞γ劑量率監(jiān)測(cè)也進(jìn)行相關(guān)影響因子的定性分析,提供了對(duì)實(shí)時(shí)γ劑量率監(jiān)測(cè)準(zhǔn)確性的輔助判斷依據(jù),但是在一定程度上對(duì)各影響因子融合進(jìn)行數(shù)據(jù)價(jià)值挖掘未作出過(guò)多研究,如在自然因子影響下,如何有效識(shí)別和降低自然因素干擾,提高對(duì)HPIC 劑量率的可靠性評(píng)估能力.而當(dāng)今數(shù)據(jù)挖掘在醫(yī)療衛(wèi)生[9]、網(wǎng)絡(luò)安全[10]、企業(yè)管理[11]、城市交通[12]及工業(yè)生產(chǎn)[13]等諸多領(lǐng)域都取得了顯著的應(yīng)用成果,為我們提升智能化監(jiān)管效率和實(shí)現(xiàn)新的監(jiān)管技術(shù)創(chuàng)新指出了新思路.其中以GB 回歸為代表的人工智能算法,在解決回歸問(wèn)題上發(fā)揮了巨大的優(yōu)勢(shì).2013年,山東大學(xué)陳爽爽等[14]人應(yīng)用GB 算法對(duì)癲癇及復(fù)發(fā)概率數(shù)據(jù)進(jìn)行建模,取得很好的檢測(cè)效果,達(dá)到了初步臨床實(shí)驗(yàn)的標(biāo)準(zhǔn);2015年,瑞典艾滋病研究團(tuán)隊(duì)為預(yù)測(cè)戒煙成功率和艾滋病復(fù)發(fā)率,采用GB 算法模型進(jìn)行回歸分析,取得很好的效果,具有很強(qiáng)的實(shí)用性[15];而縱觀我們的輻射監(jiān)測(cè)數(shù)據(jù)、太陽(yáng)活動(dòng)數(shù)據(jù)及氣象數(shù)據(jù),整體為時(shí)間序列的離散值,以HPIC 劑量率值作為γ劑量率監(jiān)測(cè)的重要指標(biāo),特征數(shù)據(jù)有類(lèi)別特征(如風(fēng)向)、離散值(如雨量、各監(jiān)測(cè)站點(diǎn)HPIC 劑量率歷史數(shù)據(jù)、溫濕度及天頂方向電子量VETC 等),其總體數(shù)據(jù)特征完全符合GB 算法模型,而且對(duì)模型誤差,我們不排除其他因素干擾,充分考慮作為回歸模型輸入特征,可以一定程度排除未知因素干擾.GB 算法對(duì)幫助我們解決ERMS 中HPIC 劑量率在線預(yù)測(cè)的問(wèn)題是一個(gè)較佳選擇.

1 GB 算法理論

GB 算法[16]是一種機(jī)器學(xué)習(xí)方法,其算法的核心思想在于:將損失函數(shù)看作模型的“靠譜程度”,當(dāng)損失函數(shù)數(shù)值較大時(shí),說(shuō)明模型的可信度較低,預(yù)測(cè)結(jié)果的準(zhǔn)確率較差.因此,我們通常會(huì)根據(jù)起始的損失函數(shù),進(jìn)行損失函數(shù)的優(yōu)化工作,通常做法是根據(jù)梯度下降法來(lái)實(shí)現(xiàn)損失函數(shù)在梯度方向上的不斷迭代減小直至收斂,此時(shí)模型最優(yōu),殘差也達(dá)到最小值,殘差通常認(rèn)為就是目標(biāo)實(shí)際值與模型預(yù)測(cè)值的誤差.基于GB 算法進(jìn)行回歸預(yù)測(cè)大致流程如圖2所示,首先基于訓(xùn)練集建立一個(gè)基模型,然后將這個(gè)模型的殘差作為下一個(gè)模型的優(yōu)化學(xué)習(xí)目標(biāo)輸入,得到新的基模型,不斷重復(fù)此迭代過(guò)程,直到模型的殘差達(dá)到理想數(shù)值范圍內(nèi).

圖2 Gradient Boosting 回歸模型預(yù)測(cè)流程圖

算法基本形式可表示如下:

算法的輸入數(shù)據(jù)集是一組屬性值x={x1,x2,···,xm)及 實(shí)際值y={y1,y2,···,ym},設(shè)定與之間具有某種回歸關(guān)系:

設(shè)定損失函數(shù)為L(zhǎng)(y,f(x)),基函數(shù)是{a(x;γ)}.首先,設(shè)定初始化預(yù)測(cè)函數(shù)為:

其次,設(shè)置算法最大迭代次數(shù)N,在設(shè)定的迭代次數(shù)基礎(chǔ)上:

(1) 極小化算法的損失函數(shù),使用如下方式求得使損失函數(shù)最小化的最佳參數(shù)bn,γn:

(2) 迭代更新預(yù)測(cè)函數(shù),在舊的弱學(xué)習(xí)器基礎(chǔ)上不斷學(xué)習(xí)新的弱學(xué)習(xí)器(決策樹(shù)) 模型fn(x)來(lái)優(yōu)化模型損失函數(shù),如下式:

(3) 累加預(yù)測(cè)函數(shù),求得最終強(qiáng)學(xué)習(xí)器預(yù)測(cè)函數(shù)公式如下:

GB 算法是一種集成學(xué)習(xí)算法.該算法基于多個(gè)弱學(xué)習(xí)器組成強(qiáng)學(xué)習(xí)器的思想,可以很好地克服算法建模中存在的諸如過(guò)擬合問(wèn)題等,在解決分類(lèi)回歸問(wèn)題上具有很好的適用性.

2 GB 算法在輻射監(jiān)測(cè)數(shù)據(jù)挖掘的應(yīng)用

2.1 環(huán)境輻射監(jiān)測(cè)系統(tǒng)概況

如圖3所示為福建省某S 核電站ERMS 輻射監(jiān)測(cè)站點(diǎn)空間分布圖,以此核電站為中心,在周?chē)O(shè)置了11 個(gè)監(jiān)測(cè)子站;從圖3中可以看出,S1-S11號(hào)自動(dòng)站圍繞核電站整體呈現(xiàn)放射狀分布,保證充分檢測(cè)四周環(huán)境放射性核素劑量,同時(shí)實(shí)施多點(diǎn)連續(xù)監(jiān)測(cè),在一定程度上可以更好地防止突發(fā)情況發(fā)生,提高安全效率,這樣就形成了區(qū)域核輻射外圍網(wǎng)絡(luò)分布.

圖3 某核電站ERMS 輻射監(jiān)測(cè)站空間分布圖

2.2 數(shù)據(jù)來(lái)源

數(shù)據(jù)資料主要分3 部分:(1)輻射監(jiān)測(cè)子站環(huán)境日常監(jiān)測(cè)數(shù)據(jù)可以從某核電站輻射監(jiān)測(cè)中心平臺(tái)數(shù)據(jù)庫(kù)直接導(dǎo)出2015-2017年文本格式歷史輻射監(jiān)測(cè)數(shù)據(jù);(2)所需太陽(yáng)日?;顒?dòng)歷史數(shù)據(jù)從空間環(huán)境預(yù)報(bào)中心直接獲取,以對(duì)方提供的2015-2017年文本格式天頂方向電子量VTEC 數(shù)據(jù)為主;(3)氣象數(shù)據(jù)指標(biāo)可從氣象局網(wǎng)站通過(guò)網(wǎng)頁(yè)記錄獲取,相關(guān)數(shù)據(jù)指標(biāo)如表1.

表1 數(shù)據(jù)來(lái)源

2.3 實(shí)驗(yàn)方案

2.3.1 實(shí)驗(yàn)環(huán)境

硬件方面,本實(shí)驗(yàn)運(yùn)用8 核、16 GB 內(nèi)存PC 機(jī)進(jìn)行.

軟件方面,在Windows10 系統(tǒng)環(huán)境下配置JDK1.8、Anaconda3.4 及MySql 等,以Mysql 作為文件存儲(chǔ)數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)存儲(chǔ),以Anaconda3.4 自帶軟件Spyder作為實(shí)驗(yàn)編程平臺(tái),以Python 作為程序編程語(yǔ)言,借助Python 第三方科學(xué)計(jì)算相關(guān)類(lèi)庫(kù)(如numpy、pandas、matplotlib 及sklearn 等)進(jìn)行整體數(shù)據(jù)挖掘分析工作;具體實(shí)驗(yàn)環(huán)境配置如表2所示.

2.3.2 模型設(shè)計(jì)方案

如圖4所示為本實(shí)驗(yàn)?zāi)P蜆?gòu)建整體實(shí)驗(yàn)過(guò)程方案,主要包括數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)預(yù)處理、數(shù)據(jù)抽取、數(shù)據(jù)建模及模型應(yīng)用五部分.首先,實(shí)驗(yàn)數(shù)據(jù)主要為3.2 中闡述的歷史離線數(shù)據(jù)集,數(shù)據(jù)特征為時(shí)間序列的離散型數(shù)據(jù),所以采用MySQL 數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)持久存儲(chǔ);其次,數(shù)據(jù)存在來(lái)源不一,有如風(fēng)向等類(lèi)別特征,各屬性特征之間量綱也存在不統(tǒng)一,數(shù)據(jù)缺失等問(wèn)題,因此為獲得較好質(zhì)量的建模數(shù)據(jù),必須進(jìn)行一定的數(shù)據(jù)集成、清洗、規(guī)整及變換等預(yù)處理等工作;然后,對(duì)處理后的建模數(shù)據(jù)按一定比例進(jìn)行拆分以獲得訓(xùn)練集和測(cè)試集兩部分;接著,使用訓(xùn)練數(shù)據(jù)對(duì)GB 模型進(jìn)行訓(xùn)練工作,同時(shí)結(jié)合交叉驗(yàn)證法和網(wǎng)格搜索法進(jìn)行模型的評(píng)估優(yōu)化工作,以獲得最優(yōu)的模型;最后,將構(gòu)建好的HPIC 劑量率預(yù)測(cè)模型在測(cè)試集上進(jìn)行測(cè)試,測(cè)試模型的預(yù)測(cè)效果.

圖4 HPIC 劑量率在線預(yù)測(cè)流程方案

2.4 相關(guān)特征分析

我們以S1輻射監(jiān)測(cè)站為目標(biāo)研究對(duì)象.如圖5所示是采用可視化技術(shù)展現(xiàn)出的某降雨時(shí)段前后,其HPIC 劑量率監(jiān)測(cè)數(shù)據(jù)數(shù)值隨時(shí)間的變化信息圖;從圖中可以看出HPIC 劑量率在降雨時(shí)段會(huì)有明顯的上升,隨著降雨停后,其數(shù)值又緩慢降低回至正常水平.

圖5 降雨時(shí)段HPIC 波動(dòng)圖

根據(jù)該核電站區(qū)域核輻射各站點(diǎn)2015-2017年三年輻射序列數(shù)據(jù)進(jìn)行異常值處理及數(shù)據(jù)標(biāo)準(zhǔn)化后,對(duì)其溫濕度、氣壓與HPIC 劑量率進(jìn)行皮爾遜相關(guān)系數(shù)分析,分析結(jié)果如表3所示:溫度整體與HPIC 劑量率數(shù)值之間的相關(guān)性較弱,但是在S7站點(diǎn)相關(guān)性較強(qiáng);各輻射監(jiān)測(cè)站點(diǎn)濕度與HPIC 劑量率之間存在很強(qiáng)的正相關(guān);對(duì)氣壓相關(guān)性來(lái)說(shuō),除了S2、S10與S113 個(gè)站點(diǎn)與HPIC 劑量率相關(guān)性較弱,整體上與HPIC 劑量率數(shù)值之間存在著很強(qiáng)的負(fù)相關(guān)關(guān)系.

表3 溫度、濕度及氣壓與HPIC 劑量率皮爾遜相關(guān)系數(shù)表

進(jìn)一步具體分析S1站點(diǎn)溫度與HPIC 劑量率之間存在的相關(guān)關(guān)系,將溫度等寬分為3 個(gè)區(qū)間:偏低溫、偏中溫及偏高溫,如圖6所示,對(duì)每個(gè)區(qū)間HPIC 劑量率標(biāo)準(zhǔn)化后數(shù)據(jù)采用箱線圖統(tǒng)計(jì)分析可以得知,HPIC 劑量率在偏高溫時(shí)集中偏大,低溫時(shí)偏小,兩者整體特點(diǎn)表現(xiàn)為溫度越高,HPIC 劑量率越高;因此我們可以認(rèn)為溫度也是HPIC 劑量率的特征影響因子之一,兩者之間存在著正相關(guān)關(guān)系.

圖6 2015年度S1 點(diǎn)HPIC 劑量率在溫度區(qū)間數(shù)據(jù)分布箱線圖

如圖7所示,先通過(guò)標(biāo)準(zhǔn)化方法消除量綱問(wèn)題,采用線性分析方法對(duì)VTEC 與HPIC 劑量率數(shù)值進(jìn)行相關(guān)性分析得出,在VTEC 電子含量與HPIC 劑量率呈現(xiàn)明顯的同升同降變化規(guī)律,采用皮爾遜算法計(jì)算得出兩者相關(guān)系數(shù)值r高達(dá)0.669,具有顯著的相關(guān)性.

如圖8所示,以箱線圖方法統(tǒng)計(jì)出8 個(gè)不同風(fēng)向時(shí)HPIC 劑量率數(shù)據(jù)信息,可以看出,HPIC 劑量率數(shù)據(jù)在不同風(fēng)向上,其數(shù)據(jù)集中程度有稍許差異,從中位數(shù)可以看出,在風(fēng)向偏南風(fēng)及西南風(fēng)時(shí),其HPIC 劑量率數(shù)值中位數(shù)明顯較大,且數(shù)據(jù)整體數(shù)值較偏北風(fēng)及東北風(fēng)時(shí)明顯偏大;在風(fēng)向?yàn)闁|風(fēng)和東北風(fēng)時(shí),其HPIC劑量率數(shù)值中位數(shù)是最低,整體數(shù)值也是集中偏低,不同風(fēng)向上HPIC 劑量率數(shù)值差值約在(0~4) nGy/h 之間.考慮風(fēng)向?yàn)轭?lèi)別特征屬性,所以實(shí)驗(yàn)中采用one-hot對(duì)屬性值進(jìn)行了編碼轉(zhuǎn)換為八維的0 或1 的數(shù)值型.

再如表4,通過(guò)計(jì)算S1目標(biāo)監(jiān)測(cè)站點(diǎn)與其它站點(diǎn)之間HPIC 劑量率皮爾遜系數(shù)得知,除了S5、S10站點(diǎn),S1站點(diǎn)與其余站點(diǎn)具有較強(qiáng)的相關(guān)性;所以亦可以將其他監(jiān)測(cè)站點(diǎn)監(jiān)測(cè)數(shù)據(jù)作為當(dāng)前監(jiān)測(cè)數(shù)據(jù)的特征因子進(jìn)行定性的預(yù)測(cè);我們考慮相關(guān)性較強(qiáng)的幾個(gè)站點(diǎn),將與目標(biāo)站點(diǎn)之間皮爾遜系數(shù)在0.35 以上的6 個(gè)站點(diǎn)作為模型特征參數(shù)輸入,進(jìn)行模型構(gòu)建.

同時(shí),考慮目標(biāo)屬性HPIC 劑量率的時(shí)間序列離散特征,其自身在時(shí)間前后也是有著較強(qiáng)的關(guān)聯(lián)性;所以為實(shí)現(xiàn)模型對(duì)當(dāng)前時(shí)HPIC 劑量率目標(biāo)屬性值預(yù)測(cè)能力,本實(shí)驗(yàn)也考慮加入上一時(shí)刻的HPIC 劑量率目標(biāo)屬性值作為特征輸入,以此作為基準(zhǔn).

圖7 VTEC 與劑量率同一時(shí)段波動(dòng)對(duì)比圖

圖8 風(fēng)向與HPIC 劑量率關(guān)系箱線圖

綜合看來(lái),上述降雨、溫濕度、氣壓、太陽(yáng)輻射的VTEC 及風(fēng)向都與HPIC 劑量率之間有著緊密的強(qiáng)關(guān)聯(lián)性.這些自然因素對(duì)HPIC 劑量率的日常監(jiān)測(cè)會(huì)產(chǎn)生較強(qiáng)的干擾作用,不利于異常情況發(fā)生時(shí),對(duì)異常成因的即時(shí)分析及準(zhǔn)確定位,如當(dāng)監(jiān)測(cè)過(guò)程中發(fā)現(xiàn)某些站點(diǎn)HPIC 劑量率驟然上升時(shí),而此時(shí)區(qū)域內(nèi)同時(shí)伴隨上述不利于異常判斷的自然因素發(fā)生,這時(shí)要及時(shí)得出異常成因就比較困難,可能需要提前進(jìn)行預(yù)警,實(shí)行人工檢測(cè),比較費(fèi)時(shí)耗力.因而,我們?cè)诖嘶A(chǔ)上設(shè)計(jì)如下在線預(yù)測(cè)模型,在一定程度上降低自然因素的綜合干擾,幫助進(jìn)行異常情況的快速檢出工作.

2.5 模型構(gòu)建及驗(yàn)證

2.5.1 模型構(gòu)建

如圖9所示為我們所提出的基于GB 算法的HPIC劑量率在線預(yù)測(cè)模型,輸入采用第二章節(jié)中提出的各種相關(guān)特征屬性參數(shù),如溫度、濕度及風(fēng)向等氣象參數(shù),天頂方向電子總量VTEC,與目標(biāo)站點(diǎn)具有時(shí)空關(guān)聯(lián)性的其它各站點(diǎn)HPIC 劑量率數(shù)值,最后加上自身在時(shí)間前后存在時(shí)間關(guān)聯(lián)性的目標(biāo)站點(diǎn)上一時(shí)刻HPIC劑量率數(shù)值,輸出采用當(dāng)前時(shí)刻目標(biāo)HPIC 劑量率數(shù)值,這樣就形成20 個(gè)維度的特征輸入,1 個(gè)HPIC 劑量率數(shù)值的輸出.經(jīng)過(guò)類(lèi)別特征one-hot 編碼、零-均值標(biāo)準(zhǔn)化、缺失值填補(bǔ)、數(shù)據(jù)去重及異常值處理等數(shù)據(jù)預(yù)處理工作后,獲得了質(zhì)量較好的數(shù)據(jù)樣本,然后將數(shù)據(jù)按照2:8 的比例進(jìn)行測(cè)試集和訓(xùn)練集的劃分,再采用交叉驗(yàn)證方法將訓(xùn)練集等量劃分為10 等份,進(jìn)行10 折交叉驗(yàn)證,同時(shí)結(jié)合GridSearch 網(wǎng)格尋優(yōu)算法進(jìn)行超參空間的構(gòu)建,進(jìn)行模型參數(shù)優(yōu)化和選擇,以此得出最優(yōu)的GB 預(yù)測(cè)模型.

表4 目標(biāo)監(jiān)測(cè)站點(diǎn)與其他監(jiān)測(cè)子站HPIC 監(jiān)測(cè)值顯著相關(guān)系數(shù)表

實(shí)驗(yàn)過(guò)程中,對(duì)于GB 算法模型的性能參數(shù)最主要有兩個(gè):模型中弱學(xué)習(xí)器的數(shù)量以及尋找最佳分割點(diǎn)要考慮的特征數(shù)量;這兩個(gè)性能參數(shù)都是需要我們自己去設(shè)定,弱學(xué)器數(shù)量從10 到140 每隔20 個(gè)進(jìn)行數(shù)量的選取設(shè)定,最佳分割點(diǎn)的特征數(shù)量從16 到最大特征數(shù)量20 個(gè)每隔1 個(gè)進(jìn)行選取設(shè)定,總共取得5 個(gè)特征數(shù)量取值;其模型在每種情況下的決定系數(shù)R-square和平均絕對(duì)誤差MAE 結(jié)果如圖10和圖11所示.

圖10 GB 模型參數(shù)的選取對(duì)評(píng)價(jià)指標(biāo)R-square決定系數(shù)的影響

從圖10和圖11中可以看出,GB 模型的R-square決定系數(shù)值隨弱學(xué)習(xí)器數(shù)量的增加及特征數(shù)量的增加而增大;平均絕對(duì)誤差MAE 則隨弱學(xué)習(xí)器數(shù)量的增加及特征數(shù)量的增加而減??;但是當(dāng)弱學(xué)習(xí)器的數(shù)量達(dá)到120 以上,其性能就開(kāi)始趨于平緩;然而弱學(xué)器數(shù)量和特征數(shù)量越多,整體模型構(gòu)建時(shí)間效率偏低;綜合圖中顯示情況來(lái)說(shuō),設(shè)定弱學(xué)器數(shù)量為120,特征數(shù)量為19 時(shí),模型效果最好.

圖11 GB 模型參數(shù)的選取對(duì)評(píng)價(jià)指標(biāo)平均絕對(duì)誤差MAE 的影響

2.5.2 模型測(cè)試

將訓(xùn)練好的模型對(duì)測(cè)試集進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果可以用線性擬合圖和散點(diǎn)圖直觀展示,如圖12和圖13所示;從圖12中可以看出預(yù)測(cè)曲線與實(shí)際值曲線擬合性較好,計(jì)算得出決定系數(shù)R-Square 約0.91,MAE 約0.635,但是在一些這些極值點(diǎn)處的預(yù)測(cè)效果會(huì)有所偏差.監(jiān)測(cè)站HPIC 劑量率監(jiān)測(cè)儀器高壓電離室測(cè)量閾值誤差一般在±5 nGy 左右,所以這個(gè)預(yù)測(cè)差額幅度在可接受范圍內(nèi);圖13中HPIC 劑量率預(yù)測(cè)值與實(shí)際值基本分布在圖形45°斜對(duì)角附近,所以認(rèn)為模型預(yù)測(cè)精度還是較好的.

圖12 目標(biāo)站點(diǎn)HPIC 劑量率預(yù)測(cè)值與實(shí)際值擬合對(duì)比

圖13 HPIC 預(yù)測(cè)結(jié)果和實(shí)際結(jié)果散點(diǎn)圖

綜上,此模型較好地融合了各種自然特征影響因子,并考慮目標(biāo)站點(diǎn)與自身、各站點(diǎn)在HPIC 劑量率值之間關(guān)聯(lián)性構(gòu)建起來(lái)的HPIC 實(shí)時(shí)預(yù)測(cè)模型,模型實(shí)驗(yàn)結(jié)果較好,若能有效結(jié)合預(yù)測(cè)值與實(shí)際值誤差閾值方法,在一定程度上是可以幫助降低自然因素干擾輻射數(shù)據(jù)異常分析判斷的影響,實(shí)現(xiàn)對(duì)設(shè)備故障、放射性狀況導(dǎo)致的輻射數(shù)據(jù)異常的更準(zhǔn)確的定位;比如,設(shè)置誤差閾值為5 nGy,可以假定當(dāng)預(yù)測(cè)值與實(shí)際值的絕對(duì)誤差低于5 nGy,輻射監(jiān)測(cè)數(shù)據(jù)無(wú)異常情況發(fā)生;當(dāng)預(yù)測(cè)值與實(shí)際值的絕對(duì)誤差高于5 nGy,輻射監(jiān)測(cè)數(shù)據(jù)可能就出現(xiàn)了異常,并即時(shí)向工作人員發(fā)出預(yù)警,立時(shí)進(jìn)行處理.這對(duì)提高ERMS 的異常發(fā)現(xiàn)能力和維保效率具有很大應(yīng)用價(jià)值.

3 結(jié)論

首先,感謝省級(jí)輻射中心、國(guó)家空間環(huán)境預(yù)報(bào)中心提供的數(shù)據(jù)支撐.我們以機(jī)器學(xué)習(xí)算法進(jìn)行數(shù)據(jù)的挖掘工作,基于核電站積累的海量歷史數(shù)據(jù),并引入氣象數(shù)據(jù)及太陽(yáng)活動(dòng)數(shù)據(jù),充分考慮影響輻射監(jiān)測(cè)中HPIC 劑量率數(shù)值的重要特征因子,并結(jié)合與目標(biāo)監(jiān)測(cè)站HPIC 劑量率數(shù)值相關(guān)的上一時(shí)刻HPIC 劑量率及其它相關(guān)站點(diǎn)的HPIC 劑量率數(shù)值作特征輸入,進(jìn)行大量的數(shù)據(jù)規(guī)整工作,以GB 回歸模型建立起HPIC 劑量率數(shù)值在線預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)當(dāng)前時(shí)刻HPIC 劑量率值的精準(zhǔn)預(yù)測(cè).這對(duì)提高核電站對(duì)偏遠(yuǎn)外圍監(jiān)測(cè)站的環(huán)境輻射監(jiān)測(cè)異常檢測(cè)效率、管理水平及ERMS 維保工作效率具有很大的現(xiàn)實(shí)意義和理論價(jià)值.

HPIC 劑量率數(shù)值除了受文中分析的多個(gè)自然因素的影響外,還與空氣中微量元素含量、維保日志、雷電、潮汐等有關(guān),但是囿于資源有限,還未獲取到這些數(shù)據(jù),如果增加這些數(shù)據(jù)進(jìn)行挖掘分析,可能得到更多有用的信息用于HPIC 劑量率的預(yù)測(cè)和異常發(fā)現(xiàn),也是我們下一步將要進(jìn)行的研究工作所在.

猜你喜歡
劑量率監(jiān)測(cè)站站點(diǎn)
甲狀腺乳頭狀癌患者術(shù)后首次131Ⅰ治療后輻射劑量率的影響因素及出院時(shí)間的探討
基于Web站點(diǎn)的SQL注入分析與防范
電子制作(2019年14期)2019-08-20 05:43:42
北京市監(jiān)測(cè)站布局差異分析
對(duì)輻射環(huán)境空氣自動(dòng)監(jiān)測(cè)站系統(tǒng)開(kāi)展數(shù)據(jù)化運(yùn)維的探討
2017~2018年冬季西北地區(qū)某站點(diǎn)流感流行特征分析
首屆歐洲自行車(chē)共享站點(diǎn)協(xié)商會(huì)召開(kāi)
怕被人認(rèn)出
與酷暑?yuàn)^戰(zhàn)的環(huán)保英雄——宜興市環(huán)境監(jiān)測(cè)站現(xiàn)場(chǎng)采樣組的一天
X線照射劑量率對(duì)A549肺癌細(xì)胞周期的影響
ITER極向場(chǎng)線圈PF4維修區(qū)域停堆劑量率分析
财经| 东兴市| 商南县| 新竹市| 皋兰县| 静安区| 江津市| 白山市| 乐至县| 固始县| 龙陵县| 涿州市| 徐汇区| 台山市| 堆龙德庆县| 嘉鱼县| 临城县| 怀安县| 朔州市| 辽阳县| 云和县| 彰武县| 曲阳县| 道真| 新津县| 长汀县| 军事| 田林县| 高邮市| 特克斯县| 临潭县| 金山区| 堆龙德庆县| 徐闻县| 新晃| 南靖县| 偃师市| 安陆市| 青州市| 齐河县| 五台县|