国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

兩級(jí)回歸的流式大數(shù)據(jù)事件自適應(yīng)預(yù)警方法

2021-04-12 05:18:00趙林鎖馬瑞強(qiáng)宋寶燕潘一山

趙林鎖,馬瑞強(qiáng),姜 天,宋寶燕,潘一山,

1.遼寧工程技術(shù)大學(xué) 力學(xué)與工程學(xué)院,遼寧 阜新 123000

2.遼寧大學(xué) 信息學(xué)院,沈陽(yáng) 110036

近年來(lái),流式數(shù)據(jù)監(jiān)測(cè)應(yīng)用越來(lái)越廣泛,如災(zāi)害監(jiān)測(cè)、云數(shù)據(jù)流[1]以及感知網(wǎng)絡(luò)[2-3]等。在這些應(yīng)用中,數(shù)據(jù)多為無(wú)限的(源源不斷產(chǎn)生)、瞬時(shí)的(數(shù)據(jù)一經(jīng)流過(guò),不再重現(xiàn))、巨量的(每秒近萬(wàn)條流數(shù)據(jù))流式數(shù)據(jù)[4-6]。如何對(duì)隱含在流式數(shù)據(jù)中的災(zāi)害事件進(jìn)行實(shí)時(shí)預(yù)警,是研究流式數(shù)據(jù)中各類(lèi)事件判識(shí)及分析的目標(biāo)。受采集器采集披綠、部署外部環(huán)境等因素影響,流式數(shù)據(jù)具有海量性、漂移性[7-8]、隨機(jī)性的特點(diǎn),導(dǎo)致流式數(shù)據(jù)事件實(shí)時(shí)判識(shí)需要得到完整的事件信息,不能直接通過(guò)時(shí)間序列[9]實(shí)時(shí)比對(duì)方式進(jìn)行,預(yù)警具有滯后性,而典型閾值跳變判識(shí)方法也由于流式數(shù)據(jù)事件漂移特征的影響,預(yù)警準(zhǔn)確度很低。因此,如何對(duì)流式數(shù)據(jù)中的事件進(jìn)行實(shí)時(shí)準(zhǔn)確的預(yù)警,一直是領(lǐng)域的研究難點(diǎn)。

例如,在現(xiàn)有礦山災(zāi)害事件監(jiān)測(cè)預(yù)警系統(tǒng)中,實(shí)時(shí)感知數(shù)據(jù)的監(jiān)測(cè)和存儲(chǔ)工作均是利用在礦山周?chē)渴鸬奈⒄饌鞲衅鬟M(jìn)行的。礦山災(zāi)害事件持續(xù)的時(shí)間很短,通常只有幾秒到幾十秒,因此,對(duì)事件預(yù)警實(shí)時(shí)性要求極高,且由于微震感知數(shù)據(jù)在傳播過(guò)程中受到巖體性質(zhì)及結(jié)構(gòu)面等影響,攜帶了信號(hào)源和傳播途徑中巖體的信息,故相同種類(lèi)災(zāi)害事件的波形結(jié)構(gòu)在一定程度上會(huì)出現(xiàn)傳播減緩或加劇等數(shù)據(jù)漂移現(xiàn)象,導(dǎo)致災(zāi)害事件波形發(fā)生拉伸或壓縮,無(wú)法直接進(jìn)行災(zāi)害事件實(shí)時(shí)判識(shí),因此,現(xiàn)有災(zāi)害事件監(jiān)測(cè)預(yù)警系統(tǒng)均為滯后預(yù)警,且預(yù)警準(zhǔn)確性很低。

針對(duì)這些問(wèn)題,本文提出一種兩級(jí)回歸的流式大數(shù)據(jù)事件自適應(yīng)預(yù)警方法(ATRIM),構(gòu)建災(zāi)害事件預(yù)警模型,通過(guò)預(yù)估流式數(shù)據(jù)事件的發(fā)展趨勢(shì)實(shí)現(xiàn)災(zāi)害事件的實(shí)時(shí)分階判識(shí),主要貢獻(xiàn)如下:

(1)針對(duì)海量歷史同類(lèi)事件數(shù)據(jù)規(guī)模過(guò)大,無(wú)法建立模型的問(wèn)題,提出一級(jí)移動(dòng)回歸的數(shù)據(jù)特征提取方法,通過(guò)可變網(wǎng)格將數(shù)據(jù)進(jìn)行分塊,引入支持域權(quán)函數(shù)概念,在網(wǎng)格內(nèi)進(jìn)行基于支持域的特征點(diǎn)選取。

(2)在此基礎(chǔ)上,針對(duì)事件的漂移特征,進(jìn)行規(guī)格化處理,并基于提取的特征點(diǎn)數(shù)據(jù),擬合二級(jí)線性回歸事件預(yù)警模型,并對(duì)時(shí)間模型的回歸方程進(jìn)行最小二乘誤差分析[10],建立事件置信域,進(jìn)而構(gòu)成完整的事件預(yù)警模型。

(3)針對(duì)流式數(shù)據(jù)事件的隨機(jī)性及滯后預(yù)警的問(wèn)題,基于預(yù)警模型提出判識(shí)因子概念,通過(guò)判識(shí)因子變換對(duì)事件未來(lái)變化趨勢(shì)進(jìn)行預(yù)估計(jì),根據(jù)實(shí)時(shí)感知數(shù)據(jù)與預(yù)警模型的匹配程度進(jìn)行自適應(yīng)階段觸發(fā)判識(shí),實(shí)現(xiàn)事件的實(shí)時(shí)預(yù)警。

1 相關(guān)工作

目前,許多學(xué)者對(duì)流式數(shù)據(jù)事件實(shí)時(shí)判識(shí)方法進(jìn)行了深入研究,取得了一定的研究成果。文獻(xiàn)[11]提出一種基于周期的時(shí)間序列預(yù)測(cè)(PTSP)方法,根據(jù)所有先前的周期模型預(yù)測(cè)后續(xù)周期中的數(shù)據(jù),引入時(shí)間衰減因子以控制不同周期對(duì)預(yù)測(cè)結(jié)果的影響,可以對(duì)有效地從大量時(shí)間序列數(shù)據(jù)中識(shí)別潛在的周期性模式并提供準(zhǔn)確的預(yù)測(cè),但該方法預(yù)測(cè)周期過(guò)長(zhǎng),實(shí)時(shí)預(yù)警能力低;文獻(xiàn)[12]提出了一種新穎的深度神經(jīng)網(wǎng)絡(luò)架構(gòu),將傳感器數(shù)據(jù)的時(shí)間序列編碼為圖像(即,將一個(gè)時(shí)間序列編碼為兩通道圖像),并利用這些變換后的圖像來(lái)保留識(shí)別的必要特征,但該方法提出的模型訓(xùn)練過(guò)程耗時(shí)過(guò)長(zhǎng),實(shí)時(shí)性差;文獻(xiàn)[13]提出建立礦山災(zāi)害事件發(fā)生步距的模擬和預(yù)測(cè)模型GM(1,1),模型可信度、關(guān)聯(lián)度及擬合度均較高,但該方法只適合小規(guī)模數(shù)據(jù),不能用于長(zhǎng)時(shí)間的流式數(shù)據(jù)事件趨勢(shì)值預(yù)測(cè),預(yù)警準(zhǔn)確度較差;文獻(xiàn)[14]提出一種完善彈塑脆性的突變模型,通過(guò)集成多指標(biāo)的方法,提高沖擊動(dòng)力災(zāi)害事件的監(jiān)測(cè)預(yù)警效果,但該方法多指標(biāo)集成計(jì)算的開(kāi)銷(xiāo)過(guò)大,算法實(shí)時(shí)性較低;文獻(xiàn)[15]提出一種采用Arima 時(shí)間序列模型的流式數(shù)據(jù)事件預(yù)警方法,通過(guò)建立季節(jié)模型和門(mén)限自回歸模型,分別對(duì)未來(lái)災(zāi)害事件釋放的能量進(jìn)行估計(jì),并構(gòu)建相應(yīng)的時(shí)間序列獲取流式數(shù)據(jù)隨時(shí)間推移變化的趨勢(shì),但該方法模型建立復(fù)雜,且在長(zhǎng)時(shí)間判識(shí)過(guò)程中準(zhǔn)確性會(huì)出現(xiàn)明顯降低;文獻(xiàn)[16]提出一種窗口分級(jí)預(yù)警方法,可以對(duì)流式數(shù)據(jù)事件進(jìn)行實(shí)時(shí)預(yù)警,但該方法窗口大小設(shè)置對(duì)預(yù)警準(zhǔn)確性影響很大,且窗口滑動(dòng)可能造成事件丟失問(wèn)題,預(yù)警具有局限性。

綜上,本文針對(duì)現(xiàn)有流式數(shù)據(jù)事件預(yù)警方法的不足,綜合考慮事件的漂移特征、預(yù)警的準(zhǔn)確性及效率,提出一種基于兩級(jí)回歸的流式大數(shù)據(jù)事件自適應(yīng)預(yù)警方法。

2 兩級(jí)回歸的事件預(yù)警模型構(gòu)建

流式數(shù)據(jù)事件是在時(shí)間域上滿(mǎn)足一定條件的一系列離散數(shù)據(jù)點(diǎn)組成的時(shí)間序列,且相同類(lèi)型的事件通常都具有相同或相似的特征規(guī)律。

定義1(流式數(shù)據(jù)事件)由流式數(shù)據(jù)中超過(guò)限制條件的第一個(gè)異常點(diǎn)發(fā)起并持續(xù)一段時(shí)間的連續(xù)異常數(shù)據(jù)的集合:E={(e1,e2,e3,…,en)|?i ∈(1,2,3,…,n,|ei|>φ} 。其中,ei為事件中的某個(gè)異常數(shù)據(jù)點(diǎn),φ 為限制條件。

通過(guò)兩級(jí)回歸法對(duì)海量歷史事件進(jìn)行自適應(yīng)特征提取,并構(gòu)建可以完整描述該類(lèi)型事件的預(yù)警模型,進(jìn)而實(shí)現(xiàn)流式數(shù)據(jù)事件的形式化表示。

2.1 一級(jí)移動(dòng)回歸擬合特征點(diǎn)

流式數(shù)據(jù)應(yīng)用中,同類(lèi)災(zāi)害事件通常具有相同的特征規(guī)律,但由于事件發(fā)生的位置及強(qiáng)度都不相同,故感知到的災(zāi)害事件數(shù)據(jù)均不在同一尺度下,因此,通過(guò)坐標(biāo)變換,將所有數(shù)據(jù)規(guī)格化為[0,1]區(qū)間范圍。如圖1為事件規(guī)格化示意圖。

圖1 事件規(guī)格化示意圖

如圖1 所示,通過(guò)規(guī)格化處理,歷史事件數(shù)據(jù)會(huì)規(guī)整到同一區(qū)間范圍內(nèi)(通常為0~1 區(qū)間內(nèi))。但由于歷史災(zāi)害事件的數(shù)據(jù)規(guī)模巨大,同一個(gè)坐標(biāo)位置(x,y)可能出現(xiàn)一對(duì)多的映射關(guān)系,無(wú)法直接構(gòu)建預(yù)警模型,因此,需要在海量同類(lèi)事件中進(jìn)行數(shù)據(jù)特征提取,實(shí)現(xiàn)(x,y)的一一映射關(guān)系。

數(shù)據(jù)規(guī)格化處理之后,為了提取出具有代表性的數(shù)據(jù)特征點(diǎn),首先引入網(wǎng)格法把海量歷史事件數(shù)據(jù)劃分為各個(gè)局部區(qū)域,每個(gè)區(qū)域包含若干個(gè)感知數(shù)據(jù)點(diǎn),然后對(duì)每個(gè)局部區(qū)域進(jìn)行事件數(shù)據(jù)特征提取,確保提取出的特征點(diǎn)能代表本區(qū)域的數(shù)據(jù)特征。

圖2 網(wǎng)格劃分示意圖

其次,通過(guò)劃分網(wǎng)格進(jìn)行基準(zhǔn)點(diǎn)的選取,并以基準(zhǔn)點(diǎn)來(lái)劃分支持域,進(jìn)而得到支持域半徑范圍內(nèi)包含的全部數(shù)據(jù)節(jié)點(diǎn),并且設(shè)基準(zhǔn)點(diǎn)與參考點(diǎn)的歐式距離作為支持域函數(shù)的輸入?yún)?shù)。由定義1可得,由于流式數(shù)據(jù)中的事件均包含時(shí)間屬性,因此,設(shè)網(wǎng)格坐標(biāo)系中x軸數(shù)據(jù)為時(shí)間,y軸數(shù)據(jù)為其本身的感知屬性?;诹魇綌?shù)據(jù)事件特征規(guī)律的緊支性,建立支持域。支持域?yàn)橐粋€(gè)滿(mǎn)足緊支性的權(quán)函數(shù),即在某一個(gè)特征點(diǎn)周?chē)囊粋€(gè)有限區(qū)域中,支持域函數(shù)的值大于0,而非有限區(qū)域內(nèi)的支持域函數(shù)的值為0,則該有限區(qū)域稱(chēng)為支持域。同時(shí),影響區(qū)域中各節(jié)點(diǎn)對(duì)x的取值影響均不同,由此可得,需要通過(guò)滿(mǎn)足緊支性的權(quán)函數(shù)判定其影響程度,計(jì)算各節(jié)點(diǎn)對(duì)xi的影響。

因此,在網(wǎng)格劃分后,對(duì)每個(gè)網(wǎng)格進(jìn)行迭代計(jì)算,選取支持域的半徑為,確定點(diǎn)x的影響范圍后,計(jì)算包含在x的影響區(qū)域內(nèi)的感知數(shù)據(jù),由于局部事件區(qū)域內(nèi)任意一數(shù)據(jù)點(diǎn)常為多個(gè)數(shù)據(jù)點(diǎn)支持域的交集部分,故求解特征點(diǎn)時(shí),需要考慮周?chē)惺录?shù)據(jù)點(diǎn)的影響。如圖3 為特征點(diǎn)影響區(qū)域示意圖。

圖3 影響區(qū)域示意圖

由圖3可知,利用支持域計(jì)算每個(gè)節(jié)點(diǎn)xi對(duì)x的影響,進(jìn)而獲取特征點(diǎn)x的值。需要影響x的事件數(shù)據(jù)節(jié)點(diǎn),考慮全部x1,x2,x3,x4,x5,x6,x7點(diǎn),除點(diǎn)x1的支持域(虛線部分)外,其他各個(gè)節(jié)點(diǎn)的支持域均覆蓋特征數(shù)據(jù)點(diǎn)x,因此,x的函數(shù)值需要基于x2…x7進(jìn)行運(yùn)算。由于支持域區(qū)間內(nèi)的每個(gè)節(jié)點(diǎn)對(duì)x處的取值的影響均不完全相同,設(shè)權(quán)函數(shù)s"=x-xi,s=來(lái)衡量影響程度的大小。支持域的高階樣條形式如公式(1)所示:

支持域建立完成之后,基于支持域進(jìn)行移動(dòng)回歸,擬合局部特征點(diǎn)。在每個(gè)網(wǎng)格內(nèi),獲取基準(zhǔn)點(diǎn)的支持域影響范圍內(nèi)的全部感知數(shù)據(jù)點(diǎn),然后依據(jù)移動(dòng)回歸法計(jì)算特征點(diǎn)。設(shè)a(x)=(a1(x),a2(x),…,am(x))T為待定系數(shù)向量,p(x)=(p1(x),p2(x),…,pm(x))T為基函數(shù)向量,基準(zhǔn)點(diǎn)x的特征值如公式(2)所示:

同時(shí),在公式(2)中,為使局部近似值的精確度盡可能高,給定節(jié)點(diǎn)值yi和局部近似值f(xi)殘差的離散加權(quán)L2 范式如公式(3)所示:

其中,參數(shù)n為求解區(qū)域內(nèi)的數(shù)據(jù)點(diǎn)個(gè)數(shù),f(x)為特征擬合函數(shù),w(x?xi)為權(quán)函數(shù)。由于影響區(qū)域內(nèi)的每個(gè)數(shù)據(jù)點(diǎn)對(duì)x處取值的影響均不相同,因此,通過(guò)數(shù)據(jù)點(diǎn)xi的權(quán)函數(shù)w(x?xi)來(lái)衡量每個(gè)節(jié)點(diǎn)的影響程度。求解系數(shù)a(x)使J最小,并將公式(3)轉(zhuǎn)換為矩陣表示,如公式(4)所示:

其中,W(x)=diag(w1(x),w2(x),…,wn(x)),Y=(y1,y2,…,yn)T,wi(x)=w(x-xi),則矩陣P如公式(5)所示:

由公式(1)可得待定系數(shù)a(x)=A-1(x)B(x)Y,其中,A(x)=PTW(x)P,B(x)=PTW(x)。帶入公式(3)中求出擬合函數(shù)如公式(6)所示:

其中,參數(shù)k為基函數(shù)階數(shù),形函數(shù)ψk(x)=[φk1,φk2,…,φkn]=pT(x)A-1(x)B(x)。根據(jù)公式(6),循環(huán)每一個(gè)網(wǎng)格點(diǎn)x得到相應(yīng)的y值,進(jìn)而得到特征點(diǎn)。

如圖4所示,深色標(biāo)記點(diǎn)為一級(jí)移動(dòng)回歸提取的數(shù)據(jù)特征點(diǎn)。

圖4 特征點(diǎn)選取示意圖

2.2 二級(jí)線性回歸的預(yù)警模型建立

如上文所述,一級(jí)移動(dòng)回歸能夠提取到事件特征點(diǎn),但無(wú)法量化表示事件的連續(xù)趨勢(shì)變化。因此,需要構(gòu)建能夠完整表述流式數(shù)據(jù)事件持續(xù)變化規(guī)律的模型,使其可以準(zhǔn)確反應(yīng)事件的發(fā)展變化規(guī)律,對(duì)流式數(shù)據(jù)事件預(yù)警提供模型支持。

2.2.1 建立事件預(yù)警回歸模型

當(dāng)流式數(shù)據(jù)事件發(fā)生時(shí),其特征規(guī)律更接近多項(xiàng)式,很難通過(guò)標(biāo)準(zhǔn)化方程描述,且多個(gè)事件的感知數(shù)據(jù)點(diǎn)間也不存在規(guī)律性的函數(shù)映射。因此,引入線性回歸建立事件的曲線表達(dá)函數(shù),通過(guò)多項(xiàng)式方程表示事件的發(fā)展變化趨勢(shì)。

設(shè)n個(gè)特征數(shù)據(jù)點(diǎn)對(duì)為(xi,yi),i=1,2,…,n,為避免運(yùn)算溢出,令,則流式數(shù)據(jù)事件回歸方程可用公式(7)表示:

公式(7)中,m≤n,令wi=ai,x=xi?x=t,轉(zhuǎn)化回歸方程為y=a0+a1t+…+aktk標(biāo)準(zhǔn)型,橫坐標(biāo)t代表事件的時(shí)間域,縱坐標(biāo)y表示歷史事件屬性值,階數(shù)k與回歸系數(shù)a0,a1,…,ak為對(duì)應(yīng)關(guān)系,求參數(shù)ai 的偏導(dǎo)數(shù),使各數(shù)據(jù)點(diǎn)到回歸方程距離的偏差平方和R2≡取得極小值,得到公式(8)所示的方程組:

對(duì)公式(8)建立矩陣存儲(chǔ)模式,化簡(jiǎn)后得到事件的曲線回歸模型Ω如公式(9)所示:

如圖5為事件的加權(quán)回歸模型示意圖。

圖5 事件回歸模型示意圖

2.2.2 事件置信域構(gòu)建

在流式數(shù)據(jù)中,由于歷史事件預(yù)警模型不能與實(shí)時(shí)感知數(shù)據(jù)流進(jìn)行全匹配,因此,需要在模型中引入一個(gè)容錯(cuò)區(qū)間,在該容錯(cuò)區(qū)間內(nèi)的實(shí)時(shí)感知數(shù)據(jù)點(diǎn),均判定為危險(xiǎn)數(shù)據(jù)。該容錯(cuò)區(qū)間稱(chēng)為事件置信域。事件置信域構(gòu)建過(guò)程為如下。

首先,由公式(6)可知,預(yù)警模型Ω與實(shí)時(shí)感知數(shù)據(jù)點(diǎn)之間一定存在不匹配的情況,設(shè)預(yù)警模型y(x,a)=a0+a1x+…+ak xk=,則誤差E(a)為各感知數(shù)據(jù)點(diǎn)到模型Ω的距離平方和。設(shè)a為系數(shù)向量,(xn,yn)為實(shí)際的感知數(shù)據(jù)。如公式(10)所示:

其次,以建立的回歸模型Ω為基準(zhǔn),上下區(qū)間范圍選取作為事件置信域,其中,num為數(shù)據(jù)點(diǎn)的數(shù)量,θ為偏移量。事件置信域區(qū)間內(nèi)需要確保至少包含95%的歷史事件數(shù)據(jù)點(diǎn)。如圖6 為流式數(shù)據(jù)事件置信域示意圖。

圖6 事件置信域示意圖

由圖6可知,流式數(shù)據(jù)事件預(yù)警是根據(jù)實(shí)時(shí)數(shù)據(jù)點(diǎn)趨勢(shì)進(jìn)行的。在預(yù)警階段,實(shí)時(shí)數(shù)據(jù)點(diǎn)落在置信域區(qū)間內(nèi),即表示有發(fā)生災(zāi)害事件可能性,且由預(yù)警模型建立規(guī)則可知,越靠近預(yù)警模型的流式數(shù)據(jù)點(diǎn),其危險(xiǎn)程度就越高。

3 判識(shí)因子的事件自適應(yīng)實(shí)時(shí)預(yù)警

由于流式數(shù)據(jù)事件具有隨機(jī)性,當(dāng)實(shí)時(shí)數(shù)據(jù)到達(dá)后,與事件預(yù)警模型進(jìn)行比較分析,進(jìn)行事件預(yù)警。為了解決傳統(tǒng)預(yù)警方法滯后性問(wèn)題,提出判識(shí)因子變換策略,預(yù)估計(jì)流式數(shù)據(jù)未來(lái)的變化趨勢(shì),根據(jù)實(shí)時(shí)流式數(shù)據(jù)與事件預(yù)警模型的匹配程度進(jìn)行分階實(shí)時(shí)預(yù)警。

3.1 判識(shí)因子自適應(yīng)變換

要對(duì)流流式數(shù)據(jù)事件進(jìn)行實(shí)時(shí)判識(shí),需要在事件發(fā)生的時(shí)間域內(nèi),通過(guò)已到來(lái)的部分感知數(shù)據(jù)點(diǎn)的發(fā)展趨勢(shì),預(yù)估計(jì)其未來(lái)是否可能形成災(zāi)害事件,因此,為了衡量流式數(shù)據(jù)事件發(fā)生的可能趨勢(shì),本文提出判識(shí)因子的概念。判識(shí)因子可以對(duì)實(shí)時(shí)感知數(shù)據(jù)與預(yù)警模型的貼近趨勢(shì)進(jìn)行描述,當(dāng)感知數(shù)據(jù)對(duì)預(yù)警模型的擬合程度越高,判識(shí)因子越靠近模型;反之,則判識(shí)因子越靠近置信域邊界。

定義2(判識(shí)因子)事件置信域內(nèi)隨實(shí)時(shí)數(shù)據(jù)變化趨勢(shì)而自適應(yīng)變化的曲線。

設(shè)ξ表示事件置信域,γ表示判識(shí)因子,在事件預(yù)警模型Ω的置信域區(qū)間內(nèi),γ隨實(shí)時(shí)數(shù)據(jù)在模型Ω上方和下方1/2| |ξ-Ω的區(qū)間內(nèi)平行移動(dòng)進(jìn)而對(duì)實(shí)時(shí)數(shù)據(jù)的趨勢(shì)進(jìn)行預(yù)測(cè)。如圖7為判識(shí)因子示意圖。

圖7 判識(shí)因子示意圖

當(dāng)實(shí)時(shí)流式數(shù)據(jù)到來(lái)時(shí),通過(guò)判識(shí)因子進(jìn)行匹配,設(shè)置參數(shù)ρ為預(yù)警狀態(tài)標(biāo)記,且ρ=0。由于實(shí)際環(huán)境中可能出現(xiàn)強(qiáng)噪聲或其他無(wú)規(guī)律強(qiáng)干擾源,導(dǎo)致數(shù)據(jù)產(chǎn)生突變情況,即在連續(xù)n個(gè)數(shù)據(jù)點(diǎn)滿(mǎn)足災(zāi)害事件置信域區(qū)間后,出現(xiàn)部分后續(xù)感知數(shù)據(jù)點(diǎn)偏移出置信域的情況。針對(duì)該問(wèn)題,在變換規(guī)則中不應(yīng)舍棄已經(jīng)累積的狀態(tài)。設(shè)置判識(shí)因子“指數(shù)上升、線性下降”的變換方法,降低數(shù)據(jù)突變影響的同時(shí)保證及時(shí)觸發(fā)事件預(yù)警。判識(shí)因子變換規(guī)則包含如下步驟。

步驟1 若連續(xù)到來(lái)的m個(gè)實(shí)時(shí)數(shù)據(jù)點(diǎn),均在置信域ξ與判識(shí)因子γ之間的區(qū)間范圍時(shí),將γ遠(yuǎn)離模型Ω進(jìn)行個(gè)單位的指數(shù)平移操作;若后續(xù)實(shí)時(shí)數(shù)據(jù)點(diǎn)繼續(xù)進(jìn)入ξ與γ的區(qū)間范圍內(nèi),則準(zhǔn)備進(jìn)入預(yù)警觸發(fā)狀態(tài),預(yù)警狀態(tài)標(biāo)記ρ置為1;否則,γ繼續(xù)向外平移個(gè)單位,直至進(jìn)入預(yù)警觸發(fā)狀態(tài);進(jìn)入預(yù)警觸發(fā)狀態(tài)后,判識(shí)因子γ及預(yù)警狀態(tài)標(biāo)記ρ進(jìn)行初始化。

步驟2 若連續(xù)到來(lái)的m個(gè)實(shí)時(shí)數(shù)據(jù)點(diǎn),在置信域ξ和判識(shí)因子γ的交集范圍內(nèi)時(shí),將γ靠近模型Ω進(jìn)行α個(gè)單位的線性平移操作;若后續(xù)實(shí)時(shí)數(shù)據(jù)點(diǎn)繼續(xù)進(jìn)入γ和Ω的范圍內(nèi),則準(zhǔn)備進(jìn)入預(yù)警觸發(fā)狀態(tài),預(yù)警狀態(tài)標(biāo)記ρ置為1;否則,轉(zhuǎn)至步驟1。

步驟3 在預(yù)警觸發(fā)狀態(tài)下,若連續(xù)m個(gè)實(shí)時(shí)數(shù)據(jù)點(diǎn)偏移出置信域ξ,則取消預(yù)警觸發(fā)狀態(tài),判識(shí)因子γ及預(yù)警狀態(tài)標(biāo)記ρ進(jìn)行初始化,轉(zhuǎn)至步驟1;否則,繼續(xù)保持預(yù)警觸發(fā)狀態(tài)。

3.2 分階趨勢(shì)預(yù)警

基于3.1 節(jié)判識(shí)因子變換策略,提出事件分階趨勢(shì)預(yù)警。摒棄現(xiàn)有閾值跳變二分法預(yù)警的方法,設(shè)流式數(shù)據(jù)災(zāi)害事件發(fā)生的可能性隨預(yù)警等級(jí)的提高而增大,通過(guò)實(shí)時(shí)流式數(shù)據(jù)與預(yù)警模型的擬合程度將預(yù)警結(jié)果由低到高分為三個(gè)等級(jí),通過(guò)衡量預(yù)警等級(jí)采取不同的應(yīng)對(duì)措施。分階趨勢(shì)預(yù)警觸發(fā)規(guī)則包含如下步驟。

步驟1 當(dāng)連續(xù)到來(lái)的m個(gè)實(shí)時(shí)數(shù)據(jù)點(diǎn),均在置信域ξ與判識(shí)因子γ之間的區(qū)間范圍(判識(shí)因子變換規(guī)則步驟1)時(shí),觸發(fā)一級(jí)預(yù)警發(fā)布狀態(tài)。

步驟2 基于步驟1,繼續(xù)監(jiān)測(cè)預(yù)警狀態(tài)標(biāo)記ρ,若ρ置為1,則立即觸發(fā)二級(jí)預(yù)警發(fā)布狀態(tài);否則,取消一級(jí)預(yù)警發(fā)布狀態(tài)。

步驟3 當(dāng)連續(xù)到來(lái)的m 個(gè)實(shí)時(shí)數(shù)據(jù)點(diǎn),在置信域ξ和判識(shí)因子γ 的交集范圍內(nèi)(判識(shí)因子變換規(guī)則步驟2)時(shí),觸發(fā)二級(jí)預(yù)警發(fā)布狀態(tài)。

步驟4 基于步驟2,繼續(xù)監(jiān)測(cè)預(yù)警狀態(tài)標(biāo)記ρ,若ρ置為1,則立即觸發(fā)三級(jí)預(yù)警發(fā)布狀態(tài);否則,將警發(fā)布狀態(tài)級(jí)別降二級(jí)。

步驟5 當(dāng)連續(xù)m 個(gè)實(shí)時(shí)數(shù)據(jù)點(diǎn)偏移出置信域ξ(判識(shí)因子變換規(guī)則步驟3)時(shí),立即取消全部預(yù)警發(fā)布狀態(tài)。

通過(guò)事件分階實(shí)時(shí)趨勢(shì)預(yù)警,可以在很大程度上提高流式數(shù)據(jù)災(zāi)害事件的實(shí)時(shí)性和準(zhǔn)確性。

4 實(shí)驗(yàn)與分析

本章對(duì)ATRIM方法的預(yù)警效果和效率進(jìn)行了綜合實(shí)驗(yàn)評(píng)估,實(shí)驗(yàn)數(shù)據(jù)集為集賢煤礦50 萬(wàn)條微震流式數(shù)據(jù),包含振動(dòng)信號(hào)在水平和垂直3個(gè)方向的分量,共享相同時(shí)間域,采樣頻率為10 000 數(shù)據(jù)點(diǎn)/s。實(shí)驗(yàn)選擇垂直分量數(shù)據(jù)進(jìn)行計(jì)算,分別通過(guò)數(shù)據(jù)建模準(zhǔn)確性、預(yù)警實(shí)時(shí)性、準(zhǔn)確性及可靠性等幾個(gè)方面驗(yàn)證方法的有效性,對(duì)比算法為STA/LTA 時(shí)域分析法、GM 模型法以及WCM分級(jí)預(yù)警法。實(shí)驗(yàn)平臺(tái)為Intel Core i5-7500T @ 2.70 GHz處理器。

4.1 數(shù)據(jù)規(guī)模與模型誤差率分析

建立時(shí)序事件預(yù)警模型時(shí),感知數(shù)據(jù)點(diǎn)數(shù)量對(duì)預(yù)警準(zhǔn)確性影響較大,且數(shù)據(jù)點(diǎn)過(guò)少時(shí),預(yù)警模型缺乏代表性。實(shí)驗(yàn)?zāi)M了建立模型的數(shù)據(jù)規(guī)模與誤差率的關(guān)系,如圖8,橫坐標(biāo)表示建立模型使用的歷史災(zāi)害數(shù)據(jù),縱坐標(biāo)表示規(guī)格化后的誤差絕對(duì)值。由圖8可得,本文提出的兩級(jí)回歸的事件預(yù)警模型構(gòu)建方法,在海量數(shù)據(jù)集下能夠更好地反映流式數(shù)據(jù)事件的變化趨勢(shì),數(shù)據(jù)規(guī)模與模型準(zhǔn)確率成正比關(guān)系。

圖8 數(shù)據(jù)規(guī)模與誤差率關(guān)系圖

4.2 預(yù)警實(shí)時(shí)性分析

本節(jié)對(duì)ATRIM 方法的預(yù)警實(shí)時(shí)性進(jìn)行了評(píng)估,并與STA/LTA、GM 方法以及WCM 方法進(jìn)行了對(duì)比。如圖9,橫坐標(biāo)表示預(yù)警實(shí)時(shí)流式數(shù)據(jù)的數(shù)據(jù)點(diǎn)數(shù)量,縱坐標(biāo)表示預(yù)警觸發(fā)時(shí)間。

圖9 實(shí)時(shí)性測(cè)試圖

時(shí)序事件的持續(xù)時(shí)間通常在零點(diǎn)幾秒至幾秒內(nèi),對(duì)預(yù)警觸發(fā)策略的實(shí)時(shí)性要求極高。由圖9 可得,STA/LTA 方法必須滿(mǎn)足時(shí)窗閾值觸發(fā)條件才能觸發(fā)預(yù)警,GM方法需要接收一個(gè)完整窗口數(shù)據(jù)后進(jìn)行事件預(yù)警,WCM方法窗口每次固定累積1/4的數(shù)據(jù)進(jìn)行計(jì)算,隨著實(shí)時(shí)數(shù)據(jù)的不斷累積,這些預(yù)警方法的滯后性就越明顯。而本文提出的ATRIM 方法預(yù)警觸發(fā)時(shí)間穩(wěn)定在100 ms 左右,能實(shí)時(shí)處理數(shù)據(jù),較其他3 種方法具有更高的實(shí)時(shí)性。

4.3 預(yù)警效率分析

如圖10 為各個(gè)算法預(yù)警效率對(duì)比圖,橫坐標(biāo)為預(yù)警觸發(fā)次數(shù),縱坐標(biāo)為預(yù)警時(shí)間。

圖10 預(yù)警觸發(fā)效率對(duì)比圖

由圖10 可得,WCM、GM、STA/LTA 方法的平均預(yù)警觸發(fā)時(shí)間分別維持在300 ms、600 ms、1 000 ms 左右,本文提出的ATRIM 方法多次預(yù)警觸發(fā)時(shí)間均在100ms左右,遠(yuǎn)低于其他3種方法。與其他時(shí)序事件預(yù)警方法相比,ATRIM的平均時(shí)間最短,更適合流式數(shù)據(jù)事件的實(shí)時(shí)預(yù)警處理。

4.4 預(yù)警準(zhǔn)確性分析

如圖11 為預(yù)警準(zhǔn)確性對(duì)比圖。橫坐標(biāo)表示流式數(shù)據(jù)的實(shí)時(shí)數(shù)據(jù)點(diǎn)數(shù)目,縱坐標(biāo)為預(yù)警準(zhǔn)確性的百分比誤差。

圖11 預(yù)警準(zhǔn)確性對(duì)比圖

由圖11可得,隨著的實(shí)時(shí)數(shù)據(jù)點(diǎn)數(shù)目的增多,WCM方法的誤差率先小幅度上升后趨于平緩;當(dāng)數(shù)據(jù)點(diǎn)數(shù)目≤5 000時(shí),STA/LTA方法受噪音干擾較大,導(dǎo)致窗口相應(yīng)計(jì)算的結(jié)果不準(zhǔn)確,誤差率隨幾乎成直線上升趨勢(shì),最高誤差率達(dá)到了73.6%。當(dāng)數(shù)據(jù)點(diǎn)數(shù)目>5 000 時(shí),初動(dòng)時(shí)間持續(xù)短,后續(xù)感知數(shù)據(jù)很快到達(dá),窗口計(jì)算的結(jié)果比較準(zhǔn)確,使得誤差率出現(xiàn)了大幅度的下降,但誤差率仍然高于其他兩種方法;本文提出的ATRIM 方法誤差率未隨著數(shù)目的增多而明顯增大,一直在5%左右,由此可見(jiàn),ATRIM 方法優(yōu)于WCM 方法以及STA/LTA 方法,具有更高的預(yù)警準(zhǔn)確性。

5 結(jié)論

方法首先建立兩級(jí)回歸的事件預(yù)警模型,對(duì)海量歷史事件進(jìn)行規(guī)格化處理,引入一級(jí)移動(dòng)回歸法提取數(shù)據(jù)特征,通過(guò)可變網(wǎng)格對(duì)數(shù)據(jù)進(jìn)行劃分,并基于支持域選取特征點(diǎn);其次,基于提取的數(shù)據(jù)特征,通過(guò)二級(jí)線性回歸法建立事件預(yù)警模型,并對(duì)模型進(jìn)行最小二乘誤差分析,構(gòu)建事件置信域,實(shí)現(xiàn)流式數(shù)據(jù)與預(yù)警模型的相似匹配;最后,提出基于判識(shí)因子的事件分階實(shí)時(shí)預(yù)警方法,通過(guò)判識(shí)因子變換策略對(duì)事件未來(lái)變化趨勢(shì)進(jìn)行預(yù)估計(jì),實(shí)現(xiàn)事件的分階實(shí)時(shí)預(yù)警。

石嘴山市| 景宁| 湖口县| 红原县| 中山市| 吉林市| 祥云县| 通辽市| 惠东县| 江孜县| 横峰县| 融水| 泰兴市| 贵州省| 沁水县| 唐山市| 镶黄旗| 潜山县| 松溪县| 牙克石市| 香港 | 鹰潭市| 云阳县| 天门市| 兴业县| 林甸县| 曲麻莱县| 临武县| 隆尧县| 琼海市| 延边| 武清区| 会同县| 手机| 新建县| 新余市| 建瓯市| 舞钢市| 嫩江县| 黔东| 慈利县|