国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種基于波動向量分級技術(shù)的病變數(shù)據(jù)快速分析方法

2022-07-13 02:50孔凡書齊金鵬龔漢鑫朱俊俊曹一彤
電子科技 2022年7期
關(guān)鍵詞:時序滑動均值

孔凡書,齊金鵬,龔漢鑫,朱俊俊,曹一彤

(東華大學(xué) 信息科學(xué)與技術(shù)學(xué)院,上海 201620)

近年來,隨著醫(yī)療技術(shù)的不斷發(fā)展,醫(yī)療數(shù)據(jù)正在邁向智能化的“大數(shù)據(jù)時代”[1]。診斷數(shù)據(jù)、數(shù)字化影像、病變信號數(shù)據(jù)的記錄和分析受到越來越多的關(guān)注[2]。對這些海量數(shù)據(jù)進行檢測和分析,并從復(fù)雜數(shù)據(jù)中挖掘潛在價值已成為研究的熱點問題[3-5]。癲癇作為世界上最常見的慢性疾病之一,是一種具有突發(fā)性、致殘性的腦功能障礙性疾病[6]。此疾病的病變信號是一種典型的大規(guī)模時序數(shù)據(jù),對其分析檢測的時耗和精確度都有較高要求[7],因此對大規(guī)模病變數(shù)據(jù)進行快速準確分析是需要重點研究的問題。

國內(nèi)外學(xué)者也在不斷對時序數(shù)據(jù)的快速分析進行深入研究[8-10]。KS(Kolmogorov-Smirnov)統(tǒng)計是一種比較兩個觀測值分布的檢驗方法,常用于樣本量較小的雙樣本檢驗[11]。小波變換利用小波對數(shù)據(jù)進行多級分解,然后對分解的細節(jié)分量進行分析和檢測[12]。但是實際數(shù)據(jù)樣本往往包含大量的數(shù)據(jù)點,上述幾種方法對于大規(guī)模數(shù)據(jù)檢測具有耗時多、精度低等問題,所以目前研究人員的重點是研究可對具有隨機性、非平穩(wěn)性的大規(guī)模數(shù)據(jù)進行快速準確檢測與分析的方法[13]。

針對已有方法存在的消耗時間長、檢測精度低等問題,本文結(jié)合TSTKS突變點檢測算法與滑動窗口理論,給出一種基于波動向量分級技術(shù)的病變數(shù)據(jù)快速分析方法。該方法首先采用滑動窗口模型將待檢測的數(shù)據(jù)劃分到多個子窗口,并采用TSTKS突變點檢測算法對每個子窗口進行檢測;然后,通過提取連續(xù)多窗口的波動特征來構(gòu)建歸一化的波動向量,并采用多閾值分割技術(shù)對波動向量進行多層分級;最后,通過仿真實驗和腦癲癇病變信號分析實驗對時序數(shù)據(jù)的不同狀態(tài)進行特征分析與快速提取,進而對該方法的準確性和有效性進行驗證。

1 方法實現(xiàn)

為實現(xiàn)對大規(guī)模病變數(shù)據(jù)異常狀態(tài)的準確分析與快速診斷,本文提出了基于波動向量分級技術(shù)的時序數(shù)據(jù)分析方法,框架如圖1所示。首先,基于滑動窗口模型將待檢測數(shù)據(jù)劃分為若干個數(shù)據(jù)子段窗口,采用TSTKS突變點檢測算法對時序數(shù)據(jù)進行檢測;然后,通過提取連續(xù)多窗口的波動量來構(gòu)建歸一化的時序數(shù)據(jù)波動向量;最后,采用多閾值分割技術(shù)實現(xiàn)對波動向量的多層分級,通過訓(xùn)練集實現(xiàn)閾值自學(xué)習(xí),并利用測試集實現(xiàn)對算法的驗證。

圖1 基于波動向量分級技術(shù)的時序數(shù)據(jù)分析方法框架圖

1.1 基于滑動窗口模型的多突變點檢測算法

1.1.1 單突變點檢測的TSTKS算法

TSTKS突變點檢測算法是在時序數(shù)據(jù)流中進行突變點檢測的最常見算法之一[14]。該方法屬于三叉樹搜索算法,在對時序數(shù)據(jù)進行突變點檢測時具有誤差小、用時短且準確率較高等優(yōu)點[15]。

因此,TSTKS突變點檢測算法可對大規(guī)模時序數(shù)據(jù)進行快速、準確的數(shù)據(jù)異常檢測。但由于在有多個突變點的場景下應(yīng)用TSTKS突變點檢測算法存在檢測精度低的問題,因此本文將適用于多突變點檢測的滑動窗口理論與TSTKS算法進行了結(jié)合。

1.1.2 滑動窗口模型

滑動窗口是一種流量控制技術(shù),可以被視作是基于數(shù)組的無限循環(huán)內(nèi)存,它也是一種重要的數(shù)據(jù)流處理模型。其基本運行機制如下:

步驟1接收送來的數(shù)據(jù)并保存,其中最大的接收容量與窗口大小相等;

步驟2當有新的數(shù)據(jù)進入時,讓最前面的數(shù)據(jù)離開窗口。

如圖2所示,數(shù)據(jù)流的流向為自左向右,W代表滑動窗口的寬度,即窗口中包含的元素個數(shù)。滑動窗口的更新大小為一個窗口寬度W,即上一個窗口的滑出是下一個窗口的滑入。

圖2 寬度為W的固定滑動窗口模型

對于不同的時序數(shù)據(jù)可選擇合適的窗口寬度。本文利用滑動窗口對時序數(shù)據(jù)進行分割,分別對分割的每個窗口使用TSTKS算法進行檢測,實現(xiàn)對時序數(shù)據(jù)的多突變點檢測。

1.2 波動向量的計算與構(gòu)建

1.2.1 窗口波動量的計算

窗口波動量表示窗口內(nèi)數(shù)據(jù)的統(tǒng)計波動特征,是基于突變點檢測的。引入窗口波動可以考察兩段數(shù)據(jù)的集中程度,窗口波動可描述當前子段數(shù)據(jù)分布情況和散列程度[16]。定義窗口波動(Window Fluctuation,WF)為

(1)

式中,mean(ZL)表示突變點左半部分數(shù)據(jù)的均值;mean(ZR)表示突變點右半部分數(shù)據(jù)的均值;Z表示整個時序數(shù)據(jù);max和min分別表示求最大值和最小值。

在基于滑動窗口模型的突變點檢測算法中,對于每一個使用滑動窗口模型分割的子窗口分別應(yīng)用TSTKS突變點檢測算法。若在當前窗口使用TSTKS算法檢測到突變點,則可以計算出當前窗口波動;若沒有檢測到突變點,則說明當前窗口數(shù)據(jù)服從同一分布,窗口波動為零。經(jīng)過一次檢測,就可以得到基于每個滑動窗口的窗口波動。

1.2.2 波動向量的構(gòu)建

由上一節(jié)分析可知,對于數(shù)據(jù)長度為N的待檢測時序數(shù)據(jù),應(yīng)用TSTKS算法和滑動窗口理論可以得到每個窗口的波動值。此時,根據(jù)窗口大小W和每一個窗口波動量的組合就可以得到一個維度為N/W的向量,稱之為波動向量。其建立過程如圖3所示。

圖3 波動向量的構(gòu)建

1.3 波動向量分級算法

波動向量分級算法由兩個策略組成:

策略1利用TSTKS算法檢測到突變點后波動量進行分級;

策略2在策略1失效的情況下,利用每個滑動窗口內(nèi)數(shù)據(jù)的均值大小來進行判斷。具體步驟如圖4所示。

圖4 波動向量分級算法流程圖

通過實驗證明,策略2會在策略1出現(xiàn)突變點漏檢和波動程度不明顯的情況下正確判斷窗口內(nèi)數(shù)據(jù)狀態(tài)。

1.3.1 基于波動量的閾值分割策略

對構(gòu)建好的波動向量先進行排序,并且每一個波動量都附帶著這個波動量在原來時序數(shù)據(jù)中的位置信息。通過完成排序的波動向量找到最大的波動量,根據(jù)最大波動量附帶的位置信息可以定位到當前時序數(shù)據(jù)中發(fā)生突變最大的位置posmax。由此可計算出兩個在posmax左右兩側(cè)的波動量,其計算式為

(2)

式中,WFl表示在posmax左側(cè)的波動量;mean(Zl)表示在posmax左側(cè)時序數(shù)據(jù)的均值;max(Zl)和max(Zr)分別表示左側(cè)時序數(shù)據(jù)的最大值和最小值。同理可得在posmax右側(cè)的波動量WFr。

將WFl和WFr添加到原來的波動向量中,再對其進行排序。此時的波動向量包含原來時序數(shù)據(jù)的波動量和最大突變處左右兩側(cè)的波動量。然后對波動向量進行歸一化,設(shè)排序后的波動向量為a={x1,x2,x3,…,xn},其歸一化計算式為

(3)

式中,Thresholdi表示第i個閾值;xi表示波動向量中第i個波動量;min和max分別表示最大值和最小值。

圖5表示基于波動量閾值分割策略對每個窗口波動量的分割和狀態(tài)判斷流程圖。

圖5 基于窗口波動量的閾值分割流程圖

圖5中,τ1為訓(xùn)練集中最大突變點處左側(cè)波動量歸一化的值,τ2為訓(xùn)練集中最大突變處右側(cè)波動量歸一化的值,τ3為訓(xùn)練集中最大突變點處的波動量歸一化的值。

1.3.2 基于均值的閾值分割策略

基于波動量的閾值分割策略中的波動量是根據(jù)突變點檢測結(jié)果來計算的,未檢測到突變點則波動量為零;檢測到突變點則利用波動量來表示窗口的波動程度。但是突變點檢測存在誤檢和漏檢的情況,針對突變點檢測的這一缺點,本文使用基于均值的閾值分割策略作為波動向量分級算法的第2個策略。

窗口的均值表示窗口內(nèi)數(shù)據(jù)的集中程度,在一定程度上可以表示當前窗口的波動趨勢水平。窗口均值閾值的選取與滑動窗口模型有關(guān),按照突變點檢測算法尋找到的最大突變位置,分別計算時序數(shù)據(jù)段中左右兩側(cè)的均值大小為

(4)

式中,AVGl表示時序數(shù)據(jù)段最大突變位置左側(cè)均值波動量;mean(Zl)表示最大突變處左側(cè)時序數(shù)據(jù)的均值;max(Ztol)和min(Ztol)分別表示整個時序數(shù)據(jù)的最大值和最小值。同理可得右側(cè)時序數(shù)據(jù)均值。

除了表示波動量的計算方式不同,劃分不同狀態(tài)閾值的算法與策略1相同。圖6表示基于均值的閾值分割策略對每個窗口波動量的分割和狀態(tài)判斷流程圖。其中,τ1為訓(xùn)練集中最大突變點處左側(cè)波動量歸一化的值,τ2為訓(xùn)練集中最大突變處右側(cè)波動量歸一化的值,τ3為訓(xùn)練集中最大突變點處的波動量歸一化的值。

圖6 基于窗口均值的閾值分割流程圖

2 方法驗證

為了驗證本文所提方法的有效性,首先在仿真實驗中采用訓(xùn)練數(shù)據(jù)實現(xiàn)波動向量分級算法中多閾值分割的訓(xùn)練算法與自學(xué)習(xí)過程;然后,利用測試數(shù)據(jù)并根據(jù)多層閾值對不同分布和不同發(fā)病位置的時序數(shù)據(jù)進行快速分析,實現(xiàn)方法的驗證;最后,采用基于波動向量多層閾值分割技術(shù),實現(xiàn)大規(guī)模腦癲癇病變數(shù)據(jù)的特征分析與異常狀態(tài)快速診斷。

2.1 仿真實驗

首先使用基于滑動窗口模型的TSTKS突變點檢測算法進行突變點檢測[17-20],然后利用波動向量分級算法對檢測出來的波動量進行分割。本文選取的訓(xùn)練集和測試集的擬合樣本數(shù)據(jù)長度N為215,即32 768;使用固定滑動窗口,窗口寬度W為1 024?;诖翱诓▌恿康拈撝捣指顚M合數(shù)據(jù)進行波動向量分級的訓(xùn)練集和測試集效果如圖7所示。

在訓(xùn)練集中使用波動向量分級算法進行閾值分割,可以得到劃分波動量不同等級的閾值,然后將閾值應(yīng)用在測試集的不同分布數(shù)據(jù)中。

從圖7中可以看出閾值分割的結(jié)果都比較準確,無框線部分是處于正常狀態(tài)。隨著數(shù)據(jù)波動程度的變化,在較粗框線處產(chǎn)生了數(shù)據(jù)中最大的波動量,此時處于發(fā)病嚴重狀態(tài)。接下來數(shù)據(jù)的波動程度有所減小,在粗框線中有較大數(shù)據(jù)波動,此時處于發(fā)病狀態(tài)。

圖7 不同發(fā)病位置的模擬數(shù)據(jù)分割效果圖

以上模擬數(shù)據(jù)由不同分布的數(shù)據(jù)擬合而成,突變點檢測效果較好,但是如果出現(xiàn)相同數(shù)據(jù)分布的情況,可能會出現(xiàn)異常情況。如圖8所示。

圖8 基于波動量的閾值分割效果圖

由于數(shù)據(jù)太密集不能直觀展現(xiàn)相鄰數(shù)據(jù)間的波動狀況,因此使用數(shù)據(jù)長度N為2 048,窗口寬度W為256進行突變點檢測。從圖8中可以看出,在檢測到突變點以后,數(shù)據(jù)的波動程度仍比較劇烈,但是沒有檢測到突變點產(chǎn)生,導(dǎo)致窗口內(nèi)數(shù)據(jù)的波動量為零,因此圖8(b)中只有在跳變的時候窗口框線為粗框線。綜上所述,突變點檢測漏檢的情況導(dǎo)致只依靠波動量進行分級存在一定局限性。

在本次仿真中,樣本數(shù)據(jù)由不同發(fā)病位置和不同分布的數(shù)據(jù)組成,擬合數(shù)據(jù)長度N為32 768,窗口長度W為1 024,在結(jié)合波動量和均值作為閾值分割的參考量后,其運行結(jié)果如圖9所示。

圖9 基于波動量和均值的閾值分割策略的分割效果圖

從圖9中可以看出,首先在訓(xùn)練集中使用綜合兩種策略的波動向量分級算法,然后將訓(xùn)練集中得到的閾值應(yīng)用到測試集中。由圖9(b)可以看出數(shù)據(jù)的波動由平緩再到劇烈,然后循環(huán)往復(fù)。在圖9(b)中可以看到有若干個數(shù)據(jù)波動劇烈的窗口未檢測到突變點,若只根據(jù)基于波動量的閾值分割策略進行判斷,窗口處于正常狀態(tài),不符合數(shù)據(jù)異常狀況;但是在加入基于均值的閾值分割策略后,可以判斷出窗口內(nèi)數(shù)據(jù)變化比較劇烈,窗口框線為粗框線,處于發(fā)病狀態(tài),與數(shù)據(jù)異常狀況相符合。

2.2 腦癲癇病變數(shù)據(jù)分析

章節(jié)2.1中采用的實驗數(shù)據(jù)均為模擬數(shù)據(jù),存在偶然因素,具有一定的局限性。為了更好地說明波動向量分級算法的分割效果,本文選取了腦癲癇病變信號進行檢測,數(shù)據(jù)的70%作為訓(xùn)練數(shù)據(jù),另外30%作為測試數(shù)據(jù)。選取窗口寬度分別為128、256、512和1 024。檢測效果如圖10所示,其中無框線表示正常狀態(tài),細框線表示預(yù)測發(fā)病狀態(tài),粗框線表示發(fā)病狀態(tài),較粗框線表示嚴重發(fā)病狀態(tài)。

從圖10中可以看出當滑動窗口W為128時,單個窗口內(nèi)攜帶的數(shù)據(jù)信息較少,導(dǎo)致突變點出現(xiàn)誤判的情況較多。圖10(a)中有較多的較粗框線窗口,因此部分窗口波動量的閾值分割出現(xiàn)誤分的情況。當滑動窗口的寬度為256時,窗口包含的數(shù)據(jù)信息適中,可以準確、清晰地對癲癇發(fā)作的4種狀態(tài)進行正確劃分。隨著窗口寬度繼續(xù)增大,當窗口寬度為512和1 024時,單個窗口包含過多數(shù)據(jù),許多數(shù)據(jù)信息淹沒在窗口中,導(dǎo)致預(yù)測發(fā)病狀態(tài)消失。

圖10 不同窗口寬度對腦癲癇病變數(shù)據(jù)分割結(jié)果對比

因此,當窗口寬度W為256時,突變點檢測效果和閾值分割效果均比較優(yōu)秀,能夠從最初波動量比較小的正常狀態(tài)到波動變大的預(yù)測發(fā)病狀態(tài),再到波動劇烈的發(fā)病和發(fā)病嚴重狀態(tài),完整地對癲癇的發(fā)病狀態(tài)進行判斷。

3 結(jié)束語

本文提出了一種基于波動向量分級技術(shù)的時序數(shù)據(jù)特征分析與狀態(tài)診斷快速方法。該方法首先采用了滑動窗口理論與TSTKS突變點檢測算法,通過提取連續(xù)多窗口波動特征構(gòu)建了時序數(shù)據(jù)的歸一化波動向量。然后,采用歸一化波動向量的多閾值分割與多層分級策略,實現(xiàn)了大規(guī)模時序數(shù)據(jù)的特征分析與病變狀態(tài)的快速診斷方法。最后,本文利用仿真實驗與腦癲癇病變信號分析實驗驗證了所提方法的快速性、準確性和高效性。綜合來說,該方法為大規(guī)模時序數(shù)據(jù)的特征分析與異常狀態(tài)診斷等相關(guān)問題的研究提供了一種新思路。

猜你喜歡
時序滑動均值
顧及多種弛豫模型的GNSS坐標時序分析軟件GTSA
清明
基于GEE平臺與Sentinel-NDVI時序數(shù)據(jù)江漢平原種植模式提取
你不能把整個春天都搬到冬天來
均值—方差分析及CAPM模型的運用
均值—方差分析及CAPM模型的運用
均值不等式的小應(yīng)用
一種動態(tài)足球射門訓(xùn)練器
關(guān)于滑動變阻器的規(guī)格問題
應(yīng)用均值定理“四”注意
宣城市| 翁牛特旗| 葵青区| 井陉县| 朝阳市| 鲜城| 眉山市| 德阳市| 诸城市| 津南区| 白城市| 新宾| 敦化市| 钟山县| 建平县| 丘北县| 石屏县| 西乡县| 潼关县| 贵州省| 兴仁县| 桐柏县| 芜湖县| 梁山县| 姜堰市| 灵寿县| 旌德县| 勐海县| 闵行区| 宝鸡市| 闸北区| 灵山县| 彭阳县| 项城市| 梁平县| 吉木乃县| 巫山县| 青川县| 灌阳县| 安远县| 永康市|