国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

地震前兆數(shù)據(jù)的大數(shù)據(jù)挖掘研究

2018-09-19 09:41李秀明
關(guān)鍵詞:前兆數(shù)據(jù)挖掘觀測(cè)

李秀明,乜 勇,劉 磊

(1.青海民族大學(xué)物理與電子信息工程學(xué)院,西寧 810007;2.陜西師范大學(xué)教育學(xué)院,西安 710062;3.青海省地震局,西寧 810000)

0 引言

地震前兆觀測(cè)指的是實(shí)現(xiàn)地震預(yù)報(bào)及其他地球物理科學(xué)研究的基礎(chǔ),千兆預(yù)測(cè)數(shù)據(jù)質(zhì)量及數(shù)量對(duì)此研究過程和結(jié)果具有直接的決定作用。所以,前兆觀測(cè)屬于我國(guó)地震監(jiān)測(cè)工作中的主要內(nèi)容。通過我國(guó)多年的發(fā)展,我國(guó)地震前兆觀測(cè)系統(tǒng)已經(jīng)創(chuàng)建成為覆蓋全國(guó)單位、智能化及涉及多學(xué)科的網(wǎng)絡(luò)觀測(cè)系統(tǒng)。目前數(shù)字化前兆觀測(cè)系統(tǒng)數(shù)據(jù)的采樣率及精度有了進(jìn)一步的提高,也提高了數(shù)據(jù)量,增加了前兆臺(tái)站、前兆臺(tái)網(wǎng)的數(shù)據(jù)及數(shù)據(jù)檢查工作量。目前,地震前兆數(shù)據(jù)預(yù)處理工作還是根據(jù)人工檢查方式實(shí)現(xiàn),因?yàn)閿?shù)據(jù)量較大,人工檢查方式效率較低。并且,人工檢查過程具有一定的直觀性,不同人員的判斷各有不同。數(shù)據(jù)挖掘就是基于此種需求逐漸發(fā)展的學(xué)科,其能夠從隨機(jī)、大量、模糊、有噪聲及不完整數(shù)據(jù)中檢測(cè)有用信息,以此對(duì)人們提供決策根據(jù)。那么,本文就將大數(shù)據(jù)挖掘應(yīng)用到地震前兆數(shù)據(jù)分析中,從而解決現(xiàn)代前兆臺(tái)網(wǎng)數(shù)據(jù)人工檢測(cè)效率較低的問題,以此為目前觀測(cè)數(shù)據(jù)大數(shù)據(jù)庫(kù)量分析及使用工作的全新方法進(jìn)行探索。

1 大數(shù)據(jù)挖掘技術(shù)的研究

數(shù)據(jù)挖能夠使人們對(duì)信息數(shù)據(jù)進(jìn)行分析、理解和使用的全新學(xué)科,海量數(shù)據(jù)挖掘指的就是從不完全、大量、隨機(jī)、模糊的實(shí)際收集信息中,利用提煉隱藏在不輕易被人發(fā)現(xiàn)的有用信息及知識(shí)過程。此都是利用數(shù)據(jù)挖掘分析得到的知識(shí)及信息,不僅能夠被人們所理解,還能夠便于存儲(chǔ)、使用及傳播。大數(shù)據(jù)挖掘從出現(xiàn)之后,此領(lǐng)域備受人們的重視。在信息技術(shù)不斷發(fā)展的過程中,通信水平也在不斷的提高,大多數(shù)行業(yè)信息都實(shí)現(xiàn)了高度集中。所以,大數(shù)據(jù)挖掘技術(shù)被廣泛應(yīng)用到多領(lǐng)域中。

大數(shù)據(jù)挖掘?qū)儆谌碌膶W(xué)科,其中具備了傳統(tǒng)領(lǐng)域的思想,比如估計(jì)及假設(shè)檢驗(yàn)、統(tǒng)計(jì)學(xué)抽樣;模式識(shí)別、人工智能及機(jī)器學(xué)習(xí)搜索算法、學(xué)習(xí)理論和建模技術(shù)等。以上領(lǐng)域都包括進(jìn)化計(jì)算、最優(yōu)化、信息論、可視化及信號(hào)處理等技術(shù),其被廣泛應(yīng)用到大數(shù)據(jù)挖掘中。另外,數(shù)據(jù)庫(kù)系統(tǒng)還具有有效存儲(chǔ)、查詢處理、索引的支持,分布式技術(shù)能夠幫助對(duì)海量數(shù)據(jù)進(jìn)行處理,還能夠在數(shù)據(jù)無法聚集的過程中一起處理。

大數(shù)據(jù)挖掘具有完整的方法對(duì)實(shí)際問題進(jìn)行解決,根據(jù)此分類估計(jì)、預(yù)測(cè)分析、抽象聚類、相關(guān)性分組、建模描述可視化及復(fù)雜數(shù)據(jù)類型挖掘,能夠?qū)崿F(xiàn)大量信息的挖掘,此套完整方法在地震檢測(cè)系統(tǒng)中使用,實(shí)現(xiàn)海量數(shù)據(jù)分析,能夠使地震檢測(cè)時(shí)效性及精準(zhǔn)度得到有效的提高[1]。

2 地震預(yù)報(bào)中的數(shù)據(jù)挖掘

2.1 地震預(yù)報(bào)方法

地震預(yù)報(bào)復(fù)雜性及科學(xué)難度為世界公認(rèn),通過長(zhǎng)時(shí)間的研究及探索,人們總結(jié)了地震學(xué)預(yù)報(bào)、千兆預(yù)報(bào)、地震活動(dòng)大形勢(shì)預(yù)報(bào)及綜合預(yù)報(bào)等,本文所研究的為前兆預(yù)報(bào)方法。千兆預(yù)報(bào)是利用對(duì)大地形變場(chǎng)、地磁場(chǎng)、應(yīng)力應(yīng)變場(chǎng)、重力場(chǎng)、大地電場(chǎng)等地理物理場(chǎng)及物理量異常變化對(duì)未來大地震進(jìn)行預(yù)報(bào)。對(duì)于中短期的地震預(yù)報(bào)探索分析,得到可靠地震前兆具有重要的意義。實(shí)現(xiàn)地震預(yù)測(cè)的主要內(nèi)容就是確認(rèn)地震前兆,地震前兆的重現(xiàn)性理為地震預(yù)測(cè)基礎(chǔ)。

地震數(shù)據(jù)的主要特點(diǎn)為:1)具有較多的經(jīng)驗(yàn)性知識(shí)。由于大部分預(yù)報(bào)知識(shí)和領(lǐng)域具有密切的關(guān)系,一般都是通過地震預(yù)報(bào)專家經(jīng)驗(yàn)進(jìn)行總結(jié)的;2)具有較大的數(shù)據(jù)量。地震前兆觀測(cè)數(shù)據(jù)是通過傳感器獲得流數(shù)據(jù),其中的采樣頻率每秒一次;3)具有較強(qiáng)的實(shí)踐性。因?yàn)榈卣鹎罢最A(yù)測(cè)監(jiān)測(cè)要求具有實(shí)時(shí)性,從而方便對(duì)異?,F(xiàn)象進(jìn)行反應(yīng)。并且要求地震數(shù)據(jù)具備時(shí)序性,由于地震數(shù)據(jù)和時(shí)間具有密切的聯(lián)系,所以數(shù)據(jù)之間的時(shí)間約束關(guān)系較強(qiáng)。簡(jiǎn)單來說,地震數(shù)據(jù)和實(shí)踐具有一定的關(guān)系,其是一種時(shí)間序列數(shù)據(jù)。4)具有大量干擾,具有較強(qiáng)的隨機(jī)性及不確定因素[2]。

2.2 地震地區(qū)的相關(guān)性

地震和地質(zhì)構(gòu)造具有密切的聯(lián)系,產(chǎn)生地震的原因和板塊地震成因及內(nèi)部地震成因、地震發(fā)生時(shí)間、地點(diǎn)及強(qiáng)度具有密切的聯(lián)系。在地震預(yù)報(bào)科學(xué)中,通過長(zhǎng)時(shí)間的觀測(cè)研究及經(jīng)驗(yàn)積累,專家表示的大范圍地震活動(dòng)高漲或者平靜的時(shí)候,此地區(qū)地震活動(dòng)具有同步漲落。此種距離的兩個(gè)地區(qū)中某個(gè)指定震級(jí)以上顯著地震相伴的現(xiàn)象就是地震相關(guān)現(xiàn)象,也就是地震地區(qū)相關(guān)性。比如華北北部三個(gè)地震活動(dòng)區(qū),圖1為中山、東區(qū)及西區(qū)的范圍,使用此三個(gè)相關(guān)地區(qū)中,做出圖2的地震震級(jí)時(shí)間關(guān)系圖。通過圖中表示,在中區(qū)存在震級(jí)發(fā)生地震前后,和其相鄰的東區(qū)和西區(qū)都有發(fā)生地震。

圖1 中山、東區(qū)及西區(qū)的范圍

圖2 地震震級(jí)時(shí)間關(guān)系圖

在長(zhǎng)期觀測(cè)積累中國(guó)地震目錄中記錄了全國(guó)的地震信息,大量地震信息中具有發(fā)生地震的規(guī)律,此數(shù)據(jù)挖掘技術(shù)也是挖掘隱藏在數(shù)據(jù)知識(shí)及規(guī)律產(chǎn)生的。通過地震數(shù)據(jù),結(jié)合關(guān)聯(lián)規(guī)則挖掘算法,能夠找到其中的地震知識(shí)。具體的工作為:準(zhǔn)備數(shù)據(jù)。選擇太原臺(tái)站數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,之后將數(shù)據(jù)轉(zhuǎn)換成為滿足關(guān)聯(lián)規(guī)則挖掘算法的地震事件序列;實(shí)現(xiàn)地震時(shí)間序列關(guān)聯(lián)分析。對(duì)于通過數(shù)據(jù)整理的地震時(shí)間序列數(shù)據(jù)特征及數(shù)據(jù)量,對(duì)關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行全面的研究,使用算法實(shí)現(xiàn)關(guān)聯(lián)分析,找到不同地區(qū)地震的相關(guān)性;實(shí)驗(yàn)?zāi)M及結(jié)果評(píng)價(jià)。選擇最具代表性的地震數(shù)據(jù)實(shí)現(xiàn)模擬,對(duì)結(jié)果進(jìn)行解釋及分析[3]。

2.3 數(shù)據(jù)的獲得

太原基準(zhǔn)地震臺(tái)在華北腹部,山西中部,其為最佳的測(cè)震地段。太原臺(tái)站不僅臺(tái)址的選擇理想,而且測(cè)震設(shè)備及環(huán)境齊全。太原地震臺(tái)被流體、形變、電磁三大學(xué)科觀測(cè)手段覆蓋,每項(xiàng)觀測(cè)手段中都具有二十六個(gè)測(cè)項(xiàng)分量。觀測(cè)儀器主要包括數(shù)字石英擺傾斜儀、數(shù)字體應(yīng)變儀、數(shù)字伸縮儀、磁通門磁力儀、電離層斜測(cè)儀、數(shù)字化電阻率測(cè)量?jī)x等,摒棄臺(tái)站具有全省的流動(dòng)地磁觀測(cè)任務(wù),一共有三十五個(gè)觀測(cè)點(diǎn)。通過觀測(cè)點(diǎn)得到數(shù)據(jù)[4]。

2.4 數(shù)據(jù)預(yù)處理

首先,對(duì)數(shù)據(jù)進(jìn)行噪聲處理。利用數(shù)據(jù)清洗技術(shù)能夠?qū)Σ煌闆r中的缺失問題進(jìn)行適當(dāng)處理,在數(shù)據(jù)清洗過程中使用聚類、桶分及回歸技術(shù)實(shí)現(xiàn)異常點(diǎn)識(shí)別及平滑除燥。在地震數(shù)據(jù)中,噪聲主要包括發(fā)生地震的時(shí)間有誤、位置經(jīng)緯度有誤等。時(shí)間噪聲私用手工處理,比如將2015年12月10日16:60:00中的時(shí)間替換成為17:00。

其次,實(shí)現(xiàn)數(shù)據(jù)正規(guī)化。正規(guī)化能夠使數(shù)據(jù)屬性值從原本取值區(qū)間中到適當(dāng)區(qū)間中映射,在實(shí)現(xiàn)數(shù)據(jù)挖掘之前實(shí)現(xiàn)正規(guī)化。一般正規(guī)化包括零均值、最小最大及小樹尺度三種正規(guī)化。假設(shè)及為屬性A的最小值及最大值,那么最小最大正規(guī)化的公式為:

最后,對(duì)數(shù)據(jù)進(jìn)行變換。為了滿足關(guān)聯(lián)分析及時(shí)間序列相似性的匹配算法需求,就要對(duì)地震目錄數(shù)據(jù)根據(jù)地理區(qū)域?qū)崿F(xiàn)劃分,分別包括空間跨度、時(shí)間跨度及震級(jí)預(yù)處理,最后轉(zhuǎn)換成為根據(jù)不同參數(shù)進(jìn)行劃分排列的地震事件序列。實(shí)現(xiàn)空間跨度預(yù)處理的主要方式就是劃分地理位置,并且對(duì)其進(jìn)行分片編號(hào),使用區(qū)間標(biāo)號(hào)代替實(shí)際經(jīng)緯度數(shù)據(jù)值,從而滿足空間屬性與離散化需求,降低指定連續(xù)屬性值數(shù)量[5]。

2.5 關(guān)聯(lián)規(guī)則挖掘算法

關(guān)聯(lián)規(guī)則指的是對(duì)事物及其他事物相互關(guān)聯(lián)及依存關(guān)系的描述,關(guān)聯(lián)規(guī)則挖掘?qū)儆诠と说臄?shù)據(jù)挖掘方法,能夠?qū)ふ掖罅繑?shù)據(jù)中項(xiàng)目集的相關(guān)聯(lián)系。關(guān)聯(lián)規(guī)則挖掘步驟為:

1)尋找所有頻繁項(xiàng)集;

2)通過頻繁項(xiàng)集得到強(qiáng)關(guān)聯(lián)規(guī)則。

3 基于時(shí)間序列數(shù)據(jù)流的增量式挖掘

3.1 問題定義

因?yàn)橐褂猛诰蚪Y(jié)果對(duì)模式庫(kù)進(jìn)行更新,假如每挖掘一次就更新模式庫(kù),不僅會(huì)增加服務(wù)器負(fù)擔(dān),并且會(huì)影響到挖掘效率。本文使用內(nèi)存及外存兩級(jí)式序列模式的存儲(chǔ)結(jié)構(gòu),基于時(shí)間窗口找到最新的頻繁模式,只需要將最近出現(xiàn)的頻繁模式在內(nèi)存中存儲(chǔ),在超過數(shù)量之后,就到模式庫(kù)中發(fā)送更新,之后到內(nèi)存中將此頻繁模式去除,以此保證全部頻繁模式狀態(tài)的監(jiān)控。圖3為挖掘的步驟。

圖3 挖掘的步驟

1)基本窗口。假如BW屬于基本窗口,其對(duì)應(yīng)數(shù)據(jù)流子序列,長(zhǎng)度為bw.size=|BW|。一個(gè)基本窗口對(duì)一次模式的基本單元提取,也就是和一個(gè)時(shí)序模式集合對(duì)應(yīng)?;敬翱赽w為窗口w的分類,w為基本窗口表示的方法。

2)滑動(dòng)窗口。假如SLW屬于滑動(dòng)窗口,其和連續(xù)基本窗口序列對(duì)應(yīng),表示為SLW=bw1,bw2,bwk。

3)TPSS。對(duì)滑動(dòng)窗口中的時(shí)序模式來說,在其中的每個(gè)基本窗口都具有 TPSS[6]。

3.2 基于重要點(diǎn)分段

從時(shí)間序列中實(shí)現(xiàn)模式抽取的方法為:先分割原始時(shí)間序列,將其中的子序列轉(zhuǎn)換成為某個(gè)高級(jí)的數(shù)據(jù),之后實(shí)現(xiàn)模式發(fā)現(xiàn)。本文使用基于重要點(diǎn)分段,此方法的計(jì)算時(shí)間比較小,能夠避免時(shí)間序列受到噪聲的影響,掌握序列整體變化的特點(diǎn),其方法較為簡(jiǎn)單并且有效。重要點(diǎn)指的是序列變化過程中視覺具有主要影響的觀測(cè)點(diǎn),也就是序列匯總某部分局部極大、極小的點(diǎn),圖4為序列的重要點(diǎn)。

圖4 序列的重要點(diǎn)

假設(shè) S= < X1=(v1,t1),..,Xn=(vn,tn) > 屬于時(shí)間序列,其中的v1指的是時(shí)間t1中的觀測(cè)值,本文假設(shè)△=1,并且t1=0。

雖然時(shí)間序列和全文序列中的基本元素具有區(qū)別,時(shí)間序列為連續(xù)取值實(shí)數(shù)構(gòu)成,全文序列為有限字符構(gòu)成。實(shí)現(xiàn)序列的分段,每個(gè)字段表示變化模式。之后在模式中實(shí)現(xiàn)相似性定義,從而實(shí)現(xiàn)符號(hào)化,最終將時(shí)間序列轉(zhuǎn)化成為符號(hào)序列。

對(duì)給定常量 R>1 及時(shí)間序列<X1=(v1,t1),..,Xn=(vn,tn)>進(jìn)行定義,假如數(shù)據(jù)點(diǎn)Xm(1≤m≤n)為主要極小點(diǎn),那么其要滿足以下需求:

在 1<m<n 的時(shí)候,下標(biāo) i及 j為 1≤i<m<j≤n。

給定常量直觀的含義就是:Xm為序列 Xi,..,xj的最小值,在此段中的兩個(gè)端點(diǎn)值比XmR大,R屬于可控制選取參數(shù),R值越大,那么被選中的相對(duì)重要點(diǎn)就會(huì)越少,時(shí)間序列線段的描述就會(huì)越粗。所以,利用R的選擇,能夠在不同精細(xì)度程度中實(shí)現(xiàn)數(shù)據(jù)挖掘。

因?yàn)槭窃跀?shù)據(jù)流中實(shí)現(xiàn)劃分,為了能夠?qū)α鬟B續(xù)性進(jìn)行保證,只要尋找小于n的重要點(diǎn),最后重要點(diǎn)后面數(shù)據(jù)在后續(xù)數(shù)據(jù)中分析。

算法Selesc_Improtant_ (S,R,SC)

輸入:時(shí)間序列S,選擇參數(shù)R;

輸出:通過重要點(diǎn)構(gòu)成序列SC;

步驟:(1)i=find_first_importmt_point(SC);

(2)if I<N and vi≥v1then i=find_minimum(i);

(3)while i<N do

(4){i=find_maximum(i)}

(5)if i<N then i=find_minmum(i)

以此表示,此算法只要掃描一次序列,在分段過程中進(jìn)行簡(jiǎn)單對(duì)比計(jì)算,不需要復(fù)雜的最小二乘法計(jì)算。并且此算法支持序列在線選擇。

以算法所獲得的重要點(diǎn)集,能夠?qū)崿F(xiàn)序列的逐段線性化,以此得出通過線段所表示的趨勢(shì)變化特征模式構(gòu)成的序列集合SC。圖5為序列分段。

圖5 序列分段

3.3 數(shù)據(jù)并行挖掘

在數(shù)據(jù)挖掘過程中不僅要考慮速度,還要考慮最近數(shù)據(jù)挖掘中挖掘,其結(jié)果的精準(zhǔn)性比靜態(tài)數(shù)據(jù)挖掘結(jié)果要差,所以要盡量提高挖掘結(jié)果。充分考慮此點(diǎn)問題,在數(shù)據(jù)挖掘過程使用并行挖掘方法,其思想為:

假如具有N+1個(gè)處理器,其中0屬于主處理器。假如TPSS具有K個(gè)基本窗口。算法在全新基本窗口中產(chǎn)生之后刪除傳統(tǒng)窗口,之后觸發(fā)模式分析。在第一次執(zhí)行算法的時(shí)候,通過挖掘模式創(chuàng)建前綴樹,并且將其在頻發(fā)模式中使用,創(chuàng)建互聯(lián)之后到處理機(jī)1中保存。之后每次觸發(fā)算法,在處理器2,..N中對(duì)此數(shù)據(jù)進(jìn)行處理,然后創(chuàng)建互聯(lián)后繼樹,之后和處理機(jī)1中的后繼樹進(jìn)行合并,并行實(shí)現(xiàn)模式挖掘,對(duì)頻繁模式前綴樹進(jìn)行更新,以頻繁模式前綴樹實(shí)現(xiàn)模式庫(kù)的封信[7]。圖6為并行挖掘模型。

圖6 并行挖掘模型

算法步驟為:

1)在SIRST中尋找最早的基本窗口線段序列;

2)對(duì)序列中每類線段序列Cidi出現(xiàn)次數(shù)進(jìn)行計(jì)算;

3)實(shí)現(xiàn)SIRST中字?jǐn)?shù)的遍歷,并且將葉子節(jié)點(diǎn)中Cidi相應(yīng)的tagj進(jìn)行修改成為tagj-Num。

在每次模式分析之后,處理器0就會(huì)對(duì)頻繁模式進(jìn)行收集,對(duì)前綴樹中的頻發(fā)模式進(jìn)行更新,之后對(duì)前綴樹進(jìn)行檢查,并且將滿足規(guī)測(cè)需求的頻繁模式到模式庫(kù)中發(fā)送實(shí)現(xiàn)模式庫(kù)更新,之后對(duì)模式前綴樹進(jìn)行調(diào)整。以此表示,每次分析序列能夠使算法效率得到提高,并且還能夠?qū)Ψ治鰰r(shí)序列完整性進(jìn)行保障,是模式庫(kù)更新頻率得到降低。

4 算法驗(yàn)證

將以上所分析的算法通過Weka數(shù)據(jù)挖掘工具實(shí)現(xiàn)驗(yàn)證,安裝Weka工具。Weka自身是以Java所編寫的,本文使用可擴(kuò)展及開放的集成開發(fā)工具Eclipse。算法驗(yàn)證的過程為:

將Weka打開,在預(yù)處理面板中加載本文所選擇的地震前兆數(shù)據(jù)。之后切換到Cluster面板中,單機(jī)Choose按鈕,就能夠到下拉菜單中實(shí)現(xiàn)DFCM算法的導(dǎo)入。單擊文本輸入框,在所彈出的對(duì)象編輯器中使epsilon參數(shù)設(shè)置為0.5。之后單擊Ignore,在彈出的Select窗口中選擇time屬性,關(guān)閉此窗口。在Result中右擊結(jié)果列表中的新添加條目,在彈出的菜單中選擇簇分配可視化菜單,Weka就會(huì)彈出可視化窗口,可視化界面的結(jié)果利用坐標(biāo)選擇不同測(cè)項(xiàng),以此顯示所有的結(jié)果。

根據(jù)以上步驟,通過多次的參數(shù)選擇,將DFCM兩個(gè)關(guān)鍵參數(shù)進(jìn)行反復(fù)的設(shè)置對(duì)比,以臺(tái)站測(cè)試需求,每年使監(jiān)測(cè)儀器調(diào)整為相對(duì)零值,并且每年的數(shù)據(jù)分布形態(tài)相同,實(shí)驗(yàn)聚類數(shù)量為6,閾值為0.5。圖7為聚類結(jié)果。

圖7 聚類結(jié)果

通過圖7可以看出來,中間的黃色部分?jǐn)?shù)據(jù)為聚類質(zhì)心群,以顏色對(duì)數(shù)據(jù)程度進(jìn)行區(qū)分,黃色為0.8~1.0,淺黃色為0.6~0.8,此種顏色的數(shù)據(jù)為此簇類?;疑珵?.4~0.6,淺藍(lán)色為0.2~0.4,其隸屬簇權(quán)值較大,標(biāo)記藍(lán)色數(shù)據(jù)為0.0~0.2,此屬于此類以外數(shù)值,以此為相對(duì)孤立值。

對(duì)測(cè)項(xiàng)進(jìn)行總結(jié),2012年~2017年的數(shù)據(jù)異常結(jié)果詳見表1。

表1 前兆數(shù)據(jù)的檢測(cè)結(jié)果

本文一共選擇了十三個(gè)測(cè)項(xiàng)中的十二測(cè)項(xiàng)數(shù)據(jù)實(shí)現(xiàn)分析,為2791天的數(shù)據(jù)記錄,以實(shí)驗(yàn)過程選擇聚類結(jié)果較好的參數(shù)閾值0.3和0.5實(shí)現(xiàn)結(jié)果羅列,得到前兆數(shù)據(jù)處理結(jié)果。通過結(jié)果分析,其中2231、2232、2241、2242、2243、2244、9140的檢測(cè)結(jié)果良好,從聚類時(shí)間分析,六年的數(shù)據(jù)記錄時(shí)間為395.53 s。以此表示,從時(shí)間及結(jié)果方面,本文所研究的方法具有實(shí)際意義[8]。

5 結(jié)束語(yǔ)

地震前兆數(shù)據(jù)觀測(cè)項(xiàng)較多,并且種類較為繁多,跨越的時(shí)間較短,來自于不同技術(shù)系統(tǒng)。另外,因?yàn)榉N種原因,導(dǎo)致目前實(shí)際數(shù)據(jù)集較為混亂。實(shí)現(xiàn)此數(shù)據(jù)的聯(lián)合使用及長(zhǎng)時(shí)間的數(shù)據(jù)分析,傳統(tǒng)數(shù)據(jù)分析方法已經(jīng)無法滿足需求。大數(shù)據(jù)分析思路為使用前兆數(shù)據(jù)提供了全新的模式,通過此全新的思路,和地震前兆觀測(cè)物理意義相互結(jié)合,能夠從其中挖掘有用的規(guī)律及信息,對(duì)于前兆觀測(cè)地震及研究其他地震問題都有重要的現(xiàn)實(shí)意義。通過大數(shù)據(jù)研究思想,能夠?qū)η罢讛?shù)據(jù)傳統(tǒng)使用及研究模式進(jìn)行創(chuàng)新,不管是前兆數(shù)據(jù)推廣使用,還是使用其進(jìn)行科學(xué)研究,都是有意義的嘗試。

猜你喜歡
前兆數(shù)據(jù)挖掘觀測(cè)
改進(jìn)支持向量機(jī)在特征數(shù)據(jù)挖掘中的智能應(yīng)用
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
基于事故數(shù)據(jù)挖掘的AEB路口測(cè)試場(chǎng)景
論春秋時(shí)期天命觀的變遷及其新標(biāo)準(zhǔn)
天文動(dòng)手做——觀測(cè)活動(dòng)(21) 軟件模擬觀測(cè)星空
九江臺(tái)前兆儀器監(jiān)控軟件
2018年18個(gè)值得觀測(cè)的營(yíng)銷趨勢(shì)
軟件工程領(lǐng)域中的異常數(shù)據(jù)挖掘算法
可觀測(cè)宇宙
高分辨率對(duì)地觀測(cè)系統(tǒng)