国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

探討地震前兆觀測(cè)中的大數(shù)據(jù)挖掘與應(yīng)用1

2015-01-28 19:23:39王秀英張玲張聰聰
震災(zāi)防御技術(shù) 2015年1期
關(guān)鍵詞:前兆數(shù)據(jù)量數(shù)據(jù)挖掘

王秀英張 玲張聰聰

1)中國(guó)地震局地殼應(yīng)力研究所,北京 100085

2)山東省地震局,濟(jì)南 250012

探討地震前兆觀測(cè)中的大數(shù)據(jù)挖掘與應(yīng)用1

王秀英1)張 玲2)張聰聰1)

1)中國(guó)地震局地殼應(yīng)力研究所,北京 100085

2)山東省地震局,濟(jì)南 250012

大數(shù)據(jù)挖掘研究與應(yīng)用是當(dāng)今的熱點(diǎn)問(wèn)題。本文簡(jiǎn)要概括了大數(shù)據(jù)研究的基本思想,分析了地震監(jiān)測(cè)中前兆觀測(cè)數(shù)據(jù)大數(shù)據(jù)研究的必要性,并設(shè)計(jì)了幾種前兆觀測(cè)大數(shù)據(jù)研究在地震行業(yè)內(nèi)部的可能應(yīng)用方向和具體應(yīng)用問(wèn)題,以期能夠推動(dòng)前兆觀測(cè)數(shù)據(jù)利用大數(shù)據(jù)研究思想的創(chuàng)新應(yīng)用和研究工作。

大數(shù)據(jù) 前兆觀測(cè)數(shù)據(jù) 隱含信息 數(shù)據(jù)挖掘 行業(yè)應(yīng)用

王秀英,張玲,張聰聰,2015.探討地震前兆觀測(cè)中的大數(shù)據(jù)挖掘與應(yīng)用.震災(zāi)防御技術(shù),10(1):39—45. doi:10.11899/zzfy20150104

引言

隨著計(jì)算機(jī)、數(shù)據(jù)庫(kù)以及后來(lái)的物聯(lián)網(wǎng)、云計(jì)算等技術(shù)的發(fā)展和普及,各行業(yè)的數(shù)據(jù)量都呈爆炸式增長(zhǎng),然而數(shù)據(jù)量的激增并未使信息量也呈現(xiàn)同樣態(tài)勢(shì)的增長(zhǎng),出現(xiàn)了所謂“數(shù)據(jù)過(guò)剩,信息貧乏”的局面。正是基于這種原因,從大量數(shù)據(jù)中發(fā)掘其中隱含的信息并從中獲取收益,已成為當(dāng)前信息技術(shù)研究的焦點(diǎn)問(wèn)題。大數(shù)據(jù)不僅僅提供信息,也可能成為一種資源,從而改變?nèi)藗兊乃季S和生產(chǎn)方式,麥肯錫全球研究所的研究報(bào)告指出:“大數(shù)據(jù)是下一個(gè)創(chuàng)新、競(jìng)爭(zhēng)、生產(chǎn)力提高的前沿”(McKinsey Global Institute,2011)。有鑒于此,最近幾年很多行業(yè)都開始關(guān)注大數(shù)據(jù)和數(shù)據(jù)挖掘的研究和應(yīng)用,并且在某些行業(yè)已取得了比較明顯的應(yīng)用效果和生產(chǎn)效益。

國(guó)外有關(guān)大數(shù)據(jù)的挖掘應(yīng)用研究開展得較早,各行業(yè)甚至政府部門都已開展了這方面的研究工作(涂子沛,2013)。而國(guó)內(nèi)相關(guān)研究起步相對(duì)較晚,還比較零散和缺少系統(tǒng)性。但隨著人們對(duì)大數(shù)據(jù)認(rèn)識(shí)的提高,最近兩年國(guó)內(nèi)的研究發(fā)展很快,然而目前的研究更多的集中在大數(shù)據(jù)挖掘方法和算法方面,與具體行業(yè)尤其是科研行業(yè)相結(jié)合的應(yīng)用研究成果還不多見。

隨著大數(shù)據(jù)概念的普及和更多應(yīng)用成果的取得,大數(shù)據(jù)挖掘技術(shù)在地震行業(yè)的應(yīng)用正被更多行業(yè)專家和研究人員所關(guān)注。地震行業(yè)的大數(shù)據(jù)應(yīng)用可以首先從地震監(jiān)測(cè)數(shù)據(jù)的研究開始。就地震監(jiān)測(cè)中的前兆觀測(cè)而言,經(jīng)過(guò)多年的建設(shè)發(fā)展,特別是“九五”數(shù)字化改造項(xiàng)目和“十五”數(shù)字地震觀測(cè)網(wǎng)絡(luò)項(xiàng)目以來(lái),已形成一個(gè)覆蓋全國(guó)范圍的多學(xué)科、多測(cè)項(xiàng)的智能化前兆網(wǎng)絡(luò)觀測(cè)系統(tǒng),在觀測(cè)技術(shù)方面已經(jīng)有了一個(gè)質(zhì)的飛躍。數(shù)字化后的地震前兆觀測(cè)數(shù)據(jù)產(chǎn)出,無(wú)論從采樣率和采樣精度上都有大幅提高,使觀測(cè)數(shù)據(jù)量激增。目前,前兆觀測(cè)系統(tǒng)在數(shù)據(jù)生產(chǎn)環(huán)節(jié)的數(shù)據(jù)采集、匯集、數(shù)據(jù)同步已實(shí)現(xiàn)自動(dòng)完成,大大減少了臺(tái)網(wǎng)工作人員的工作強(qiáng)度。但在產(chǎn)出數(shù)據(jù)加工處理和應(yīng)用方法方面還沒有特別的進(jìn)展,尤其在數(shù)據(jù)加工處理環(huán)節(jié),大都靠人機(jī)交互方式完成,由于測(cè)項(xiàng)多、采樣率高,前兆臺(tái)網(wǎng)中心每日有大量觀測(cè)數(shù)據(jù)需要處理,半人工方式的數(shù)據(jù)處理使臺(tái)網(wǎng)工作人員每日工作量巨大,效率不高,而且很難保證處理結(jié)果的客觀性。在數(shù)據(jù)應(yīng)用環(huán)節(jié),雖然前兆觀測(cè)產(chǎn)出數(shù)據(jù)量較模擬人工觀測(cè)有幾個(gè)數(shù)量級(jí)的差異,但相應(yīng)的數(shù)據(jù)處理方法并沒有隨著觀測(cè)資料的改善而有大的改觀,大都還在沿襲模擬和人工觀測(cè)時(shí)的方法,更多時(shí)候是由高頻采樣率數(shù)據(jù)提取低頻采樣率數(shù)據(jù)進(jìn)行應(yīng)用,導(dǎo)致數(shù)據(jù)的應(yīng)用效果和效率并沒有得到更大的提高。

大數(shù)據(jù)研究應(yīng)用的發(fā)展趨勢(shì)及地震行業(yè)的應(yīng)用需求,使我們認(rèn)識(shí)到在地震監(jiān)測(cè)領(lǐng)域開展地震行業(yè)的大數(shù)據(jù)應(yīng)用研究的必要性和迫切性。本文將就大數(shù)據(jù)研究的基本思想、前兆觀測(cè)大數(shù)據(jù)分析的可行性以及可能的研究工作進(jìn)行討論,以期對(duì)前兆觀測(cè)數(shù)據(jù)的大數(shù)據(jù)應(yīng)用研究工作有所推進(jìn)。

1 大數(shù)據(jù)研究簡(jiǎn)介

所謂大數(shù)據(jù),從字面理解是指數(shù)據(jù)量特別巨大的數(shù)據(jù),往往需要特殊的存儲(chǔ)和處理方法,目前對(duì)于大數(shù)據(jù)尚未有一個(gè)公認(rèn)的定義。這里需要特別指出的是:大數(shù)據(jù)中的“大”不是絕對(duì)意義上的大,是個(gè)相對(duì)的概念,更多是思考問(wèn)題、研究問(wèn)題的思路和觀念的轉(zhuǎn)變,強(qiáng)調(diào)的是使用全部數(shù)據(jù)。就地震前兆觀測(cè)而言,其數(shù)據(jù)產(chǎn)出同互聯(lián)網(wǎng)信息業(yè)數(shù)據(jù)產(chǎn)出相比,微不足道;但就行業(yè)自身而言,同人工和模擬觀測(cè)時(shí)代的數(shù)據(jù)產(chǎn)出相比,無(wú)論從觀測(cè)數(shù)據(jù)種類、觀測(cè)覆蓋范圍、觀測(cè)數(shù)據(jù)累積時(shí)間等方面都達(dá)到了前所未有的程度,數(shù)據(jù)量呈幾十倍、上千倍甚至上萬(wàn)倍的增加,數(shù)據(jù)量不可謂不大。數(shù)據(jù)的量變伴隨而來(lái)的就是對(duì)數(shù)據(jù)存儲(chǔ)和處理及應(yīng)用方法的改變,產(chǎn)生了與大數(shù)據(jù)相關(guān)的各種技術(shù)及應(yīng)用思想。

維克托·邁爾·舍恩伯格等(2012)在《大數(shù)據(jù)時(shí)代》中指出:“大數(shù)據(jù)是指不用隨機(jī)分析法(小樣本抽樣)這樣的捷徑,而采用所有數(shù)據(jù)的方法”。即讓數(shù)據(jù)自身說(shuō)話,從大量的數(shù)據(jù)中發(fā)現(xiàn)“相關(guān)關(guān)系”,不再追求“因果關(guān)系”。它與局限在小數(shù)據(jù)范圍相比,使用一切數(shù)據(jù)帶來(lái)了更高的精確性,可以讓我們看到一些以前無(wú)法發(fā)現(xiàn)的細(xì)節(jié),更清楚地看到樣本數(shù)據(jù)無(wú)法揭示的細(xì)節(jié)信息。但相比于小數(shù)據(jù)和精確性,大數(shù)據(jù)更強(qiáng)調(diào)數(shù)據(jù)完整性和混雜性。小數(shù)據(jù)使我們的視野局限在可以分析和確定方面,導(dǎo)致對(duì)世界的整體理解可能產(chǎn)生偏差和錯(cuò)誤,而大數(shù)據(jù)則可以使我們從不同角度更細(xì)致地觀察和研究數(shù)據(jù)的方方面面。

大數(shù)據(jù)研究主要涉及數(shù)據(jù)存儲(chǔ)、管理和分析,但對(duì)于更多應(yīng)用行業(yè)和領(lǐng)域,對(duì)大數(shù)據(jù)的發(fā)掘、分析和應(yīng)用研究是其更為關(guān)注的內(nèi)容。在具備大量數(shù)據(jù)的前提下,如何從這些數(shù)據(jù)中發(fā)掘出有價(jià)值的信息是數(shù)據(jù)挖掘工作的目標(biāo)。面對(duì)大量甚至海量數(shù)據(jù),針對(duì)小量數(shù)據(jù)的傳統(tǒng)數(shù)據(jù)分析技術(shù)存在種種局限,數(shù)據(jù)挖掘技術(shù)則可以突破這些局限,它是在已有分析方法的基礎(chǔ)上,不斷引入新的概念和方法,以實(shí)現(xiàn)信息發(fā)掘的最終目的?,F(xiàn)在的數(shù)據(jù)發(fā)掘中有一些經(jīng)典的主題和算法,如:分類、關(guān)聯(lián)分析、聚類分析、異常檢測(cè)等,這在相關(guān)的各類圖書中都有介紹(Tan等,2013)。而目前的數(shù)據(jù)挖掘研究主要集中于此類算法研究,這些方法和算法是大數(shù)據(jù)挖掘研究與行業(yè)數(shù)據(jù)和專業(yè)概念相結(jié)合的研究與應(yīng)用的基礎(chǔ)。目前的算法研究已取得一定進(jìn)展,更多的行業(yè)應(yīng)用及與行業(yè)結(jié)合的具體研究方向和問(wèn)題亟待拓展。將大數(shù)據(jù)的思想引入具體行業(yè)應(yīng)用時(shí),需結(jié)合行業(yè)特點(diǎn)、數(shù)據(jù)特點(diǎn)、具體應(yīng)用需求,設(shè)計(jì)需要解決的問(wèn)題,利用已有算法成果(必要時(shí)可能結(jié)合行業(yè)特點(diǎn)研究新的算法)對(duì)行業(yè)數(shù)據(jù)展開大數(shù)據(jù)的挖掘工作,并對(duì)研究結(jié)果從專業(yè)角度進(jìn)行分析與解釋,從而實(shí)現(xiàn)與傳統(tǒng)方法完全不同的數(shù)據(jù)應(yīng)用方法,當(dāng)然也可能產(chǎn)生意想不到的效果。

2 前兆觀測(cè)大數(shù)據(jù)應(yīng)用的必要性分析

地震前兆觀測(cè)是對(duì)與地震孕育發(fā)生相關(guān)的各種物理量/化學(xué)量展開的連續(xù)監(jiān)測(cè),是進(jìn)行地震預(yù)測(cè)和其它地球科學(xué)相關(guān)研究的基礎(chǔ)。無(wú)論進(jìn)行地震預(yù)報(bào)還是地球物理科學(xué)研究,都需要長(zhǎng)時(shí)間觀測(cè)數(shù)據(jù)的積累作為研究基礎(chǔ)。進(jìn)行大數(shù)據(jù)研究,更需要大量數(shù)據(jù)作支撐。就地震前兆觀測(cè)而言,大數(shù)據(jù)體現(xiàn)在兩個(gè)層面:一是觀測(cè)的橫向廣度方面;二是觀測(cè)的縱向深度方面。前者可以理解為觀測(cè)數(shù)據(jù)覆蓋范圍的廣闊性、觀測(cè)手段種類的多樣性;后者則可以理解為觀測(cè)數(shù)據(jù)時(shí)間跨度的長(zhǎng)期性。因此,應(yīng)該從這兩個(gè)方面來(lái)分析展開前兆觀測(cè)大數(shù)據(jù)應(yīng)用研究的必要性。

首先從觀測(cè)的橫向廣度上看,目前我國(guó)在全國(guó)范圍建立了由近千個(gè)地震前兆臺(tái)站、近3000套觀測(cè)儀器組成的地震前兆觀測(cè)網(wǎng)絡(luò)系統(tǒng)(周克昌等,2013)。這些觀測(cè)手段按學(xué)科可以分為流體、形變、電磁三大學(xué)科,每個(gè)學(xué)科有多種觀測(cè)測(cè)項(xiàng),而每種觀測(cè)測(cè)項(xiàng)又有一種到多種測(cè)項(xiàng)分量,最終的觀測(cè)數(shù)據(jù)是以測(cè)項(xiàng)分量的形式保存于數(shù)據(jù)庫(kù)中,所以最終數(shù)據(jù)用戶看到的數(shù)據(jù)類型非常之多。除觀測(cè)數(shù)據(jù)外,還有與觀測(cè)數(shù)據(jù)伴隨的各類輔助資料,如:觀測(cè)環(huán)境、場(chǎng)地條件、觀測(cè)背景情況、觀測(cè)儀器信息、觀測(cè)日志記錄等,也屬于廣義的觀測(cè)數(shù)據(jù)資料。另外,如果將空間對(duì)地觀測(cè)中產(chǎn)出的GPS、InSAR等不同數(shù)據(jù)源的觀測(cè)資料、流動(dòng)觀測(cè)、地方企業(yè)臺(tái)網(wǎng)臺(tái)站產(chǎn)出的數(shù)據(jù)資料也一并考慮的話,則數(shù)據(jù)類型更加豐富多樣,數(shù)據(jù)源及數(shù)據(jù)結(jié)構(gòu)也各不相同。不僅是數(shù)據(jù)類型多樣,前兆觀測(cè)數(shù)據(jù)同時(shí)也呈現(xiàn)多區(qū)域、多臺(tái)站、多測(cè)點(diǎn)、多型號(hào)觀測(cè)儀器產(chǎn)出數(shù)據(jù)并存的情況,這些分類及其組合使得數(shù)據(jù)呈現(xiàn)多屬性的特點(diǎn)。還有,各種觀測(cè)手段依據(jù)觀測(cè)和應(yīng)用目的不同,數(shù)據(jù)產(chǎn)出有不同的采樣率和采樣間隔,雖然大多數(shù)觀測(cè)數(shù)據(jù)為等時(shí)間間隔的采樣,也有少數(shù)不等時(shí)間間隔的產(chǎn)出數(shù)據(jù),這種特性決定了數(shù)據(jù)形式、數(shù)據(jù)結(jié)構(gòu)的多樣性。此外,不同時(shí)期觀測(cè)系統(tǒng)的觀測(cè)數(shù)據(jù)并存,即同一種觀測(cè)測(cè)項(xiàng)數(shù)據(jù),但由不同時(shí)期的觀測(cè)系統(tǒng)產(chǎn)出,在數(shù)據(jù)精度和采樣率、甚至物理量綱上都有差異,這些數(shù)據(jù)同時(shí)存在,這種情況決定了數(shù)據(jù)在某種程度上的重復(fù)性、不一致性,甚至有些時(shí)候可能導(dǎo)致數(shù)據(jù)的雜亂性。當(dāng)將這些數(shù)據(jù)一起使用時(shí),傳統(tǒng)的方法顯然無(wú)法勝任,而這種情況正是大數(shù)據(jù)挖掘技術(shù)中經(jīng)常面對(duì)的數(shù)據(jù)源情況。

其次,從前兆觀測(cè)時(shí)間跨度來(lái)看,我國(guó)地震前兆觀測(cè)始于邢臺(tái)地震后,由最初的模擬觀測(cè)、人工觀測(cè),到“九五”數(shù)字化改造后的數(shù)字觀測(cè),再到“十五”數(shù)字地震觀測(cè)網(wǎng)絡(luò)項(xiàng)目后的網(wǎng)絡(luò)化觀測(cè),其間歷經(jīng)近50年的時(shí)間,積累了相當(dāng)長(zhǎng)時(shí)間跨度的觀測(cè)資料。但數(shù)字化之前的觀測(cè)資料大都為模擬或人工讀數(shù),數(shù)據(jù)保存比較分散,雖然各省都在致力于收集這部分資料并以數(shù)據(jù)庫(kù)的方式集中管理,相較于數(shù)字化數(shù)據(jù)的數(shù)據(jù)庫(kù)集中保存方式,這部分?jǐn)?shù)據(jù)的完整獲取比較困難,而且在數(shù)據(jù)量上相對(duì)于數(shù)字化數(shù)據(jù)而言非常少。前兆觀測(cè)系統(tǒng)自“九五”數(shù)字化改造后的數(shù)據(jù)產(chǎn)出,都是以數(shù)據(jù)庫(kù)方式保存管理,獲取和使用非常方便?!熬盼濉睌?shù)字化產(chǎn)出的數(shù)據(jù),最早始于1998年,至今已有15年以上的數(shù)字化數(shù)據(jù)積累;“十五”以來(lái)的觀測(cè)數(shù)據(jù)資料,大都始于2007年前后,至今也有8年時(shí)間的資料量。從時(shí)間跨度上看,僅就數(shù)字化觀測(cè)以來(lái)15年時(shí)長(zhǎng)的數(shù)據(jù)資料,對(duì)于地震預(yù)報(bào)和相關(guān)科學(xué)研究而言,初步具備了長(zhǎng)中短期預(yù)報(bào)和相關(guān)研究的基礎(chǔ);與地震資料聯(lián)合,可以提供較為充分的地震發(fā)生前、發(fā)生中和發(fā)生后各種前兆量征兆的孕育、變化過(guò)程。而由時(shí)間軸分析前兆觀測(cè)資料時(shí),存在數(shù)據(jù)缺失不連續(xù)、儀器停測(cè)復(fù)測(cè)、觀測(cè)地點(diǎn)變更、觀測(cè)測(cè)項(xiàng)更換、數(shù)據(jù)類型格式繁雜等問(wèn)題,導(dǎo)致觀測(cè)數(shù)據(jù)的混雜性。顯然,傳統(tǒng)數(shù)據(jù)分析不僅在長(zhǎng)時(shí)段、大數(shù)據(jù)量的數(shù)據(jù)處理時(shí)存在問(wèn)題,對(duì)于觀測(cè)數(shù)據(jù)隨時(shí)間變化導(dǎo)致的數(shù)據(jù)混雜性也不能勝任,只能利用新方法來(lái)解決這種復(fù)雜的情況,為此引入大數(shù)據(jù)研究中的處理方法勢(shì)在必行。

3 前兆觀測(cè)大數(shù)據(jù)挖掘應(yīng)用

地震前兆觀測(cè)數(shù)據(jù)按照從產(chǎn)出到應(yīng)用的數(shù)據(jù)流程可以分為以下兩個(gè)階段:

(1)數(shù)據(jù)生產(chǎn)、數(shù)據(jù)產(chǎn)品加工階段

這個(gè)環(huán)節(jié)對(duì)應(yīng)于儀器觀測(cè)數(shù)據(jù)采集、數(shù)據(jù)匯集同步到數(shù)據(jù)庫(kù);對(duì)數(shù)據(jù)進(jìn)行的前期處理工作,如突跳等問(wèn)題數(shù)據(jù)去除;數(shù)據(jù)產(chǎn)品的提取保存,如:提取日均值、5日均值等數(shù)據(jù)產(chǎn)品;數(shù)據(jù)的檢驗(yàn)測(cè)試等工作。這一環(huán)節(jié)為后續(xù)數(shù)據(jù)應(yīng)用提供必要的基礎(chǔ)和保證。

(2)數(shù)據(jù)及其產(chǎn)品的應(yīng)用階段

數(shù)據(jù)及產(chǎn)品的應(yīng)用又可以分為預(yù)報(bào)應(yīng)用和其它地球科學(xué)研究應(yīng)用。目前的應(yīng)用主要為地震預(yù)報(bào)的日常分析應(yīng)用,以及學(xué)科研究和其它的研究應(yīng)用。在這個(gè)環(huán)節(jié)需要結(jié)合數(shù)學(xué)方法和更專業(yè)的學(xué)科方法和模型對(duì)數(shù)據(jù)作深入剖析研究,以期從中得到更多信息和啟示。

下面按照這兩個(gè)應(yīng)用階段對(duì)大數(shù)據(jù)研究在其中的可能應(yīng)用,作簡(jiǎn)要討論。

3.1 數(shù)據(jù)生產(chǎn)加工階段的應(yīng)用

(1)數(shù)據(jù)質(zhì)量控制

觀測(cè)數(shù)據(jù)的質(zhì)量直接決定了數(shù)據(jù)是否具有應(yīng)用價(jià)值,能否產(chǎn)出有用信息,因此對(duì)觀測(cè)數(shù)據(jù)的質(zhì)量評(píng)價(jià)、質(zhì)量控制是前兆臺(tái)網(wǎng)中心非常重要的一項(xiàng)工作。目前的質(zhì)量評(píng)價(jià)辦法,更多靠人工方式,存在很大主觀性。通過(guò)將大數(shù)據(jù)研究思想的引入,對(duì)更多測(cè)項(xiàng)、更長(zhǎng)時(shí)段觀測(cè)數(shù)據(jù)的梳理分析與比較,可以探索更客觀的數(shù)據(jù)評(píng)價(jià)方法和實(shí)現(xiàn)模型。另外,通過(guò)對(duì)大數(shù)據(jù)量的分析可以確定比較突出的數(shù)據(jù)問(wèn)題,明確觀測(cè)系統(tǒng)的改進(jìn)方向。這些對(duì)于前兆觀測(cè)數(shù)據(jù)的質(zhì)量評(píng)價(jià)和控制具有重要意義。

(2)觀測(cè)儀器評(píng)價(jià)

觀測(cè)數(shù)據(jù)產(chǎn)自觀測(cè)儀器,觀測(cè)數(shù)據(jù)中攜帶了與儀器相關(guān)的各類信息,如:觀測(cè)數(shù)據(jù)精度、分辨率等技術(shù)指標(biāo);還有儀器運(yùn)行中可能會(huì)發(fā)生改變的各項(xiàng)參數(shù),如:儀器時(shí)鐘精度,儀器運(yùn)行穩(wěn)定性等一系列對(duì)觀測(cè)儀器評(píng)價(jià)具有重要意義的參數(shù)。通過(guò)對(duì)某類儀器大量產(chǎn)出觀測(cè)數(shù)據(jù)的挖掘分析,可以對(duì)儀器的技術(shù)指標(biāo)、整體運(yùn)行效率給予客觀公正的評(píng)價(jià)。

(3)“異?!睌?shù)據(jù)檢測(cè)

這里的“異?!辈⒎侵傅卣鹎罢桩惓?,而是指異于常規(guī)情況的數(shù)據(jù)。前兆觀測(cè)系統(tǒng)受各種各樣因素的影響,導(dǎo)致觀測(cè)數(shù)據(jù)出現(xiàn)這樣或那樣的問(wèn)題,在數(shù)據(jù)應(yīng)用前需要對(duì)這些問(wèn)題數(shù)據(jù)進(jìn)行前期處理。大數(shù)據(jù)量的應(yīng)用時(shí),問(wèn)題數(shù)據(jù)的檢測(cè)靠人工方式幾乎沒有短時(shí)間完成的可能。利用大數(shù)據(jù)挖掘的方法快速批量定位問(wèn)題數(shù)據(jù),大大減少數(shù)據(jù)檢查的時(shí)間,方法成熟時(shí),甚至可以實(shí)現(xiàn)數(shù)據(jù)問(wèn)題的自動(dòng)處理(張聰聰?shù)龋?014)。

(4)預(yù)測(cè)預(yù)警模型(在線異常報(bào)警)

利用在線數(shù)據(jù)分析技術(shù),對(duì)儀器產(chǎn)出數(shù)據(jù)進(jìn)行預(yù)測(cè),并與實(shí)時(shí)產(chǎn)出數(shù)據(jù)比較,超過(guò)規(guī)定范圍后,發(fā)出報(bào)警信息。通過(guò)這種在線異常報(bào)警的應(yīng)用,一方面對(duì)于儀器產(chǎn)出數(shù)據(jù)質(zhì)量的控制具有至關(guān)重要的意義;另一方面,對(duì)于一些突發(fā)狀況可以起到檢測(cè)突發(fā)事件的作用,便于問(wèn)題的及時(shí)發(fā)現(xiàn)和問(wèn)題的快速解決,提高數(shù)據(jù)連續(xù)率,最終目的是提高了觀測(cè)數(shù)據(jù)的質(zhì)量。

(5)偽數(shù)據(jù)檢測(cè)

對(duì)觀測(cè)數(shù)據(jù)造假,人為提高數(shù)據(jù)質(zhì)量,以取得好的評(píng)比成績(jī),這種情況在人工讀數(shù)、模擬觀測(cè)時(shí)代就存在,在數(shù)字化觀測(cè)的今天仍有發(fā)生。人為假造數(shù)據(jù),即使造假時(shí)參考了以往產(chǎn)出數(shù)據(jù),總會(huì)受人的主觀思想的影響,尤其在較大數(shù)據(jù)量造假時(shí),會(huì)存在與儀器自然產(chǎn)出數(shù)據(jù)不同的模式。利用大數(shù)據(jù)的分析方法,將所有觀測(cè)時(shí)段的觀測(cè)數(shù)據(jù)進(jìn)行分析,會(huì)發(fā)現(xiàn)某些數(shù)據(jù)存在修改的痕跡,進(jìn)而將真實(shí)觀測(cè)數(shù)據(jù)與人為修改數(shù)據(jù)區(qū)別開。

3.2 數(shù)據(jù)的應(yīng)用

(1)觀測(cè)數(shù)據(jù)自身規(guī)律研究

地震前兆觀測(cè)由模擬、人工觀測(cè)向數(shù)字化觀測(cè)改進(jìn)后,不僅是技術(shù)上的一個(gè)飛躍,更為重要的是數(shù)據(jù)質(zhì)量的飛躍,觀測(cè)數(shù)據(jù)精度和采樣率都有大幅提高,這對(duì)于觀測(cè)數(shù)據(jù)的拓展應(yīng)用至關(guān)重要。高精度觀測(cè)數(shù)據(jù)有助于分辨觀測(cè)對(duì)象更為細(xì)微的變化,而高采樣率觀測(cè)數(shù)據(jù)則攜帶了更多高頻信息。高精度、高頻的觀測(cè)數(shù)據(jù)雖然攜帶了觀測(cè)對(duì)象更多細(xì)節(jié)信息,同時(shí)也攜帶了更多干擾信息,使得觀測(cè)數(shù)據(jù)的變化更加不確定,簡(jiǎn)單分析方法已經(jīng)不能滿足實(shí)際數(shù)據(jù)需求。借助于大數(shù)據(jù)的研究方法,通過(guò)定義不同模式,或者定義不同的特征量,或者采用不同的數(shù)據(jù)降維方法,去發(fā)現(xiàn)不同維度下觀測(cè)數(shù)據(jù)所攜帶的隱含規(guī)律和信息,是前兆觀測(cè)數(shù)據(jù)進(jìn)行預(yù)報(bào)和科學(xué)研究應(yīng)用的基礎(chǔ)。這種數(shù)據(jù)研究目前可以主要集中于:?jiǎn)螠y(cè)項(xiàng)觀測(cè)數(shù)據(jù)長(zhǎng)時(shí)間觀測(cè)時(shí)自身規(guī)律的探究、不同測(cè)項(xiàng)間相關(guān)性(關(guān)聯(lián)規(guī)則)研究、輔助觀測(cè)與學(xué)科專業(yè)觀測(cè)之間相關(guān)性研究、同一測(cè)項(xiàng)不同觀測(cè)點(diǎn)數(shù)據(jù)之間相關(guān)性分析、不同測(cè)項(xiàng)同一觀測(cè)點(diǎn)觀測(cè)數(shù)據(jù)之間相關(guān)性研究等。

(2)觀測(cè)數(shù)據(jù)預(yù)報(bào)應(yīng)用

前兆數(shù)據(jù)用于地震預(yù)報(bào),大都以出現(xiàn)某類異常作為可能發(fā)生地震的依據(jù),這里的異常大都靠人為判斷,更多借助于經(jīng)驗(yàn)和感覺,存在很多主觀成分。這種異常和地震對(duì)應(yīng)關(guān)系的關(guān)聯(lián)程度如何,至今無(wú)人做過(guò)深入的計(jì)算和分析。長(zhǎng)時(shí)段數(shù)字化前兆觀測(cè)數(shù)據(jù)和地震信息的積累,使得數(shù)據(jù)異常和地震的關(guān)聯(lián)性分析成為可能。對(duì)前兆數(shù)據(jù)進(jìn)行多種模式提取,計(jì)算其與地震的相關(guān)關(guān)系,利用相關(guān)性更高的模式進(jìn)行預(yù)報(bào),無(wú)疑會(huì)提高預(yù)報(bào)的準(zhǔn)確性,更為重要的是模式提取按照統(tǒng)一的方法,消除了人為判定的主觀性。除單測(cè)項(xiàng)關(guān)聯(lián)規(guī)則外,還可以任意組合前兆觀測(cè)測(cè)項(xiàng)進(jìn)行地震的相關(guān)性分析。這項(xiàng)工作以人工方式展開幾乎是不可能實(shí)現(xiàn)的,只能依靠大數(shù)據(jù)計(jì)算的方式實(shí)現(xiàn)。與此對(duì)應(yīng)的另一種應(yīng)用,也是目前前兆數(shù)據(jù)應(yīng)用中常用的方法,地震發(fā)生后再去確定或?qū)ふ抑暗那罢讛?shù)據(jù)異常。利用地震發(fā)生的時(shí)間,去檢測(cè)之前的前兆數(shù)據(jù)各種可能的模式,出現(xiàn)頻率最高的模式對(duì)于將來(lái)的地震預(yù)報(bào)更有意義。這也需要大數(shù)據(jù)量的計(jì)算和比較才能找到有意義的結(jié)果。

在利用前兆觀測(cè)進(jìn)行地震預(yù)報(bào)研究的多年實(shí)踐工作中,研究人員總結(jié)了大量方法和經(jīng)驗(yàn)(張國(guó)民,2002),這些方法和經(jīng)驗(yàn)或多或少都帶有一些主觀因素,在數(shù)據(jù)資料更多、更充分的情況下是否還適用,有待去進(jìn)一步檢驗(yàn)。利用大數(shù)據(jù)方法去檢驗(yàn)這些方法和經(jīng)驗(yàn),對(duì)于地震預(yù)報(bào)工作方法的甄別和選擇具有非常重要的意義,由數(shù)據(jù)自身得到的檢驗(yàn)結(jié)果比統(tǒng)計(jì)分析的可靠性更令人信服。

此外,還有觀測(cè)數(shù)據(jù)與余震序列關(guān)聯(lián)關(guān)系的研究等,大量的余震序列與大量的觀測(cè)時(shí)序數(shù)據(jù),只有通過(guò)對(duì)大量數(shù)據(jù)的挖掘研究,才能發(fā)現(xiàn)其中有意義的規(guī)律和規(guī)則。

4 結(jié)語(yǔ)

地震前兆觀測(cè)測(cè)項(xiàng)眾多,種類繁雜,跨越時(shí)間較長(zhǎng),產(chǎn)自不同技術(shù)系統(tǒng),加之其它各種原因,導(dǎo)致目前實(shí)際的數(shù)據(jù)集比較“雜亂”。將這些數(shù)據(jù)進(jìn)行聯(lián)合應(yīng)用時(shí),無(wú)論進(jìn)行長(zhǎng)時(shí)段數(shù)據(jù)分析,還是多測(cè)項(xiàng)之間的數(shù)據(jù)應(yīng)用,傳統(tǒng)的數(shù)據(jù)分析方法已不能勝任。大數(shù)據(jù)的分析思路為前兆數(shù)據(jù)的應(yīng)用提供了一個(gè)新的模式,利用這種新思路,結(jié)合地震前兆觀測(cè)的物理意義,從中發(fā)掘更多以前研究中尚未被認(rèn)識(shí)的規(guī)律或信息,對(duì)于以前兆觀測(cè)預(yù)報(bào)地震或以前兆觀測(cè)研究其他地震物理科學(xué)問(wèn)題都具有重要的意義。利用大數(shù)據(jù)的研究思想,可能會(huì)改變前兆數(shù)據(jù)傳統(tǒng)的研究和應(yīng)用模式,無(wú)論是對(duì)于前兆數(shù)據(jù)的推廣應(yīng)用,還是利用它進(jìn)行科學(xué)研究,都是一次非常有益的嘗試。

維克托·邁爾·舍恩伯格,肯尼思·庫(kù)克耶著,盛楊燕,周濤譯,2012.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革.浙江:浙江人民出版社.

涂子沛,2013.大數(shù)據(jù):正在到來(lái)的數(shù)據(jù)革命,以及它如何改變政府、商業(yè)與我們的生活.南寧:廣西師范大學(xué)出版社.

張聰聰,王秀英,2014.前兆觀測(cè)異常數(shù)據(jù)檢測(cè)方法研究.震災(zāi)防御技術(shù),9(增刊):149—158.

張國(guó)民,2002.我國(guó)地震監(jiān)測(cè)預(yù)報(bào)研究的主要科學(xué)進(jìn)展.地震,22(1):2—8.

周克昌,趙剛,王晨,王方建,劉高川,2013.中國(guó)地震前兆臺(tái)網(wǎng)觀測(cè)技術(shù)系統(tǒng)整合.中國(guó)地震,29(2):270—275.

McKinsey Global Institute,2011.Big data:The next frontier for innovation,competition,and productivity.http://www.mckinsey.com/insights/business_technology/big_data_the_next_ frontier_ for_innovation.

Tan Pang-Ning,Michael Steinbach,Vipin Kumar著,范明,范宏建等譯,2013.數(shù)據(jù)挖掘?qū)д?北京:人民郵電出版社.

Discussion on the Big Data Mining Application on Earthquake Precursor Observation

Wang Xiuying1), Zhang Ling2)and Zhang Congcong1)
1)Institute of Crustal Dynamics, China Earthquake Administration, Beijing 100085, China
2)Earthquake Administration of Shandong Province, Jinan 250012, China

Application of big data mining is the hot topic nowadays. In this paper we briefly introduced the basic idea of big data research, analyzed the necessities of big data application in earthquake precursor observation, and listed some application issues which can be solved by this technology when it is used in seismic related domain. By doing this, we hope it can be promoted to the innovative applications on earthquake precursor observation data.

Big data;Earthquake precursor observation data;Implicit information;Data mining;Seismic related application

地震監(jiān)測(cè)專項(xiàng)“前兆觀測(cè)數(shù)據(jù)信息挖掘”

2014-07-26

王秀英,女,生于1972年。博士,研究員。主要從事地震災(zāi)害學(xué)及前兆觀測(cè)技術(shù)研究。E-mail:xiuyw@sohu.com

猜你喜歡
前兆數(shù)據(jù)量數(shù)據(jù)挖掘
基于大數(shù)據(jù)量的初至層析成像算法優(yōu)化
計(jì)算Lyapunov指數(shù)的模糊C均值聚類小數(shù)據(jù)量法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
高刷新率不容易顯示器需求與接口標(biāo)準(zhǔn)帶寬
寬帶信號(hào)采集與大數(shù)據(jù)量傳輸系統(tǒng)設(shè)計(jì)與研究
電子制作(2019年13期)2020-01-14 03:15:18
哪些現(xiàn)象是地震前兆
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
右肝區(qū)不適或疼痛是肝癌表現(xiàn)的前兆嗎
肝博士(2015年2期)2015-02-27 10:49:46
基于GPGPU的離散數(shù)據(jù)挖掘研究
巢湖市| 博白县| 安多县| 布拖县| 兰西县| 保山市| 冀州市| 宁化县| 布尔津县| 布拖县| 化德县| 永德县| 锦州市| 吉林省| 休宁县| 永安市| 永丰县| 丰城市| 安远县| 云霄县| 孟州市| 济阳县| 和林格尔县| 沧州市| 南开区| 麟游县| 霍邱县| 洪雅县| 婺源县| 两当县| 醴陵市| 武清区| 光山县| 娄烦县| 九江县| 贺兰县| 定襄县| 安远县| 浮梁县| 罗山县| 长乐市|