国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

利用數(shù)據(jù)可視化技術(shù)提高編目數(shù)據(jù)傳播的效率

2016-01-29 06:22張從珍毛國良李冬圣蔡玲玲趙英萍杜迎春武有文
華北地震科學(xué) 2015年4期
關(guān)鍵詞:數(shù)據(jù)可視化圖形

常 亮,張從珍,毛國良,李冬圣,蔡玲玲,趙英萍,楊 銳,杜迎春,武有文

(河北省地震局,石家莊 050021)

?

利用數(shù)據(jù)可視化技術(shù)提高編目數(shù)據(jù)傳播的效率

常亮,張從珍,毛國良,李冬圣,蔡玲玲,趙英萍,楊銳,杜迎春,武有文

(河北省地震局,石家莊050021)

摘要:指出了利用文字或數(shù)字方式展示地震編目數(shù)據(jù)的缺陷,通過逐步分析引出了數(shù)據(jù)可視化技術(shù)在信息傳播速度、全面性方面的優(yōu)勢,通過氣泡圖、堆疊式條形圖、箱線圖、折線圖、三維散點(diǎn)圖進(jìn)行多角度的可視化數(shù)據(jù)展示,體現(xiàn)了數(shù)據(jù)可視化技術(shù)在地震編目數(shù)據(jù)傳播中的直觀性和高效性。

關(guān)鍵詞:數(shù)據(jù)可視化;圖形;編目數(shù)據(jù)集

0引言

地震編目數(shù)據(jù)是測震臺(tái)網(wǎng)產(chǎn)出的最主要的地震資料[1],廣泛用于預(yù)報(bào)、震情監(jiān)視、科研等工作[2]。不論是地震科研還是撰寫報(bào)告,經(jīng)常需要對多組數(shù)據(jù)集進(jìn)行比較并從中找出某些規(guī)律,通常會(huì)采用文字或數(shù)字方式來展現(xiàn),在數(shù)據(jù)量較小時(shí)這種方式容易被接受,當(dāng)數(shù)據(jù)量很大時(shí)這樣的方式就不再有效率可言了。如何才能直觀地實(shí)現(xiàn)大量數(shù)據(jù)的對比展示呢?根據(jù)專家研究發(fā)現(xiàn),人眼對于可視符號的感知速度比對數(shù)字或文字快多個(gè)數(shù)量級,使用圖形數(shù)據(jù)展示可迅速從數(shù)據(jù)中發(fā)現(xiàn)模式和規(guī)律[3]。

人眼對于顏色、圖形等有形有色的東西比較敏感。數(shù)據(jù)可視化技術(shù)就是借助計(jì)算機(jī)軟件將原本可以用文字、數(shù)字描述的東西以圖形方式展現(xiàn),并且利用圖形的顏色、形狀等信息表現(xiàn)不同維度的數(shù)據(jù)。在計(jì)算機(jī)圖形學(xué)技術(shù)初期,人們只是用一些簡單的圖形來描述數(shù)據(jù),隨著云計(jì)算、大數(shù)據(jù)挖掘等數(shù)據(jù)處理技術(shù)的發(fā)展,簡單的圖形學(xué)已經(jīng)無法滿足需求,數(shù)據(jù)可視化技術(shù)隨之應(yīng)運(yùn)而生。數(shù)據(jù)可視化不僅要傳播信息,還要考慮新穎性、高效性,利用不同的場景提高信息傳播能力,要充分考慮到受眾目標(biāo)、使用方式等因素[4]。根據(jù)上述概念,可以想象數(shù)據(jù)可視化不僅僅是用圖形展示數(shù)據(jù),還要讓圖形更美觀,更簡潔、更準(zhǔn)確。

1編目數(shù)據(jù)展示的發(fā)展歷程

1.1 列表方式

人們對信息的認(rèn)識(shí)從文字或數(shù)字方式開始,通常會(huì)使用表格方式(表1),表中展示了2008年的編目信息(限于篇幅僅列5條為例),表中描述了每條地震的時(shí)、空、強(qiáng)等信息,根據(jù)這些信息可以大致了解到測震臺(tái)網(wǎng)在某段時(shí)間內(nèi)的數(shù)據(jù)產(chǎn)出情況。在做數(shù)據(jù)分析或研究時(shí)通常需要找出數(shù)據(jù)的某些規(guī)律,數(shù)據(jù)量較小時(shí),似乎能看出規(guī)律,但數(shù)據(jù)量很大時(shí)則很難在短時(shí)間內(nèi)找到規(guī)律,這樣的原始數(shù)據(jù)列表信息傳播速度較慢。

表1 2008年1月河北臺(tái)網(wǎng)地震編目數(shù)據(jù)表

1.2 統(tǒng)計(jì)分析方式

表1的列表方式無法讓人一目了然,即使是長期從事地震編目的工作人員也不能立即看出規(guī)律。之后人們對這樣的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,得出一些基本信息,比如:地震數(shù)量、最大震級、地震分布狀況等,這樣的統(tǒng)計(jì)結(jié)果要優(yōu)于原始數(shù)據(jù)列表,但依然存在一些問題。它給出數(shù)據(jù)集的極值、總量或平均值,但無法描述數(shù)據(jù)的整體分布狀況,所以統(tǒng)計(jì)分析方式也無法全面的傳播信息。

1.3 可視化方式

如果采用可視化方式,利用一張圖形就能清晰描述數(shù)據(jù)整體分布狀況(圖1)。圖中最下面的橫線是正常值中的最小值,最上面的橫線是正常值中的最大值;中間方框的下部是下四分位數(shù),方框中間的粗橫線是中位數(shù),方框的上部是上四分位數(shù);最大值與最小值之外的那些點(diǎn)屬于離群點(diǎn),它們與絕大多數(shù)的值相距較遠(yuǎn)。從圖1中可以看出該組數(shù)據(jù)中正常值的最大值大約是ML2.5,正常值的最小值大約是ML-0.8,中位數(shù)接近ML1.0,所有值的最大值是ML4.7(圖中最上面的那個(gè)點(diǎn))。有一點(diǎn)需要注意,對于本圖來說正常值中的最大值并不是所有值中的最大值,所有值中的最大值應(yīng)該是那些離群點(diǎn)里最上面的一個(gè)點(diǎn)。

圖1 震級值箱線圖

2可視化技術(shù)展示數(shù)據(jù)

2.1 數(shù)據(jù)集整體狀況的展示

報(bào)告中,通常在開篇使用總結(jié)性的語言描述整體狀況,諸如“1月發(fā)生地震多少次,2月發(fā)生地震多少次 …… ,其中最大地震為某月的某次地震”。這樣的描述完全可以用氣泡圖來表示,氣泡圖屬于三維圖,可以同時(shí)表示月份、數(shù)量和最大值3個(gè)數(shù)據(jù)項(xiàng)。圖2顯示的是2014年河北省地震編目數(shù)據(jù),從圖中可以看到,全年震級最大的地震是9月的ML4.7地震;地震次數(shù)最多的月份是10月,將近170次;地震次數(shù)最少的是7月,少于100次。這樣的圖形完全可以將整體狀況描述清楚,即使沒有文本說明也能讓人一目了然。

圖2 2014年河北省地震編目數(shù)據(jù)氣泡圖

2.2 數(shù)據(jù)集總量與占比的對比展示

想要橫向比較各年度地震總量,一般會(huì)采用直方圖或柱狀圖,通過圖形的高低能看出數(shù)據(jù)總量的差異;想要縱向比較每年各震級區(qū)間與地震總量的占比,一般會(huì)采用餅圖,通過圖形所占面積的大小能得到各部分所占的比例。如果既想橫向比較數(shù)據(jù)間的總量,又想縱向比較數(shù)據(jù)內(nèi)的占比,可以采用可視化技術(shù)中的堆疊式條形圖。如圖3所示,該圖中的每個(gè)矩形的高度就是表2中每年度的地震總數(shù),每個(gè)矩形內(nèi)部又分出4個(gè)不同的區(qū)域,分別代表不同震級區(qū)間的地震數(shù)量,顏色最深的代表ML1.0~1.9地震數(shù)量。從圖3可以看出每年的地震主要都集中在ML1.0~1.9震級區(qū)間內(nèi),而2010年的地震數(shù)量明顯多于其他年份。

表2 2008—2012年首都圈地區(qū)地震活動(dòng)統(tǒng)計(jì)表

圖3 年度地震總量與震級區(qū)間數(shù)量堆疊式條形圖

2.3 多組數(shù)據(jù)集數(shù)據(jù)分散狀況比較

在對比多組數(shù)據(jù)集時(shí),如果只是對比數(shù)據(jù)集的總量和最大值并不能反映這些數(shù)據(jù)集本質(zhì)的差異,如果兩者的總量和最大值一致,則無法反映一組差異很大的數(shù)據(jù)集。假如有2組表示震級的數(shù)據(jù)(表3):

表3 2組震級數(shù)據(jù)

雖然2組數(shù)據(jù)的最大值都是ML2.3,而且每組數(shù)據(jù)的總量都是8個(gè),但明顯可以看到組1中的數(shù)據(jù)比較分散,既有ML1.0以下的地震,也有ML1.0~2.0之間的地震,還有ML2.0以上的地震,而組2中的地震幾乎都集中在ML1.8~2.3之間。單純用數(shù)據(jù)總量和極值無法對上述2組數(shù)據(jù)做出準(zhǔn)確的描述,而用箱線圖就能清楚地看出不同數(shù)據(jù)集中數(shù)據(jù)的分散狀況。將12個(gè)月的震級數(shù)據(jù)繪制到1張圖上(圖4),通過對比能夠直接看到每個(gè)月震級的分布狀況。全年地震最小值出現(xiàn)在2月和11月,小于ML-0.5;全年地震最大值是9月的ML4.7;9月的下四分位數(shù)小于ML0.5,是全年中最低的,這意味著該月有25%的地震震級在ML0.5以下;全年大多數(shù)月的中位數(shù)在ML1.0附近,只有9月和12月的中位數(shù)在ML0.7左右,表明9月和12月的地震有一半在ML0.7以上;5月的上四分位數(shù)超過ML1.5,為全年最大值,這意味著該月有25%的地震震級在ML1.5以上。

圖4 震級數(shù)據(jù)箱線圖

2.4 多組數(shù)據(jù)集趨向走勢的展示

當(dāng)需要對一些統(tǒng)計(jì)信息進(jìn)行描述時(shí),經(jīng)常會(huì)用到如表4所示的方式。表4描述了2012—2014年河北臺(tái)網(wǎng)每月處理的地震個(gè)數(shù)(包括首都圈地區(qū)及本省行政區(qū)邊界外30 km內(nèi)的所有地震)。單獨(dú)看這些數(shù)字時(shí)很難立即在大腦中產(chǎn)生對比結(jié)果,但使用折線圖(圖5)后就能看到一個(gè)清晰的趨勢。

表4 2012—2014年河北臺(tái)網(wǎng)每月處理的地震個(gè)數(shù)統(tǒng)計(jì)

圖5 2012—2014年每月地震數(shù)量折線圖

2.5 多組數(shù)據(jù)集個(gè)體三維分布的描述

由表1雖然可以看到地震震中的經(jīng)緯度,但通常只有長期從事地震編目分析工作的人較容易通過經(jīng)緯度的值在大腦中形成地震的大致位置,其他人員很難構(gòu)建出這樣的虛擬圖,而采用散點(diǎn)圖方式則可以很鮮明地將所有地震發(fā)生的位置展示在圖上,但是這個(gè)圖是平面的。地震發(fā)生位置是由經(jīng)緯度及深度來描述的,那么就需要用三維散點(diǎn)圖來展示(圖6)。圖6 為2014年1月的部分地震數(shù)據(jù)做出的三維圖,從圖中可以看出震源深度最深的地震接近16 km,最淺的在4 km左右;地震在經(jīng)度上主要集中在114.0°E ~118.5°E之間;地震在緯度上主要集中在37.0°N ~40.0°N之間。

圖6 2014年1月地震編目數(shù)據(jù)三維散點(diǎn)圖

3結(jié)束語

通過上述5種不同的可視化圖形,分別展示了數(shù)據(jù)集的整體狀況、數(shù)據(jù)集總量與占比、數(shù)據(jù)分散狀況、趨向走勢、及個(gè)體三維分布狀況。這5種可視化技術(shù)都能滿足信息傳播的高速性、直觀性、準(zhǔn)確性,特別是當(dāng)數(shù)據(jù)量比較大時(shí),可視化數(shù)據(jù)分析比文本數(shù)據(jù)分析更具優(yōu)勢。可視化數(shù)據(jù)不僅可以為專業(yè)人員服務(wù),而且對于非專業(yè)人員來說也能從圖形中看出一些規(guī)律,它擴(kuò)大了數(shù)據(jù)的傳播范圍,降低了數(shù)據(jù)的接收難度。以上可視化數(shù)據(jù)圖均采用R語言生成,R語言由Ross Ihaka和Robert Gentleman開發(fā)[5],它具有數(shù)據(jù)分析與繪圖功能。

致謝:本文所用測震編目數(shù)據(jù)是河北省地震局測震臺(tái)網(wǎng)全體編目、值班人員在一年中辛勤工作完成的,在此向臺(tái)網(wǎng)所有編目、值班人員表示感謝!

參考文獻(xiàn):

[1]常俊,趙曦,姬建中.基于Oracle的地震數(shù)據(jù)共享方案設(shè)計(jì)及數(shù)據(jù)庫實(shí)現(xiàn)[J].地震地磁觀測與研究,2011,32(5):143-147.

[2]王蘭蘭,楊晶瓊,張雪玲,等.技術(shù)進(jìn)步是提高編目質(zhì)量的關(guān)鍵[J].地震地磁觀測與研究,2008,29(4):105-107.

[3]陳為,沈則潛,陶煜波,等.?dāng)?shù)據(jù)可視化[M].北京:電子工業(yè)出版社,2013:2.

[4]Julie Steele, Noah Iliinsky.?dāng)?shù)據(jù)可視化之美[M].祝洪凱,李妹芳,譯.北京:機(jī)械工業(yè)出版社,2011:7-9.

[5]李詩羽,張飛,王正林.?dāng)?shù)據(jù)分析:R語言實(shí)戰(zhàn)[M].北京:電子工業(yè)出版社,2014:5.

喬子云,羅娜,張國苓,等.河北大柏舍臺(tái)深井與淺層地電阻率觀測對比分析[J].華北地震科學(xué),2015,33(4):49-53.

Visualization Technology Improves the Efficiency of

Seismic Catalog Data Transmission

CHANG Liang, ZHANG Cong-zhen, MAO Guo-liang, LI Dong-sheng,

CAI Ling-ling, ZHAO Ying-ping, YANG Rui, DU Ying-chun, WU You-wen

(Earthquake Administration of Heibei Province, Shijiazhuang 050021, China)

Abstract:This paper points put the defects of using texts or numbers to display data, and then states the advantage of data visualization technology in information transmission speed and comprehensive through multi angle data displaying by bubble plot, stacked bar plot, line plot, box plot, 3D scatter plot. The visualization and high-efficiency of visualization technology in catalog data transmission are shown.

Key words:data visualization; data set; catalog data

作者簡介:喬子云(1965—),女(漢族),河北大名人,高級工程師,主要從事電磁分析和地震預(yù)測研究工作.E-mail:qzy@eq-he.ac.cn

基金項(xiàng)目:國家自然科學(xué)基金(41274079);震情跟蹤定向工作任務(wù)(2015010403)

收稿日期:2015-04-20

doi:10.3969/j.issn.1003-1375.2015.04.008

中圖分類號:P315.391

文獻(xiàn)標(biāo)志碼:A

文章編號:1003-1375(2015)04-0045-04

猜你喜歡
數(shù)據(jù)可視化圖形
移動(dòng)可視化架構(gòu)與關(guān)鍵技術(shù)綜述
大數(shù)據(jù)時(shí)代背景下本科教學(xué)質(zhì)量動(dòng)態(tài)監(jiān)控系統(tǒng)的構(gòu)建
可視化:新媒體語境下的數(shù)據(jù)、敘事與設(shè)計(jì)研究
我國數(shù)據(jù)新聞的發(fā)展困境與策略研究
基于R語言的大數(shù)據(jù)審計(jì)方法研究
數(shù)圖形
分圖形
找圖形
圖形變變變
圖形配對