国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

氣象數(shù)據(jù)挖掘與可視化
——展現(xiàn)數(shù)據(jù)之美

2018-10-11 07:03:48劉丹妮王穎周丹
浙江氣象 2018年3期
關(guān)鍵詞:日數(shù)數(shù)據(jù)挖掘結(jié)論

劉丹妮 王穎 周丹

(浙江省氣象服務(wù)中心,浙江 杭州 310017)

0 引 言

“大數(shù)據(jù)”一詞是隨著信息時(shí)代發(fā)展而產(chǎn)生的,是當(dāng)前當(dāng)仁不讓的熱詞。隨著數(shù)據(jù)源的多樣化,數(shù)據(jù)量的積累,當(dāng)前信息時(shí)代也被稱為“大數(shù)據(jù)時(shí)代”。無論在科學(xué)研究、應(yīng)用還是互聯(lián)網(wǎng)領(lǐng)域,“大數(shù)據(jù)”都占據(jù)不可忽視的地位。韓學(xué)艷等利用大數(shù)據(jù)方法分析了探索治療心力衰竭常見證型的用藥規(guī)律[1];鄭楊利用大數(shù)據(jù)方法,實(shí)現(xiàn)了檔案數(shù)據(jù)從采集、整理、分析到展示4個(gè)層次的優(yōu)化管理[2];賈應(yīng)麗分析銷售數(shù)據(jù),指導(dǎo)客戶分類,實(shí)現(xiàn)了差異化的客戶關(guān)系管理[3];施麗等將大數(shù)據(jù)方法應(yīng)用于分析電網(wǎng)用戶需求,實(shí)現(xiàn)了主動(dòng)服務(wù),降低了服務(wù)成本,提高了服務(wù)效率[4];何泰伯將大數(shù)據(jù)分析應(yīng)用于教學(xué)多媒體信息檢索系統(tǒng),在速度、精度和檢索能力上較傳統(tǒng)檢索系統(tǒng)有明顯提高[5];呂梅認(rèn)為大數(shù)據(jù)在電視新聞策劃中的應(yīng)用可以增強(qiáng)節(jié)目的競爭力[6];高子初等在分析了各種復(fù)雜多車道道路上的車輛行駛行為的基礎(chǔ)上,提出了用大數(shù)據(jù)智能交通技術(shù)管理復(fù)雜多車道道路的新策略[7]。

大數(shù)據(jù)真正的價(jià)值不在于數(shù)量的龐大,而在于數(shù)據(jù)背后潛藏的關(guān)系和規(guī)律。海量的數(shù)據(jù)提高了信息的復(fù)雜程度[3],要尋找數(shù)據(jù)背后的關(guān)系和規(guī)律,需要通過“數(shù)據(jù)挖掘”來實(shí)現(xiàn)。“數(shù)據(jù)挖掘”,即從數(shù)據(jù)中挖掘出有價(jià)值的信息和知識的過程,它建立在對數(shù)據(jù)集全面而深刻認(rèn)識的基礎(chǔ)上,是對數(shù)據(jù)內(nèi)在和本質(zhì)的高度抽象與概括,也是對數(shù)據(jù)從理性認(rèn)識到感性認(rèn)識的升華。數(shù)據(jù)背后的關(guān)系和規(guī)律的呈現(xiàn),則稱為數(shù)據(jù)的可視化。

氣象部門本身積累了大量的觀測數(shù)據(jù),是“大數(shù)據(jù)”的一種。氣象數(shù)據(jù)與許多其他類型數(shù)據(jù)(交通出行、用電/水量、服裝銷售、電器銷售數(shù)據(jù)等)相關(guān)聯(lián),反映了氣象條件對行業(yè)的影響。但就氣象數(shù)據(jù)本身而言,其隱含的氣候背景和規(guī)律,是為公眾答疑解惑的“原材料”,也是判斷當(dāng)前天氣是否異常的標(biāo)準(zhǔn),因此歷史氣象數(shù)據(jù)挖掘?qū)姎庀蠓?wù)而言不可或缺。

此外,隨著智能手機(jī)的普及和天氣類APP的涌現(xiàn),公眾獲取常規(guī)氣象信息的途徑大大增加,氣象部門發(fā)布的常規(guī)文字信息權(quán)威性和吸引力已大大削弱。網(wǎng)絡(luò)時(shí)代新媒體的傳播方式和公眾的閱讀習(xí)慣,要求氣象信息有“吸睛”、“有趣”,這就必然要對氣象數(shù)據(jù)進(jìn)行深加工和熱點(diǎn)挖掘??梢暬菙?shù)據(jù)背后規(guī)律的表達(dá),成功的可視化能夠提高氣象信息的展現(xiàn)能力和美觀度。經(jīng)歷“數(shù)據(jù)挖掘”和“可視化”過程的原創(chuàng)氣象數(shù)據(jù)新聞或預(yù)報(bào)、科普產(chǎn)品,在增強(qiáng)氣象信息可讀性的同時(shí),可以避免其他媒體對于文字類氣象信息的錯(cuò)誤解讀,從而維護(hù)氣象部門的權(quán)威發(fā)布品牌。中國天氣網(wǎng)原創(chuàng)的“數(shù)據(jù)會說話”、“數(shù)據(jù)帝扒天氣”等欄目就是氣象數(shù)據(jù)挖掘和可視化的典范。

1 氣象數(shù)據(jù)挖掘的關(guān)鍵

1.1 “氣象+生活”,找準(zhǔn)切入點(diǎn)

天氣條件影響著生活的多個(gè)方面,單純的氣象數(shù)據(jù)分析并不一定能引起閱讀者的興趣,但從人們的認(rèn)知、感知或身邊的事、物入手,則更容易引發(fā)人閱讀的欲望。

1)以認(rèn)知、感知為切入點(diǎn)。人們看到熟悉的認(rèn)知或類似的感知,比較容易產(chǎn)生共鳴,引發(fā)探究的欲望。例如,夏季高溫科普作品《扒一扒三伏天那些事兒》、《越來越熱是你的錯(cuò)覺嗎?》,前者從人們熟知的“三伏天”出發(fā),后者從人們對“天越來越熱”的感知入手,分析了夏季高溫的特征;冬季科普作品《“大寒”PK“小寒”》,對比兩個(gè)節(jié)氣的寒冷程度,讓冬季低溫特征更有趣;《清明時(shí)節(jié)雨紛紛的降雨魔咒》從“清明時(shí)節(jié)雨紛紛”詩句出發(fā),分析了清明假期浙江各地的降水特點(diǎn);《凍成狗?數(shù)據(jù)告訴你我國寒潮變少了》把感知與數(shù)據(jù)的沖突點(diǎn)相結(jié)合,對我國寒潮發(fā)生的頻次和降溫幅度進(jìn)行了分析。

2)以身邊的事、物為切入點(diǎn)。每個(gè)人的生活都離不開“衣食住行”四個(gè)字,以公眾身邊的事或物為切入點(diǎn)也能夠引發(fā)關(guān)注?!稓鉁亟?℃,關(guān)跑步什么事兒?》從跑步運(yùn)動(dòng)入手,揭示了氣溫、大風(fēng)和降水對于跑步的影響;《一天過兩季4月亂穿衣指數(shù)大放送》從4月“亂穿衣”入手,引出4月晝夜溫差大的特點(diǎn);《暴雨和高溫是怎么影響我們的菜籃子的?》把天氣和菜價(jià)相結(jié)合,指出了高溫髙濕天氣對于蔬菜種植、運(yùn)輸?shù)鹊挠绊?《大數(shù)據(jù)教你應(yīng)對高考“意外”天氣》以高考為著眼點(diǎn),分析了全國多個(gè)城市在高考期間可能出現(xiàn)的不利天氣,并給出了防范措施。

1.2 數(shù)據(jù)挖掘≠數(shù)據(jù)羅列

數(shù)據(jù)挖掘本身是從數(shù)據(jù)的表象升華到數(shù)據(jù)背后規(guī)律的過程,通過挖掘得到的數(shù)據(jù)背后的規(guī)律必然要用數(shù)據(jù)呈現(xiàn),但規(guī)律的呈現(xiàn)并不是歷史數(shù)據(jù)的簡單羅列,而需要發(fā)現(xiàn)其內(nèi)涵并凝練成結(jié)論。以科普長圖《越來越熱是你的錯(cuò)覺嗎?》為例,闡述結(jié)論在數(shù)據(jù)挖掘中的重要性。

《越來越熱是你的錯(cuò)覺嗎?》利用1961—2016年浙江11地市氣溫記錄分析了高溫和暖夜的變化特征。圖1a展現(xiàn)的結(jié)論是1961年以來浙江的高溫日數(shù)呈增長趨勢,但逐年的高溫日數(shù)序列并不是逐年增長的而是波動(dòng)的,因此高溫日逐年的羅列并不能表現(xiàn)高溫日的變化趨勢。為此加入了序列的趨勢線,高溫日數(shù)趨勢線呈明顯增長趨勢,有力地體現(xiàn)了“高溫日數(shù)越來越多”這一結(jié)論。除添加趨勢線方法外,還可以按照年代將54個(gè)時(shí)次的時(shí)間序列分成6段,縮減后的高溫序列也能夠較明確地表現(xiàn)高溫日數(shù)量的增加(圖1b)。

圖1a 1961—2016年浙江平均高溫日數(shù)

圖1b 1961—2016各年代平均高溫日數(shù)

圖2需體現(xiàn)的結(jié)論是“7、8月高溫最兇猛”。圖中以餅圖的形式表示各月高溫日(最高氣溫≥35 ℃)、酷熱日(最高氣溫≥40 ℃)出現(xiàn)的比例,不僅說明了4—9月曾出現(xiàn)高溫日、7—9月曾出現(xiàn)酷熱日,還通過扇形的面積大小明確展示了高溫日和酷熱日主要出現(xiàn)在7月、8月,對結(jié)論起到了充分支撐作用。

圖2 浙江平均高溫日月分布占比

數(shù)據(jù)證明了浙江的高溫日的增加趨勢和集中月份后,圖3將省內(nèi)11地市高溫日數(shù)進(jìn)行了對比,得出“麗水是浙江的吐魯番”這一結(jié)論。從條形圖上可以明確的看出,麗水平均高溫日數(shù)達(dá)45.8 d,高居榜首;最少的是舟山平均僅3.5 d。

圖3 浙江11地市高溫日排行(單位:d)

高溫代表了白天熱的程度,到了夜里是否還熱?圖4利用暖夜(最低氣溫≥28 ℃)日數(shù)序列進(jìn)行說明。這里值得注意的是,暖夜并不是每年都出現(xiàn),且與高溫日數(shù)一樣也存在序列過長,難以表現(xiàn)的問題,圖4采用5 a暖夜總?cè)諗?shù)展現(xiàn)暖夜變化趨勢,有效地避免了有些年份不出現(xiàn)暖夜的問題,同時(shí)也達(dá)到了縮減序列長度的目的,清晰地展現(xiàn)出“夜間越來越熱”這一結(jié)論。

圖4 1961—2016年浙江暖夜日數(shù)變化(單位:d)

由上面案例可知,每組數(shù)據(jù)規(guī)律的呈現(xiàn)都需落腳到結(jié)論,并且成為結(jié)論的有力支撐,這就涉及到數(shù)據(jù)規(guī)律的挖掘方法。氣象數(shù)據(jù)挖掘的常用方法有平均、極值、趨勢線、頻率統(tǒng)計(jì)等,有時(shí)還可根據(jù)對數(shù)據(jù)進(jìn)行分類對比。

2 數(shù)據(jù)的可視化

數(shù)據(jù)挖掘是“深入”的過程,那么可視化則是“淺出”的展現(xiàn)??梢暬褪前褦?shù)據(jù)、信息和知識轉(zhuǎn)化為可視的表示形式的過程[8]。在“全媒體”時(shí)代,以文字呈現(xiàn)的信息不具備圖片的視覺沖擊力,富有創(chuàng)意的視覺語言更能幫助人們快速獲得信息,因此“看圖說話”的形式能更好地傳播氣象信息。

隨著大數(shù)據(jù)技術(shù)的發(fā)展,可視化技術(shù)也不斷提高,目前數(shù)據(jù)可視化技術(shù)已實(shí)現(xiàn)借助計(jì)算機(jī)的強(qiáng)大處理能力、計(jì)算機(jī)圖形學(xué)算法和可視化算法,將大量的數(shù)據(jù)集轉(zhuǎn)化為靜態(tài)或者動(dòng)態(tài)圖像,并具有一定的人機(jī)交互能力?;ヂ?lián)網(wǎng)上已有許多在線可視化平臺如Google Chart、Data Driven Documents[9]、“鏑數(shù)”及“百度?圖說”等,中國氣象局華風(fēng)創(chuàng)新2015年也推出了氣象數(shù)據(jù)的可視化解決方案——“藍(lán)PI螞蟻”[10]。

在數(shù)據(jù)規(guī)律的展現(xiàn)方式上需要考慮多樣化和美觀,除常見的柱狀和折線表達(dá)方式外,餅圖、玉玦圖、瀑布圖、玫瑰圖、面積圖、象形圖、甘特圖等的搭配使用能給人耳目一新的感覺,更好地詮釋數(shù)據(jù)規(guī)律(如圖5)。

在可視化工具選擇上,Excel和Power point可以呈現(xiàn)大部分圖形的制作,例如柱狀圖、折線圖、餅圖、玫瑰圖、雷達(dá)圖、面積圖,玉玦圖等,但相對復(fù)雜的圖形制作則需要借助線上工具或編程語言(Matlab、R語言)來實(shí)現(xiàn)。當(dāng)然,Photoshop也可以幫助實(shí)現(xiàn)圖形的美化。值得注意的是,氣象數(shù)據(jù)的可視化并不局限于圖表,還可以用視頻、動(dòng)畫、H5等多多種形式進(jìn)行展現(xiàn),甚至可以根據(jù)用戶數(shù)據(jù)來實(shí)現(xiàn)“私人訂制”,例如“今日頭條”政務(wù)號的年度數(shù)據(jù)解讀。

3 結(jié) 語

本文以氣象大數(shù)據(jù)為出發(fā)點(diǎn),簡述了在當(dāng)前的“全媒體”時(shí)代氣象數(shù)據(jù)挖掘的關(guān)鍵點(diǎn),以及數(shù)據(jù)可視化的重要性,主要結(jié)論如下:

圖5 氣象數(shù)據(jù)可視化圖形舉例(統(tǒng)計(jì)時(shí)段為1961—2016年)

1)對于公眾氣象服務(wù)而言,歷史氣象數(shù)據(jù)挖掘與可視化是適應(yīng)當(dāng)前信息獲取方式的必然選擇,也是氣象部門掌握信息主動(dòng)權(quán),制作原創(chuàng)新聞,打造品牌效應(yīng)的重要手段。歷史氣象數(shù)據(jù)挖掘不僅有利于對當(dāng)前天氣的判斷,也有利于氣象規(guī)律的總結(jié)和傳遞。

2)氣象數(shù)據(jù)挖掘要引起公眾的關(guān)注,需要找準(zhǔn)切入點(diǎn),從人們的認(rèn)知、感知或身邊的事、物進(jìn)行切入,能夠取得較好的效果。

3)氣象數(shù)據(jù)的可視化是數(shù)據(jù)規(guī)律表達(dá)的重要步驟,需要設(shè)計(jì)人員的思考和經(jīng)驗(yàn)。除卻簡單的柱狀和折線表達(dá)方式外,面積圖、象形圖、玫瑰圖、玉玦圖等的使用可以為規(guī)律的呈現(xiàn)增色、吸睛。

在大數(shù)據(jù)火爆的今天,有人把數(shù)據(jù)比作新的“石油”或“尚未發(fā)掘的金礦”,數(shù)據(jù)新聞是大數(shù)據(jù)時(shí)代的精品,也是許多大型網(wǎng)站保留的原創(chuàng)欄目,例如搜狐的“數(shù)字之道”、網(wǎng)易的“數(shù)讀”。將數(shù)據(jù)挖掘與可視化技術(shù)應(yīng)用于氣象數(shù)據(jù),可以大大增強(qiáng)氣象信息的趣味性,給氣象信息傳播帶來新機(jī)遇、開拓新思路。不同視角、不同形式呈現(xiàn)出創(chuàng)新性的氣象信息,其傳播將獲得“1+1>2”的效果。盤活歷史氣象數(shù)據(jù),讓數(shù)據(jù)訴說自己的故事,能夠豐富公眾氣象服務(wù)產(chǎn)品,提升公眾服務(wù)水平,真正體現(xiàn)氣象數(shù)據(jù)之美。

猜你喜歡
日數(shù)數(shù)據(jù)挖掘結(jié)論
由一個(gè)簡單結(jié)論聯(lián)想到的數(shù)論題
漢江上游漢中區(qū)域不同等級降水日數(shù)的氣候變化特征分析
綠色科技(2022年16期)2022-09-15 03:04:46
立體幾何中的一個(gè)有用結(jié)論
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
天津市濱海新區(qū)塘沽地域雷暴日數(shù)變化規(guī)律及特征分析
天津科技(2020年2期)2020-03-03 05:09:48
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
結(jié)論
海南省雷暴日數(shù)年代際變化特征
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
ESSENTIAL NORMS OF PRODUCTS OF WEIGHTED COMPOSITION OPERATORS AND DIFFERENTIATION OPERATORS BETWEEN BANACH SPACES OF ANALYTIC FUNCTIONS?
南陵县| 雅安市| 蒲江县| 镇平县| 胶州市| 长兴县| 济宁市| 博湖县| 岳阳市| 普兰县| 凤城市| 东阿县| 德保县| 改则县| 喀什市| 乌兰浩特市| 伊吾县| 宽城| 合阳县| 乌兰县| 麻栗坡县| 醴陵市| 定兴县| 永靖县| 湄潭县| 绥芬河市| 呼图壁县| 揭东县| 梅河口市| 孟村| 开封市| 吉木萨尔县| 松潘县| 巢湖市| 若尔盖县| 萝北县| 西盟| 晋城| 岳普湖县| 石楼县| 鄂尔多斯市|