張晉輝 崔秋文
(中國地震臺(tái)網(wǎng)中心,北京100045)
?
大數(shù)據(jù)環(huán)境下對(duì)地震科技情報(bào)服務(wù)工作的思考*
張晉輝※崔秋文
(中國地震臺(tái)網(wǎng)中心,北京100045)
摘要大數(shù)據(jù)時(shí)代的到來給地震科技情報(bào)服務(wù)工作帶來了機(jī)遇和挑戰(zhàn)。從大數(shù)據(jù)的概念和特點(diǎn)入手,分析了這些機(jī)遇和挑戰(zhàn),并結(jié)合地震科技情報(bào)服務(wù)工作的現(xiàn)狀,從理念、方法、技術(shù)、隊(duì)伍建設(shè)等4個(gè)角度提出了地震科技情報(bào)服務(wù)行業(yè)的應(yīng)對(duì)措施。
關(guān)鍵詞地震科技情報(bào); 大數(shù)據(jù); 思考
引言
隨著人類社會(huì)從信息時(shí)代、知識(shí)時(shí)代向智能時(shí)代的邁進(jìn),尤其是互聯(lián)網(wǎng)和數(shù)字化技術(shù)的飛速發(fā)展,大數(shù)據(jù)強(qiáng)勢(shì)來到我們身邊,大數(shù)據(jù)正在改變著政府、企業(yè)和社會(huì)生活的各個(gè)方面[1]。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的作用將會(huì)前所未有地得到凸顯,數(shù)據(jù)將成為國家競(jìng)爭(zhēng)、科學(xué)研究和行業(yè)創(chuàng)新的基礎(chǔ),大數(shù)據(jù)及大數(shù)據(jù)技術(shù)的發(fā)展將對(duì)人類生活和生產(chǎn)方式的變革產(chǎn)生深遠(yuǎn)影響。
與其他行業(yè)一樣,地震科技情報(bào)服務(wù)行業(yè)也要面臨大數(shù)據(jù)時(shí)代帶來的機(jī)遇和挑戰(zhàn)。因?yàn)榈卣鹳Y料的內(nèi)涵是數(shù)據(jù),通過數(shù)據(jù)反映地質(zhì)結(jié)構(gòu)、地層變化,所以大數(shù)據(jù)的發(fā)展對(duì)于地震行業(yè)還具有特殊意義。那么大數(shù)據(jù)有哪些特征,還有哪些技術(shù)難點(diǎn)? 如何抓住機(jī)遇和迎接挑戰(zhàn),駕馭和利用大數(shù)據(jù)創(chuàng)造更多價(jià)值,將成為我們每個(gè)地震科技工作者的重要任務(wù)和使命。
1大數(shù)據(jù)的概念和特點(diǎn)
目前,學(xué)界對(duì)大數(shù)據(jù)的定義尚未統(tǒng)一,不同學(xué)科和研究領(lǐng)域?qū)Υ髷?shù)據(jù)定義的角度不同。亞馬遜大數(shù)據(jù)科學(xué)家John Rauser將大數(shù)據(jù)定義為: 大數(shù)據(jù)就是任何超過了1臺(tái)計(jì)算機(jī)處理能力的龐大數(shù)據(jù)量; 維基百科定義為: 大數(shù)據(jù)是指無法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合[2]。但是,普遍的認(rèn)同是,大數(shù)據(jù)指所涉及的數(shù)據(jù)量規(guī)模巨大,無法通過人工或主流軟件工具在合理時(shí)間內(nèi)達(dá)到收集、管理、處理和整理,使其成為人們所能解讀的信息[3]。
大數(shù)據(jù)同過去的海量數(shù)據(jù)又有所區(qū)別,其基本特征可以用4個(gè)V來總結(jié)(Volume、Variety、Value和Velocity),即體量大、多樣性、價(jià)值密度低、速度快[4-5]。
(1) 數(shù)據(jù)量巨大。從TB級(jí)別,躍升到PB級(jí)別。
(2) 數(shù)據(jù)類型繁多,除了傳統(tǒng)的文本格式,還包括網(wǎng)絡(luò)日志、視頻、音頻、圖片和地理位置信息等各種結(jié)構(gòu)的數(shù)據(jù)。
(3) 價(jià)值密度低。如在1小時(shí)的視頻監(jiān)控?cái)?shù)據(jù)中,有用的數(shù)據(jù)可能僅僅只有1~2 s。
(4) 處理速度快。數(shù)據(jù)處理遵循 “1秒定律” ,可從各種類型的數(shù)據(jù)中快速獲得高價(jià)值的信息[6]。
2大數(shù)據(jù)對(duì)地震科技情報(bào)服務(wù)的影響
2.1地震科技情報(bào)服務(wù)工作現(xiàn)狀
我國的地震信息化從20世紀(jì)60年代開始,包括物理參數(shù)、數(shù)據(jù)傳輸?shù)男Ч蛿?shù)據(jù)的分析等,都圍繞著數(shù)據(jù)進(jìn)行。我國地震監(jiān)測(cè)工作,從單一的觀測(cè)發(fā)展到由測(cè)震、電磁、形變和地下流體等多學(xué)科、多測(cè)項(xiàng)類別的綜合觀測(cè)體系; 觀測(cè)技術(shù)逐步實(shí)現(xiàn)了從模擬觀測(cè)向數(shù)字化、智能化、網(wǎng)絡(luò)化等方式的轉(zhuǎn)變; 逐步建立了基本覆蓋全國及重點(diǎn)區(qū)域的地震監(jiān)測(cè)臺(tái)網(wǎng)[7]。這些監(jiān)測(cè)臺(tái)站和監(jiān)測(cè)設(shè)備每天為我們記錄了海量的數(shù)據(jù)信息,這些數(shù)據(jù)都匯總到中國地震臺(tái)網(wǎng)中心,用于進(jìn)行地震預(yù)測(cè)和科學(xué)研究。
在地震信息化建設(shè)的基礎(chǔ)上,地震科技情報(bào)服務(wù)工作近幾年取得了豐碩的成果。目前,中國地震臺(tái)網(wǎng)中心(以下簡稱“臺(tái)網(wǎng)中心”)已初步建立了地震科研的文獻(xiàn)保障服務(wù)體系,成為防震減災(zāi)基礎(chǔ)性工作的重要支撐部分。數(shù)字圖書館已擁有40余種外文原版期刊的全文電子版; 480余種中文地學(xué)類期刊的全文檢索服務(wù)及8萬多種中文圖書; 5萬多篇天文學(xué)、地球科學(xué)類的博碩論文; 維普、超星、萬方等中文電子資源數(shù)據(jù)庫鏡像站點(diǎn)[8]?!暗卣鹂萍紮n案資料查詢系統(tǒng)” 通過地震系統(tǒng)各單位的共建共享,目前已擁有25個(gè)單位的35000卷科技檔案信息,以及14個(gè)單位的47000份資料信息,全面記錄和反映了地震監(jiān)測(cè)預(yù)報(bào)、震害防御以及應(yīng)急救援工作的成果和進(jìn)展。
利用這些文獻(xiàn)資源,臺(tái)網(wǎng)中心開展了與地震預(yù)測(cè)預(yù)報(bào)工作密切相關(guān)的咨詢和服務(wù)。經(jīng)中國地震局批準(zhǔn)(中震科[1999]109號(hào)),自1999年起成立了中國地震局地震科技信息查新咨詢站。10多年來,該站為地震科研人員開展了卓有成效的服務(wù)。情報(bào)研究工作不斷向深層次、綜合性方向發(fā)展,先后實(shí)施了 “地震科技快訊” 、“國別政策研究” 、“大震應(yīng)急和快速信息服務(wù)” 、“國際地震科技動(dòng)態(tài)跟蹤調(diào)研” 、“國外主要災(zāi)害應(yīng)急救援機(jī)構(gòu)和管理體系調(diào)研” 、“國際應(yīng)急管理動(dòng)態(tài)” 、“防震減災(zāi)十二五規(guī)劃編制預(yù)研究” 、“地震巨災(zāi)應(yīng)對(duì)機(jī)制研究” 等項(xiàng)目,追蹤報(bào)道了上百次國內(nèi)外發(fā)生的破壞性地震的應(yīng)急調(diào)研資料,有關(guān)情報(bào)研究的專輯、報(bào)告和綜述對(duì)中國地震局有關(guān)規(guī)劃的制定和 “三大工作體系” 建設(shè),具有很好的參考和借鑒價(jià)值。
2.2大數(shù)據(jù)為地震科技情報(bào)服務(wù)行業(yè)帶來的機(jī)遇
大數(shù)據(jù)技術(shù)已被應(yīng)用于地震速報(bào)、地震應(yīng)急等防震減災(zāi)事業(yè),并已取得了一些實(shí)效。如自2013年4月起,臺(tái)網(wǎng)中心利用手機(jī)APP、微博、微信、網(wǎng)站等實(shí)現(xiàn)了自動(dòng)地震速報(bào),并于2015年3月份與大數(shù)據(jù)服務(wù)商 “今日頭條” 完成了技術(shù)對(duì)接,地震臺(tái)網(wǎng)一旦監(jiān)測(cè)到地震,自動(dòng)觸發(fā)和實(shí)時(shí)處理系統(tǒng)就會(huì)自動(dòng)分析并生成地震速報(bào)參數(shù),并利用 “今日頭條” 的精準(zhǔn)推送引擎在第一時(shí)間推送給受地震災(zāi)害影響的民眾。同樣,大數(shù)據(jù)也為地震科技情報(bào)服務(wù)行業(yè)提供了發(fā)展和提升的機(jī)遇。
首先,大數(shù)據(jù)時(shí)代,科技相關(guān)資源逐漸向數(shù)字化轉(zhuǎn)變,為科技情報(bào)檢索提供了基礎(chǔ)。隨著數(shù)字圖書館和機(jī)構(gòu)知識(shí)庫的發(fā)展,圖書和期刊等科技文獻(xiàn)資源逐漸被數(shù)字化并被保存到各種數(shù)據(jù)庫中,這些資源的數(shù)字化使原始文獻(xiàn)中的字、詞、段落、作者信息、關(guān)鍵詞和其他相關(guān)信息都能夠被精準(zhǔn)識(shí)別,為搜索引擎的檢索提供了便利條件,并可提高檢索的效率和準(zhǔn)確性。信息只有被數(shù)字化,才能釋放出其潛在的巨大情報(bào)價(jià)值。
其次,大數(shù)據(jù)的用戶行為分析能力為我們科技情報(bào)服務(wù)機(jī)構(gòu)了解和把握用戶信息行為提供了可能。如今人們已離不開網(wǎng)絡(luò)和智能手機(jī)、ipad、筆記本電腦等移動(dòng)終端設(shè)備,用戶的信息行為產(chǎn)生了大量的數(shù)據(jù),通過對(duì)這些數(shù)據(jù)的挖掘和分析可以預(yù)判用戶的信息行為,為科技情報(bào)事業(yè)提供了精準(zhǔn)把握科研人員及科研機(jī)構(gòu)等科技主體信息行為的潛在機(jī)會(huì),這有助于我們根據(jù)用戶需求提供行業(yè)領(lǐng)域科技動(dòng)態(tài)情報(bào)服務(wù),而且可以根據(jù)信息用戶的興趣愛好傾向,探索個(gè)性化、智能化和精確化的情報(bào)推送服務(wù)模式。
再次,大數(shù)據(jù)具有強(qiáng)大的預(yù)測(cè)能力,有利于開展更加精準(zhǔn)的科技情報(bào)服務(wù)。高價(jià)值的精準(zhǔn)情報(bào)服務(wù)需要大數(shù)據(jù)和大數(shù)據(jù)相關(guān)技術(shù)的支撐。在大數(shù)據(jù)環(huán)境下,我們可以分析與具體現(xiàn)象相關(guān)的更為全面的數(shù)據(jù),而不僅僅依賴傳統(tǒng)的文獻(xiàn)數(shù)據(jù),這將大大提高情報(bào)分析的準(zhǔn)確性,尤其是在預(yù)測(cè)行業(yè)動(dòng)態(tài)方面。
2.3大數(shù)據(jù)為地震科技情報(bào)服務(wù)行業(yè)帶來的挑戰(zhàn)
首先,在數(shù)據(jù)采集方面。大數(shù)據(jù)是包羅萬象的數(shù)據(jù),其類型繁多,既包括科技文獻(xiàn)、科學(xué)實(shí)驗(yàn)和日常工作數(shù)據(jù),又包括網(wǎng)頁、圖片、視頻、圖像與位置信息等半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)信息。數(shù)據(jù)源的多樣性增加了我們數(shù)據(jù)采集工作的難度[9]。
其次,在數(shù)據(jù)的組織和存儲(chǔ)方面。海量數(shù)據(jù)給軟硬件處理能力帶來巨大壓力。海量地震數(shù)據(jù)的組織、管理和多維度檢索愈發(fā)困難,同時(shí)老機(jī)器無法滿足海量數(shù)據(jù)的處理要求,存儲(chǔ)設(shè)備投資巨大,更重要的是,在大數(shù)據(jù)的應(yīng)用中會(huì)遇到存儲(chǔ)問題和數(shù)據(jù)安全問題。
再次,在數(shù)據(jù)的加工分析方面。以往的科技情報(bào)工作在做定量分析時(shí),最常用的是基于結(jié)構(gòu)化數(shù)據(jù)庫的文獻(xiàn)計(jì)量學(xué)方法,而在大數(shù)據(jù)環(huán)境下,還需對(duì)各種半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行挖掘和分析。如何對(duì)巨量異構(gòu)數(shù)據(jù)進(jìn)行處理并從中獲取有價(jià)值的情報(bào),是傳統(tǒng)地震科技情報(bào)行業(yè)的軟肋。這就要求我們跨越傳統(tǒng)思維,將目光從傳統(tǒng)的科技文獻(xiàn)、監(jiān)測(cè)數(shù)據(jù)的加工處理轉(zhuǎn)移到云計(jì)算等先進(jìn)的數(shù)據(jù)處理技術(shù)上。
3大數(shù)據(jù)環(huán)境下地震科技情報(bào)服務(wù)工作的應(yīng)對(duì)措施
3.1變革理念,突破被動(dòng)的科技情報(bào)服務(wù)理念
傳統(tǒng)的地震科技情報(bào)服務(wù)工作大都是上級(jí)下達(dá)或用戶發(fā)起的情報(bào)服務(wù)任務(wù),往往是為了滿足領(lǐng)導(dǎo)或用戶的情報(bào)需求。這種服務(wù)理念是被動(dòng)的,已不能滿足大數(shù)據(jù)時(shí)代的情報(bào)服務(wù)需求。大數(shù)據(jù)環(huán)境下,我們必須變被動(dòng)為主動(dòng),鼓勵(lì)創(chuàng)新與發(fā)展,增強(qiáng)自己的信息服務(wù)意識(shí),探索主動(dòng)式情報(bào)服務(wù)模式,具體到地震科技情報(bào)服務(wù)領(lǐng)域,就是要求我們必須嵌入到科研人員的科研工作當(dāng)中,向科研人員提供主動(dòng)推送式信息服務(wù),以提高用戶滿意度和科研效率。情報(bào)服務(wù)工作不能滿足于僅為科研人員、各級(jí)領(lǐng)導(dǎo)和職能部門提供科技文獻(xiàn)服務(wù)和防震減災(zāi)信息,同時(shí)還應(yīng)拓展為全社會(huì)服務(wù)的渠道。
3.2創(chuàng)新方法,建立基于大數(shù)據(jù)的情報(bào)服務(wù)方法
以往的地震科技情報(bào)研究工作主要采用基于文獻(xiàn)和外文資料的編譯和整理以及提供科技查新等簡單的情報(bào)服務(wù)模式,在大數(shù)據(jù)時(shí)代,我們需要在應(yīng)用中不斷優(yōu)化和改進(jìn)現(xiàn)有情報(bào)方法; 由于半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)開始進(jìn)入科技情報(bào)研究領(lǐng)域,所以我們必須嘗試突破和超越文獻(xiàn),探索基于大數(shù)據(jù)的支撐地震科學(xué)研究的新的情報(bào)服務(wù)模式。例如,機(jī)構(gòu)知識(shí)庫融合了機(jī)構(gòu)或組織各種類型的知識(shí)資源和智力成果,并提供數(shù)據(jù)分析和統(tǒng)計(jì)功能,我們可以建設(shè)機(jī)構(gòu)知識(shí)庫并基于機(jī)構(gòu)知識(shí)庫的大數(shù)據(jù)向科研人員及管理部門提供更高層次的情報(bào)分析產(chǎn)品; 同時(shí),可以基于大數(shù)據(jù)中的用戶興趣模型,掌握用戶的信息行為偏好和取向,向用戶提供定制化的精準(zhǔn)科技情報(bào)服務(wù)。
3.3發(fā)展技術(shù),鼓勵(lì)大數(shù)據(jù)技術(shù)的發(fā)展和應(yīng)用
大數(shù)據(jù)要求海量的數(shù)據(jù)存儲(chǔ)與智能的加工處理,對(duì)現(xiàn)有的信息存儲(chǔ)和處理技術(shù)提出了更高的要求,這就要求我們廣泛應(yīng)用先進(jìn)的技術(shù)工具和手段。大數(shù)據(jù)技術(shù)是從大量、多樣、分散和異構(gòu)的數(shù)據(jù)集中提取有用信息的核心技術(shù),包括實(shí)時(shí)流數(shù)據(jù)處理及智能分析技術(shù)等。美國麥肯錫全球研究所在 “大數(shù)據(jù): 創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿領(lǐng)域” 的研究報(bào)告中討論了26項(xiàng)適用于眾多行業(yè)的大數(shù)據(jù)分析技術(shù)[10],北京大學(xué)李廣建教授將這些技術(shù)劃分為可視化分析、數(shù)據(jù)挖掘和語義處理3大類[11]。我們應(yīng)該根據(jù)地震行業(yè)自身的特點(diǎn),引入大數(shù)據(jù)技術(shù)中的適用技術(shù),如可視化技術(shù)和云計(jì)算等??梢暬夹g(shù)是對(duì)非空間的、非數(shù)值型的和高維信息進(jìn)行視覺表現(xiàn)的理論、方法和技術(shù),已被廣泛應(yīng)用于各種學(xué)科領(lǐng)域的情報(bào)研究工作中[12]。此外,數(shù)字圖書館應(yīng)廣泛利用云計(jì)算技術(shù),整合豐富的海量信息資源,為用戶提供優(yōu)質(zhì)而全面的云服務(wù)。
3.4加強(qiáng)培訓(xùn),建設(shè)地震科技情報(bào)服務(wù)隊(duì)伍
面對(duì)大數(shù)據(jù)時(shí)代帶來的復(fù)雜的數(shù)據(jù)環(huán)境和情報(bào)需求,我們必須建立一支具有大數(shù)據(jù)分析能力的復(fù)合型人才隊(duì)伍。目前,地震科技情報(bào)服務(wù)人員多來自圖書情報(bào)學(xué)、外語和計(jì)算機(jī)科學(xué)背景,少量來自地球物理和地質(zhì)學(xué)科,而大數(shù)據(jù)環(huán)境要求我們科技情報(bào)服務(wù)行業(yè)引進(jìn)具有多學(xué)科、多專業(yè)知識(shí)背景的復(fù)合型人才,尤其是計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)方面的人才; 同時(shí),應(yīng)積極為現(xiàn)有地震科技情報(bào)服務(wù)人員提供特定技術(shù)培訓(xùn)機(jī)會(huì),完善和豐富他們的知識(shí)結(jié)構(gòu),鼓勵(lì)他們學(xué)習(xí)信息檢索、數(shù)據(jù)挖掘及大數(shù)據(jù)分析技術(shù),加強(qiáng)統(tǒng)計(jì)學(xué)方面的培訓(xùn),掌握在大數(shù)據(jù)平臺(tái)上進(jìn)行情報(bào)分析的方法和工具。鼓勵(lì)他們參加課題實(shí)踐,逐步使他們成為地震科技情報(bào)服務(wù)領(lǐng)域的咨詢專家,使其具備完成大數(shù)據(jù)時(shí)代地震科技情報(bào)服務(wù)任務(wù)的各項(xiàng)能力。
參 考 文 獻(xiàn)
[1] 楊鴻智. 數(shù)據(jù)的征服: 讀《大數(shù)據(jù)時(shí)代》. (2013-07-13)[2015-07-12] http:∥blog.sina.com.cn/s/blog_43b0f4b301019p5p.html
[2] 董曉婷. 大數(shù)據(jù)的定義特征及其應(yīng)用分析. 硅谷, 2013(11): 120
[3] 王麗梅. 大數(shù)據(jù)時(shí)代下高校圖書館信息咨詢服務(wù)的探討. 農(nóng)業(yè)網(wǎng)絡(luò)信息, 2013(12): 85-87
[4] 楊紅平. 基于大數(shù)據(jù)的公安情報(bào)研究. 湖北警官學(xué)院學(xué)報(bào), 2014(2): 6-9
[5] 晉照麗. 大數(shù)據(jù)技術(shù)在高校圖書館服務(wù)中的應(yīng)用. 農(nóng)業(yè)圖書情報(bào)學(xué)刊, 2014,26(11): 149-151
[6] 彭默馨, 張璐. 大數(shù)據(jù)時(shí)代要有大方略. 學(xué)習(xí)時(shí)報(bào), 2012-07-09
[7] 全國地震監(jiān)測(cè)臺(tái)站. [2015-08-21]. http:∥www.csi.ac.cn/publish/main/631/1118/index.html
[8] 張晉輝. 中國地震臺(tái)網(wǎng)中心機(jī)構(gòu)知識(shí)庫構(gòu)建方案初探. 國際地震動(dòng)態(tài), 2013(12): 29-36
[9] 劉如, 吳晨生, 李夢(mèng)輝. 大數(shù)據(jù)時(shí)代科技情報(bào)工作的機(jī)遇與變革. 情報(bào)理論與實(shí)踐, 2015(6): 35-39
[10] Manyika J,Chui M,Brown B. Big data: The next frontier for innovation, competition, and productivity. Analytics, 2011
[11] 李廣建, 楊林. 大數(shù)據(jù)視角下的情報(bào)研究與情報(bào)研究技術(shù). 圖書與情報(bào), 2012(6): 1-8
[12] 彭愿. 地震數(shù)據(jù)的可視化技術(shù). 武漢: 中國地震局地震研究所, 2013
Thinking about earthquake science and technical information service under the background of big data
Zhang Jinhui, Cui Qiuwen
(China Earthquake Networks Center,Beijing 100045,China)
AbstractThe arrival of the era of big data has brought opportunities and challenges to the earthquake science and technology information service. In this paper,we discussed the concepts and features of big data,analyzed the opportunities and challenges,and proposed the measures for earthquake science and technology information service based on four perspectives,including ideas,methods,techniques and team building.
Keywordsearthquake science and technology information service; big data; thinking
中圖分類號(hào):P315;
文獻(xiàn)標(biāo)識(shí)碼:A;
doi:10.3969/j.issn.0235-4975.2016.01.006
通訊作者:※張晉輝,e-mail: zhangjh@seis.ac.cn。
* 收稿日期:2015-10-12; 采用日期: 2015-12-23。