韓 媛,張紅英,粱 楠
(中國(guó)地質(zhì)調(diào)查局西安地質(zhì)調(diào)查中心,西安 710054)
大數(shù)據(jù)在地質(zhì)資料管理與服務(wù)中“落地”問題分析
韓媛,張紅英,粱楠
(中國(guó)地質(zhì)調(diào)查局西安地質(zhì)調(diào)查中心,西安 710054)
大數(shù)據(jù)已成為繼云計(jì)算、物聯(lián)網(wǎng)之后新的IT熱詞。大數(shù)據(jù)與每個(gè)人的生活息息相關(guān)。地質(zhì)資料數(shù)據(jù)包括了基礎(chǔ)地質(zhì)、礦產(chǎn)、地球物理、地球化學(xué)等豐富的信息,對(duì)國(guó)家、社會(huì)具有巨大的潛在應(yīng)用價(jià)值和保存價(jià)值。地質(zhì)資料管理與服務(wù)如何與大數(shù)據(jù)技術(shù)更好地結(jié)合,產(chǎn)生更大的價(jià)值,值得研究。以基層地質(zhì)資料館為例,分析地質(zhì)資料管理與服務(wù)的現(xiàn)狀及需求,探索如何借鑒大數(shù)據(jù)思維,改進(jìn)地質(zhì)資料管理與服務(wù)工作,實(shí)現(xiàn)地質(zhì)數(shù)據(jù)高效管理,有效地挖掘,使寶貴的地質(zhì)資料數(shù)據(jù)發(fā)揮出更大的社會(huì)使用價(jià)值。
大數(shù)據(jù);地質(zhì)資料;信息服務(wù);數(shù)據(jù)共享
引用格式:韓媛,張紅英,粱楠.大數(shù)據(jù)在地質(zhì)資料管理與服務(wù)中“落地”問題分析[J].中國(guó)地質(zhì)調(diào)查,2016,3(3):67-70.
大數(shù)據(jù)是指大小超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具的抓取、存儲(chǔ)、管理和分析能力的數(shù)據(jù)群[1]。大數(shù)據(jù)已成為繼云計(jì)算、物聯(lián)網(wǎng)之后新的IT熱詞,各行各業(yè)高度關(guān)注的熱點(diǎn)。大數(shù)據(jù)具有數(shù)據(jù)量大(Volume)、數(shù)據(jù)種類多樣(Variety)、實(shí)時(shí)性強(qiáng)(Velocity)、蘊(yùn)藏商業(yè)價(jià)值大(Value)的特性,簡(jiǎn)稱具有“4V”的特點(diǎn)。
地質(zhì)資料數(shù)據(jù)是指在地質(zhì)調(diào)查、礦產(chǎn)勘查和科研工作中形成的,以文字、圖表、聲像、標(biāo)本、樣品測(cè)試分析、巖礦心等不同形式存在的地質(zhì)、礦產(chǎn)和實(shí)物信息等。按地質(zhì)專業(yè)分,包括了基礎(chǔ)地質(zhì)、礦產(chǎn)、地球物理、地球化學(xué)、重砂、遙感、水文、環(huán)境等方面豐富的信息。地質(zhì)資料數(shù)據(jù)對(duì)國(guó)家、社會(huì)具有保存價(jià)值和巨大的潛在應(yīng)用價(jià)值。據(jù)不完全統(tǒng)計(jì),目前全國(guó)各類地質(zhì)工作所形成的地質(zhì)信息及其數(shù)據(jù)總量在PB級(jí)以上。從地質(zhì)資料數(shù)據(jù)種類、數(shù)據(jù)量級(jí)、高商業(yè)價(jià)值等特點(diǎn)來看,它完全符合大數(shù)據(jù)的特征。
從全球來看,地質(zhì)資料管理與服務(wù)的主要發(fā)展趨勢(shì)是由主動(dòng)借閱服務(wù)向知識(shí)服務(wù)轉(zhuǎn)變[2]。地質(zhì)資料除應(yīng)用于地質(zhì)找礦、災(zāi)害預(yù)防、科學(xué)研究等方面之外,在城市規(guī)劃、建設(shè)、國(guó)防安全等方面,還有更加廣闊的應(yīng)用前景。做好大數(shù)據(jù)時(shí)代下地質(zhì)資料管理與應(yīng)用工作,實(shí)現(xiàn)地質(zhì)資料高效管理、合理分析,深挖地質(zhì)資料內(nèi)在價(jià)值,是地質(zhì)資料管理由被動(dòng)借閱向知識(shí)服務(wù)轉(zhuǎn)變的具體體現(xiàn),使地質(zhì)資料得到更充分、更有效的利用,為社會(huì)發(fā)展提供更有效的支撐。
1.1地質(zhì)資料管理及服務(wù)現(xiàn)狀
我國(guó)省、部?jī)杉?jí)政府部門共有33個(gè)地質(zhì)資料館藏機(jī)構(gòu),石油天然氣和海洋地質(zhì)資料委托保管機(jī)構(gòu)35個(gè)。地質(zhì)資料分散存儲(chǔ)在各級(jí)保管單位,由保管單位完成每年資料的匯交、檢查、保管和借閱服務(wù)[3]。以往,由于國(guó)家政策、歷史沿革、技術(shù)手段等諸多原因,地質(zhì)資料管理長(zhǎng)期存在資料信息分散、綜合研究力度不夠、數(shù)字化信息化程度不高、服務(wù)渠道不暢、服務(wù)能力不強(qiáng)等問題,形成信息孤島,使地質(zhì)資料信息的巨大潛在價(jià)值未能得到充分發(fā)揮。
近年來,隨著《找礦突破戰(zhàn)略行動(dòng)綱要(2011—2020年)》的不斷推進(jìn),地質(zhì)資料管理與服務(wù)工作在“十二五”期間得到飛速的發(fā)展。以中國(guó)地質(zhì)調(diào)查局西安地質(zhì)調(diào)查中心(下簡(jiǎn)稱西安地質(zhì)調(diào)查中心)地質(zhì)資料管理服務(wù)工作為例,主要體現(xiàn)在以下幾個(gè)方面:
(1)地質(zhì)數(shù)據(jù)資源得到不斷積累。近十年來,隨著國(guó)家對(duì)西北地區(qū)地質(zhì)調(diào)查工作投入的傾斜,地質(zhì)調(diào)查項(xiàng)目激增,地質(zhì)資料數(shù)據(jù)增長(zhǎng)迅猛。同時(shí)開展館藏重要地質(zhì)檔案圖文數(shù)字化,巖石礦物古生物標(biāo)本收集整理等工作,豐富了地質(zhì)信息內(nèi)容。
(2)開展成果地質(zhì)調(diào)查資料信息集成整合,形成系列服務(wù)產(chǎn)品。近年來西安地質(zhì)調(diào)查中心地質(zhì)資料館,建立了包括地質(zhì)成果地質(zhì)資料、原始資料的案卷級(jí)、文件級(jí)目錄數(shù)據(jù)庫(kù),地質(zhì)資料元數(shù)據(jù)庫(kù),西北地區(qū)地質(zhì)工作程度“一張圖”數(shù)據(jù)庫(kù),西北地區(qū)1∶25萬、1∶20萬、1∶5萬等不同比例尺的區(qū)域地質(zhì)圖空間數(shù)據(jù)庫(kù),西北地區(qū)1∶20萬區(qū)域地球化學(xué)數(shù)據(jù)庫(kù),西北地區(qū)礦產(chǎn)評(píng)價(jià)成果基本信息數(shù)據(jù)庫(kù),西北地區(qū)地質(zhì)災(zāi)害信息服務(wù)數(shù)據(jù)庫(kù)等一系列不同專業(yè)、不同比例尺的基礎(chǔ)地學(xué)數(shù)據(jù)庫(kù)。這些數(shù)據(jù)庫(kù)為提升西北地區(qū)地質(zhì)資料管理與服務(wù)信息化水平奠定了基礎(chǔ)。
(3)研發(fā)、部署一系列地質(zhì)信息平臺(tái)。西安地質(zhì)調(diào)查中心自主研發(fā)“地學(xué)空間信息檢索平臺(tái)”,該平臺(tái)實(shí)現(xiàn)了廣域網(wǎng)節(jié)點(diǎn)集群地質(zhì)資料信息資源匯聚,并在地質(zhì)大數(shù)據(jù)分布式計(jì)算環(huán)境中成功部署,解決了因大數(shù)據(jù)效應(yīng)導(dǎo)致的地質(zhì)資料數(shù)據(jù)存儲(chǔ)、遷移、檢索及分析等諸多環(huán)節(jié)面臨的效率瓶頸。部署了“中國(guó)地質(zhì)調(diào)查信息網(wǎng)格”、“地質(zhì)調(diào)查協(xié)同部署平臺(tái)”、“地質(zhì)調(diào)查項(xiàng)目運(yùn)行監(jiān)管系統(tǒng)”等一系列地質(zhì)調(diào)查項(xiàng)目管理、業(yè)務(wù)信息系統(tǒng)。在地質(zhì)調(diào)查項(xiàng)目管理和具體實(shí)施過程中,“數(shù)字地質(zhì)填圖系統(tǒng)”、“探礦工程數(shù)據(jù)編錄系統(tǒng)”、“數(shù)字地質(zhì)調(diào)查信息綜合平臺(tái)”及“資源儲(chǔ)量估算與礦體三維建模信息系統(tǒng)”等數(shù)字地質(zhì)調(diào)查系統(tǒng)也得到廣泛的應(yīng)用。
(4)開展非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)與處理等技術(shù)的探索。通過“西安結(jié)點(diǎn)非結(jié)構(gòu)化地質(zhì)數(shù)據(jù)集成于服務(wù)應(yīng)用示范”、“地質(zhì)資料集群化產(chǎn)業(yè)化試點(diǎn)研究”、“地質(zhì)資料集群示范”等項(xiàng)目的開展,初步進(jìn)行非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)、處理及分析等技術(shù)的探索,取得初步成效。
1.2存在問題
隨著近年來地質(zhì)信息化工作的不斷推進(jìn),地質(zhì)資料管理與服務(wù)信息化水平得以提高。從數(shù)據(jù)層面、技術(shù)層面為大數(shù)據(jù)時(shí)代下地質(zhì)資料信息管理與服務(wù)研究奠定了良好的基礎(chǔ),但還存在一些問題:
(1)地質(zhì)資料匯交不及時(shí),信息公布不及時(shí)。地質(zhì)工作本身周期較長(zhǎng),一般為2~3 a,在這過程中地質(zhì)資料信息一般都不對(duì)外公開。在項(xiàng)目結(jié)題后,由于諸多原因,還有些項(xiàng)目組沒有及時(shí)匯交地質(zhì)資料。在資料匯交后有部分資料館藏單位也未能將信息及時(shí)公布,這就造成無法快速、全面地收集數(shù)據(jù)。
(2)地質(zhì)資料信息管理與服務(wù)信息化水平雖然不斷提高,但在數(shù)據(jù)的管理與分析方面還是缺乏大數(shù)據(jù)思維,數(shù)據(jù)分析能力也有待提高。近年來建成的數(shù)據(jù)庫(kù)多為傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù),現(xiàn)行的信息系統(tǒng)也都比較孤立,數(shù)據(jù)再利用率并不高,且缺乏統(tǒng)一規(guī)劃,對(duì)資料價(jià)值的深挖程度低,交叉綜合利用率也不高,使得數(shù)據(jù)未能產(chǎn)生更大的價(jià)值。
為使地質(zhì)資料數(shù)據(jù)更有效地利用,發(fā)揮更大的價(jià)值,需要借鑒大數(shù)據(jù)思維,從制度、標(biāo)準(zhǔn)、技術(shù)等方面,進(jìn)一步推進(jìn)數(shù)據(jù)共享、提高數(shù)據(jù)分析與挖掘能力,才能使地質(zhì)資料數(shù)據(jù)不斷產(chǎn)生潛在價(jià)值,實(shí)現(xiàn)數(shù)據(jù)價(jià)值的最大化。
2.1大數(shù)據(jù)對(duì)地質(zhì)資料管理與服務(wù)的作用
目前,我國(guó)地勘單位眾多,地質(zhì)資料的儲(chǔ)存較為分散。地質(zhì)資料數(shù)據(jù)儲(chǔ)存形式較為多樣,包含了文字、圖表、聲像、電磁介質(zhì)等形式的原始地質(zhì)資料、成果地質(zhì)資料和巖礦心、標(biāo)本、光薄片及樣品等實(shí)物地質(zhì)資料等不同類型、不同結(jié)構(gòu)的資料。要想使地質(zhì)數(shù)據(jù)資料信息在大數(shù)據(jù)時(shí)代能發(fā)揮更有效的作用,首先要進(jìn)行數(shù)據(jù)的匯聚、共享,其次要以用戶需求為導(dǎo)向進(jìn)行數(shù)據(jù)的挖掘。
要做到以上2點(diǎn),從技術(shù)方面,可通過先進(jìn)的大數(shù)據(jù)相關(guān)信息技術(shù),實(shí)現(xiàn)對(duì)異構(gòu)數(shù)據(jù)的管理,對(duì)過多節(jié)點(diǎn)數(shù)據(jù)的共享,實(shí)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián);從管理保障方面,建立符合大數(shù)據(jù)理念的管理機(jī)制,制定完善制度標(biāo)準(zhǔn),推進(jìn)數(shù)據(jù)共享,重視自身數(shù)據(jù)人才的培養(yǎng),并與外界加強(qiáng)合作。
2.2大數(shù)據(jù)平臺(tái)架構(gòu)思想
地質(zhì)資料管理與服務(wù)大數(shù)據(jù)分析平臺(tái)的系統(tǒng)架構(gòu)如圖1所示。系統(tǒng)包含3個(gè)層次:數(shù)據(jù)源、平臺(tái)層和應(yīng)用層。數(shù)據(jù)源是大數(shù)據(jù)平臺(tái)的基礎(chǔ),包括地質(zhì)工作過程中產(chǎn)生的文本、圖形、視頻、數(shù)據(jù)庫(kù)及實(shí)物標(biāo)本等一系列的地質(zhì)數(shù)據(jù)及工作流數(shù)據(jù);大數(shù)據(jù)平臺(tái)層是大數(shù)據(jù)平臺(tái)的核心層,提供大數(shù)據(jù)存儲(chǔ)和綜合分析功能,實(shí)現(xiàn)數(shù)據(jù)的有效匯聚、有效管理,實(shí)現(xiàn)數(shù)據(jù)查詢、分析及可視化展示等功能;應(yīng)用層是根據(jù)分析預(yù)測(cè)的結(jié)果,為用戶提供大數(shù)據(jù)解決方案。
圖1 地質(zhì)資料管理與服務(wù)大數(shù)據(jù)分析平臺(tái)架構(gòu)Fig.1 Architecture of large data analysis p latform for geological data managem ent and service
2.3地質(zhì)資料信息的收集
大數(shù)據(jù)基于數(shù)據(jù)的匯聚,一但數(shù)據(jù)本身不準(zhǔn)確,就可能導(dǎo)致錯(cuò)誤的分析、預(yù)測(cè)和決策結(jié)果。所以準(zhǔn)確、全面的數(shù)據(jù)是大數(shù)據(jù)的基礎(chǔ)。地質(zhì)資料采集應(yīng)進(jìn)一步加強(qiáng)數(shù)據(jù)質(zhì)量與實(shí)效的控制,擴(kuò)大數(shù)據(jù)采集范圍。
傳統(tǒng)地質(zhì)資料數(shù)據(jù)采集多偏向?qū)I(yè)數(shù)據(jù),在大數(shù)據(jù)背景下,地質(zhì)工作各個(gè)業(yè)務(wù)流程所產(chǎn)生的數(shù)據(jù)都是有用信息,對(duì)這方面數(shù)據(jù)的收集、采集應(yīng)予以重視。以往由于地質(zhì)資料的匯交不暢、地質(zhì)資料數(shù)字化程度不高等原因,眾多有價(jià)值的地質(zhì)資料沒有及時(shí)收集,造成地質(zhì)數(shù)據(jù)信息滯后。應(yīng)加強(qiáng)地質(zhì)資料的匯交監(jiān)管,加快地質(zhì)資料數(shù)字化進(jìn)程,加強(qiáng)如數(shù)字地質(zhì)填圖掌上機(jī)等基于物聯(lián)網(wǎng)數(shù)據(jù)信息的實(shí)時(shí)數(shù)據(jù)的采集與積累,提高地質(zhì)調(diào)查數(shù)據(jù)采集的時(shí)效性。此外,應(yīng)建立更廣泛的地質(zhì)資料信息范疇。相較中國(guó)較為分散及單一的地質(zhì)資料信息范疇,地質(zhì)資料信息在美國(guó)囊括了包括氣象、地球特性、生態(tài)系統(tǒng)、環(huán)境問題、地理分析、地質(zhì)過程、水文過程、自然災(zāi)害、自然資源、海洋及海岸線、行星、動(dòng)植物、科技應(yīng)用、水生資源等多個(gè)方面信息[4]。更廣泛的地質(zhì)資料信息,使基于大數(shù)據(jù)的分析、預(yù)測(cè)結(jié)果更加準(zhǔn)確。
2.4制定完善制度標(biāo)準(zhǔn),推進(jìn)數(shù)據(jù)共享
近年來,地質(zhì)信息服務(wù)的不斷推進(jìn),地質(zhì)數(shù)據(jù)的共享程度有了一定的提高。但由于歷史、政策等一系列原因,數(shù)據(jù)開放程度仍有待提高。如數(shù)據(jù)儲(chǔ)存分散,形成的“數(shù)據(jù)孤島”現(xiàn)象較為嚴(yán)重;由于地質(zhì)數(shù)據(jù)取得的成本高、困難大及涉密等問題,數(shù)據(jù)共享程度依然偏低。大數(shù)據(jù)體系下,在政策允許范圍內(nèi),應(yīng)制定一系列制度,例如加強(qiáng)地質(zhì)資料目錄的共享制度。近年來,全國(guó)地質(zhì)資料館先后建成了全國(guó)地質(zhì)資料目錄中心,匯總了各?。▍^(qū))地質(zhì)資料館藏目錄,從很大程度上提升了全國(guó)地質(zhì)資料信息的共享程度,但并沒有建成各省地質(zhì)資料館對(duì)全國(guó)地質(zhì)資料目錄中心的實(shí)時(shí)更新的制度,造成數(shù)據(jù)資源共享不及時(shí)。建議建立健全全國(guó)地質(zhì)資料目錄中心實(shí)時(shí)更新制度,推進(jìn)數(shù)據(jù)共享。此外,地質(zhì)資料匯交制度,公益性地質(zhì)資料的界定及共享制度,非公益性地質(zhì)調(diào)查數(shù)據(jù)的交換原則等,也應(yīng)進(jìn)一步完善,促成數(shù)據(jù)共享、匯集。避免因數(shù)據(jù)的重復(fù)采集等而造成資金的浪費(fèi),實(shí)現(xiàn)信息高效率利用。
大數(shù)據(jù)需要建立規(guī)則和標(biāo)準(zhǔn)。數(shù)據(jù)產(chǎn)生價(jià)值需要共享和交換,意味數(shù)據(jù)彼此的接口可以建立。一方面為滿足用戶對(duì)數(shù)據(jù)重復(fù)使用、關(guān)聯(lián)分析及自由加工等需求,數(shù)據(jù)的標(biāo)準(zhǔn)和相關(guān)原則應(yīng)該得到統(tǒng)一;另一方面制定合理、合法的規(guī)則和標(biāo)準(zhǔn),使數(shù)據(jù)提供者的利益得到相應(yīng)的保護(hù)。所以大數(shù)據(jù)的標(biāo)準(zhǔn)體系建設(shè)就成為非常重要的環(huán)節(jié)。
2.5以用戶需求為導(dǎo)向,加強(qiáng)數(shù)據(jù)深挖
大數(shù)據(jù)時(shí)代下,地質(zhì)工作逐漸向需求驅(qū)動(dòng)型的模式轉(zhuǎn)變,了解用戶需求就顯得尤為重要。在地質(zhì)資料管理與服務(wù)中,通過加強(qiáng)對(duì)用戶行為數(shù)據(jù)的收集和分析,及時(shí)了解“誰,何時(shí)、何地、關(guān)心何內(nèi)容?他們有什么共性?他們對(duì)數(shù)據(jù)的評(píng)價(jià)如何?”等信息,進(jìn)而挖掘用戶的興趣,準(zhǔn)確地向用戶“推薦”地質(zhì)資料,加強(qiáng)地質(zhì)資料處理與服務(wù)的針對(duì)性。并且通過這種積累和分析,一方面基于用戶實(shí)時(shí)反饋,及時(shí)改進(jìn)策略,不斷提升數(shù)據(jù)分析、處理能力,提高服務(wù)的準(zhǔn)確度;另一方面,在地礦領(lǐng)域本體庫(kù)的輔助支持下,可智能地理解用戶需求,實(shí)現(xiàn)語(yǔ)義級(jí)查詢檢索,也可以通過互聯(lián)網(wǎng)地礦信息快速收集整理,智能分析地礦行業(yè)社會(huì)輿情,甚至及時(shí)做出趨勢(shì)預(yù)判[5]。因此,需要根據(jù)地質(zhì)調(diào)查工作的特點(diǎn),以用戶業(yè)務(wù)需求為驅(qū)動(dòng),開發(fā)數(shù)據(jù)應(yīng)用模式,創(chuàng)建數(shù)據(jù)挖掘模型,把握數(shù)據(jù)、信息與工具的業(yè)務(wù)命脈,創(chuàng)造數(shù)據(jù)的持續(xù)可利用價(jià)值[6]。
2.6重視自身數(shù)據(jù)人才培養(yǎng),并與外界加強(qiáng)合作
大數(shù)據(jù)技術(shù)的關(guān)鍵在于對(duì)含有一定意義的較準(zhǔn)確的龐大數(shù)據(jù)進(jìn)行專業(yè)、智能化的處理,從中分析、挖掘出有價(jià)值的信息。數(shù)據(jù)挖掘和分析如果不夠準(zhǔn)確,會(huì)直接影響大數(shù)據(jù)分析和預(yù)測(cè)效果,有時(shí)甚至是與實(shí)際背離,所以強(qiáng)大的數(shù)據(jù)分析挖掘能力非常重要。就地質(zhì)行業(yè)本身而言,現(xiàn)階段數(shù)據(jù)和業(yè)務(wù)的結(jié)合還較為松散,這就需要更多既懂專業(yè)又具有大數(shù)據(jù)思維的專業(yè)人員,他們不但了解業(yè)務(wù),也熟悉數(shù)據(jù)框架體系,同時(shí)能對(duì)現(xiàn)有專業(yè)數(shù)據(jù)指標(biāo)進(jìn)行思考和有效分析。
在互聯(lián)網(wǎng)時(shí)代,地質(zhì)行業(yè)是傳統(tǒng)行業(yè)。傳統(tǒng)行業(yè)要想在大數(shù)據(jù)時(shí)代有所作為,必須多方合作。一是獲取更多更廣泛的數(shù)據(jù);二是尋求與大數(shù)據(jù)領(lǐng)域優(yōu)秀的公司合作,進(jìn)行數(shù)據(jù)的深度分析與挖掘。但要注意的是,地質(zhì)數(shù)據(jù)專業(yè)性較強(qiáng),所以還不能完全依賴大數(shù)據(jù)領(lǐng)域的公司進(jìn)行分析,必須采取緊密的合作模式,才能開發(fā)出符合行業(yè)特點(diǎn)的大數(shù)據(jù)分析工具,得出正確、有效的分析預(yù)測(cè)結(jié)果。
2.7采取先試點(diǎn)、后推廣的策略
大數(shù)據(jù)在應(yīng)用實(shí)施中,應(yīng)采取先試點(diǎn)、后推廣的策略[7]。選擇一些有代表性方向進(jìn)行試點(diǎn),投石問路。避免一哄而上,避免因頂層設(shè)計(jì)出現(xiàn)問題或模型錯(cuò)誤造成損失。通過大數(shù)據(jù)試點(diǎn),各方面的工作不斷完善,大數(shù)據(jù)的作業(yè)模型不斷改進(jìn),為大數(shù)據(jù)的全面鋪開打好基礎(chǔ)。逐步實(shí)施、改進(jìn)大數(shù)據(jù)架構(gòu),最終落實(shí)大數(shù)據(jù)應(yīng)用,支撐行業(yè)的戰(zhàn)略決策。
大數(shù)據(jù)要想落地,必須有2個(gè)條件:一是豐富的數(shù)據(jù)源;二是強(qiáng)大的數(shù)據(jù)挖掘和分析能力。大數(shù)據(jù)時(shí)代下地質(zhì)資料管理與服務(wù)也要從這兩方面著手,做好數(shù)據(jù)的收集、匯聚工作,通過各種手段提升數(shù)據(jù)的挖掘和分析能力。制定合理的標(biāo)準(zhǔn)、政策方針,采取先試點(diǎn)、后推廣的策略。使大數(shù)據(jù)在地質(zhì)資料管理與服務(wù)工作中“落地”,使地質(zhì)資料數(shù)據(jù)產(chǎn)生更大價(jià)值。
[1] Manyika J,ChuiM,Brown B,et al.Big data:The next frontier for innovation,competition,and productivity[R].[s.l.]:McKinsey Global Institute,2011.
[2] 連健,丁克永,吳小平,等.地質(zhì)資料管理與服務(wù)國(guó)外發(fā)展形勢(shì)跟蹤研究[J].中國(guó)礦業(yè),2013,22(7):63-67.
[3] 賈文玨,周舟.地質(zhì)資料信息集群化共享服務(wù)平臺(tái)關(guān)鍵技術(shù)研究[J].國(guó)土資源信息化,2012(5):19-22.
[4] 蘆書文,朱衛(wèi)紅.美國(guó)地質(zhì)資料信息服務(wù)發(fā)展研究[J].中國(guó)礦業(yè),2013,22(9):77-82.
[5] 屈紅剛.大數(shù)據(jù)視角下的地礦工作發(fā)展與變革研究[J].國(guó)土資源信息化,2014(5):34-39.
[6] Rajaraman A,Ullman JD.大數(shù)據(jù):互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理[M].王斌,譯.北京:人民郵電出版社,2012.
[7] 趙剛.大數(shù)據(jù)咨詢:邁向成功的第一步[EB/OL].趙剛的博客,2013.
(責(zé)任編輯:劉永權(quán))
Analysis of the big data“l(fā)anding”in geological data management and service
HAN Yuan,ZHANG Hongying,LIANG Nan
(Xi'an Center of Geological Survey,China Geological Survey,Xi'an 710054,China)
Big data hasbeen a new IT hotword after cloud computing and internetof thingsand it connectseveryone's life.Geological data includes basic geology,mine,geophysics and geochemistry.All of these data have significantapplication value for the nation and society.Combining the big data with geological data and service is worth investigating.The basic geological librarywas taken as an example in this paper to analyze the geologicaldatamanagementand present service and demand situation.Also the exploration of big data thinking,improvement of geological datamanagementand service,realization of the efficientmanagementand effectively extraction of data are considered in this research.Thiswork gives a brief introduction of the greatapplication value of geological data for whole society.
big data;geological data;information service;data sharing
P537;P539
A
2095-8706(2016)03-0067-04
2015-07-15;
2016-03-03。
中國(guó)地質(zhì)調(diào)查局“地質(zhì)調(diào)查數(shù)據(jù)集成與服務(wù)系統(tǒng)建設(shè)(西北)(編號(hào):1212011120422)”項(xiàng)目資助。
韓媛(1982—),女,工程師,主要從事地質(zhì)資料管理、服務(wù)及信息化研究。Email:17521942@qq.com。