趙傳玉
(1.中國(guó)石油化工股份有限公司石油勘探開(kāi)發(fā)研究院,北京 102206;2.中國(guó)石化地質(zhì)資料中心,北京 102206)
本文的文獻(xiàn)來(lái)源于中國(guó)知網(wǎng)學(xué)術(shù)期刊數(shù)據(jù)庫(kù),考慮到“地質(zhì)資料”是“實(shí)物地質(zhì)資料”的上位概念(屬概念),但在實(shí)際工作中,一般將實(shí)物地質(zhì)資料管理相關(guān)工作單獨(dú)討論,故本文暫不討論有關(guān)實(shí)物地質(zhì)資料管理的前沿?zé)狳c(diǎn)與發(fā)展趨勢(shì)。具體收集方法是在中國(guó)知網(wǎng)學(xué)術(shù)期刊數(shù)據(jù)庫(kù)的高級(jí)檢索界面,選擇“篇名”字段,以“‘地質(zhì)資料’OR‘地質(zhì)檔案’NOT‘實(shí)物地質(zhì)資料’”作為精確檢索詞,時(shí)間范圍選擇“2000—2021年”(筆者的檢索日期為2021年9月15日),更新時(shí)間選擇“不限”,來(lái)源類(lèi)別選擇“全部期刊”,為了保證數(shù)據(jù)的有效性,對(duì)檢索結(jié)果進(jìn)行人工篩選,去除外文文獻(xiàn),去除會(huì)議、消息、采訪等無(wú)關(guān)文獻(xiàn)后,得到1 072篇有效文獻(xiàn)。
本文使用CiteSpace(引文空間)軟件對(duì)所收集文獻(xiàn)進(jìn)行可視化分析,CiteSpace是美國(guó)Drexel大學(xué)的陳超美教授開(kāi)發(fā)的一種免費(fèi)的、基于Java的軟件[2],是一款著眼于分析科學(xué)文獻(xiàn)中蘊(yùn)含的潛在知識(shí),在科學(xué)計(jì)量學(xué)、數(shù)據(jù)可視化背景下逐漸發(fā)展起來(lái)的一款引文可視化分析軟件。由于是通過(guò)可視化的手段來(lái)呈現(xiàn)科學(xué)知識(shí)的結(jié)構(gòu)、規(guī)律和分布情況,因此也將通過(guò)此類(lèi)方法分析得到的可視化圖形稱(chēng)為“科學(xué)知識(shí)圖譜”,是目前使用最廣泛的繪制知識(shí)圖譜的工具之一[3]。
筆者將篩選后的1 072篇有效文獻(xiàn)以Refworks格式導(dǎo)出,經(jīng)過(guò)CiteSpace5.8.R2版進(jìn)行格式轉(zhuǎn)化后,導(dǎo)入進(jìn)行可視化分析。在可視化分析之前,將分析時(shí)間段設(shè)置為2000年1月1日—2021年8月31日,選取author(作者)為節(jié)點(diǎn)類(lèi)型進(jìn)行作者共現(xiàn)分析,選取institution(機(jī)構(gòu))為節(jié)點(diǎn)類(lèi)型進(jìn)行研究機(jī)構(gòu)共現(xiàn)分析,選取keywords(關(guān)鍵詞)作為節(jié)點(diǎn)類(lèi)型進(jìn)行文獻(xiàn)關(guān)鍵詞共現(xiàn)分析以及關(guān)鍵詞聚類(lèi)分析。
不同時(shí)間段的發(fā)文數(shù)量可以一定程度反映該領(lǐng)域的研究熱度和趨勢(shì),具有統(tǒng)計(jì)學(xué)的指導(dǎo)意義。本次分析的發(fā)文總量是1 072篇,發(fā)文量最高的年份是2018年,為101篇,發(fā)文量最低的年份為2001年,僅為7篇,詳見(jiàn)圖1。由圖1可知,二十余年來(lái)關(guān)于“地質(zhì)資料”的研究呈現(xiàn)出兩個(gè)高峰期,2000年以來(lái)發(fā)文量總體上呈逐年上升之勢(shì),到2013年到達(dá)第一個(gè)高點(diǎn),其后回落至2015年到達(dá)低谷,隨后再次攀升,到2018年到達(dá)第二個(gè)高峰,之后略有下降。根據(jù)各年發(fā)文的數(shù)量可知,2000—2010年,平均每年發(fā)文量是25.6篇,在2011—2020年間平均每年發(fā)文量為76.1篇,是前一階段的近3倍,由此可見(jiàn)2010年后對(duì)于地質(zhì)資料的研究熱度提升,未來(lái)對(duì)該領(lǐng)域的研究很可能繼續(xù)保存較高的熱度。但是也必須看到,自2002年《地質(zhì)資料管理?xiàng)l例》頒布實(shí)施后,對(duì)有關(guān)地質(zhì)資料方面的研究逐漸升溫,在經(jīng)歷了2013年和2018年兩個(gè)熱潮后,逐漸降溫,尤其是近年來(lái)相關(guān)文獻(xiàn)的發(fā)表數(shù)量下降較為明顯,值得從業(yè)人員警醒。
圖1 2000—2021年發(fā)表的關(guān)于“地質(zhì)資料”的文獻(xiàn)數(shù)量Fig.1 The number of papers issued about “geological data” from 2000 to 2021
用CiteSpace軟件聚類(lèi)分析對(duì)1 072篇文獻(xiàn)進(jìn)行分析,得到作者發(fā)文數(shù)量以及核心作者合作共現(xiàn)圖譜,見(jiàn)圖2和表1。根據(jù)圖譜顯示,文獻(xiàn)發(fā)表數(shù)量最多的作者的發(fā)文總量是24篇,N=425,E=425,Density=0.004 7,說(shuō)明共有425位作者發(fā)文,作者合作發(fā)文的次數(shù)為425次,但是合作網(wǎng)絡(luò)密度只有0.004 7。可見(jiàn)研究同一方向的作者合作較為緊密,但是研究不同方向的作者合作很少,應(yīng)當(dāng)加強(qiáng)不同領(lǐng)域的研究者之間的合作。經(jīng)過(guò)CiteSpace軟件進(jìn)一步分析,得出作者的中心性表格(表1),中心性即代表文章的影響程度。由表1可以看出發(fā)文量前10的作者和發(fā)文影響力前10的作者之間有50%的重合率,即發(fā)文量排名前10的作者,有5位是發(fā)文影響力排名前10的作者。由此可知,在地質(zhì)資料管理領(lǐng)域,作者的發(fā)文量與作者的影響程度之間的相關(guān)性較為明顯,即發(fā)文量多的作者影響力也較大。
圖2 關(guān)于“地質(zhì)資料”的發(fā)文作者合作關(guān)系共現(xiàn)圖譜Fig.2 Co-occurrence map of authors’ cooperative relationship on “geological data” papers
表1 關(guān)于“地質(zhì)資料”的發(fā)文數(shù)量以及中心性排名前10位的作者Table 1 Top 10 central authors and papers issued on “geological data” papers
關(guān)于“地質(zhì)資料”的發(fā)文機(jī)構(gòu)的合作共現(xiàn)圖譜,見(jiàn)圖3和表2。根據(jù)圖譜顯示,圖譜中N=650,E=3,Density=0,說(shuō)明各機(jī)構(gòu)之間的合作數(shù)量?jī)H為3次,可見(jiàn)各個(gè)機(jī)構(gòu)之間幾乎沒(méi)有合作,應(yīng)當(dāng)加強(qiáng)各個(gè)機(jī)構(gòu)之間的合作。鑒于合作程度太低,CiteSpace軟件無(wú)法分析各發(fā)文機(jī)構(gòu)的中心性,但是由表1可知,發(fā)文量排名前10位的作者,發(fā)文影響力排名前10位的作者,分別有10名和9名為中國(guó)地質(zhì)調(diào)查局發(fā)展研究中心或/和全國(guó)地質(zhì)資料館的員工,可見(jiàn)在地質(zhì)資料管理研究領(lǐng)域,全國(guó)地質(zhì)資料館扮演著極其重要的作用。
表2 關(guān)于“地質(zhì)資料”的發(fā)文數(shù)量排名前10位的機(jī)構(gòu)Table 2 Top 10 institutions on issued “geological data” papers
圖3 關(guān)于“地質(zhì)資料”的核心機(jī)構(gòu)發(fā)文合作關(guān)系共現(xiàn)圖譜Fig.3 Co-occurrence map of core institutions on “geological data” papers
文獻(xiàn)的關(guān)鍵詞很大程度上反應(yīng)一篇文獻(xiàn)的研究主題,關(guān)鍵詞的頻次也可以反映主題的研究熱度。通過(guò)對(duì)關(guān)于“地質(zhì)資料”的文獻(xiàn)關(guān)鍵詞的共現(xiàn)分析,得到關(guān)鍵詞的詞頻以及中心性,見(jiàn)圖4和表3。圖4中的節(jié)點(diǎn)代表關(guān)鍵詞,節(jié)點(diǎn)半徑越寬,代表關(guān)鍵詞出現(xiàn)的頻率越高。以1 a為最小時(shí)間間隔,得到關(guān)鍵詞的突現(xiàn)詞圖譜,如圖5所示,可以分析對(duì)某一關(guān)鍵詞研究的興起情況。通過(guò)CiteSpace軟件對(duì)關(guān)鍵詞進(jìn)一步進(jìn)行聚類(lèi)分析,得到高頻關(guān)鍵詞所屬的7個(gè)研究主題,如圖6所示,根據(jù)熱度排序分別為地質(zhì)檔案、地質(zhì)資料、管理、開(kāi)發(fā)利用、經(jīng)驗(yàn)教訓(xùn)、檔案管理和電子文檔。將聚類(lèi)后的主題以時(shí)間線為橫軸,以主題詞為縱軸,得到關(guān)鍵詞時(shí)區(qū)圖譜,如圖7所示。由圖4~圖7可知,自2000年以來(lái),始終有學(xué)者在從事信息化、開(kāi)發(fā)利用、利用服務(wù)、電子文檔、數(shù)據(jù)庫(kù)、數(shù)字資源、大數(shù)據(jù)方面的研究,表現(xiàn)出地質(zhì)資料管理研究的三大主線,即信息化、數(shù)字資源與利用服務(wù)。
圖5 關(guān)于“地質(zhì)資料”的文獻(xiàn)關(guān)鍵詞突現(xiàn)圖譜Fig.5 Burst map of keywords on “geological data” papers
圖6 關(guān)于“地質(zhì)資料”的文獻(xiàn)主題聚類(lèi)共現(xiàn)圖譜Fig.6 Co-occurrence map of subject clustering on “geological data” papers
圖7 關(guān)于“地質(zhì)資料”的文獻(xiàn)關(guān)鍵詞時(shí)區(qū)圖譜Fig.7 Time-zone map of keywords on “geological data” papers
表3 關(guān)于“地質(zhì)資料”的文獻(xiàn)關(guān)鍵詞詞頻及中心性排名前20位Table 3 Top 20 keywords frequency and central keywords on “geological data” papers
圖4 關(guān)于“地質(zhì)資料”的文獻(xiàn)關(guān)鍵詞共現(xiàn)圖譜Fig.4 Co-occurrence map of keywords on “geological data” papers
通過(guò)CiteSpace軟件的聚類(lèi)分析,結(jié)合對(duì)有關(guān)地質(zhì)資料核心期刊論文的研讀,筆者試對(duì)地質(zhì)資料管理的研究熱點(diǎn)與前沿做如下分析。
對(duì)地質(zhì)資料信息化建設(shè)的研究,是近十年來(lái)地質(zhì)資料管理研究的熱點(diǎn),主要是結(jié)合新技術(shù)的出現(xiàn),針對(duì)新技術(shù)在地質(zhì)資料管理工作中如何應(yīng)用的研究,重點(diǎn)集中于地質(zhì)云、大數(shù)據(jù)與5G時(shí)代地質(zhì)資料信息化、信息系統(tǒng)與平臺(tái)、數(shù)據(jù)中心等方面。
在地質(zhì)云建設(shè)方面,學(xué)者們重點(diǎn)對(duì)地質(zhì)云的構(gòu)建、數(shù)據(jù)加工、系統(tǒng)建設(shè)等方面進(jìn)行了研究。陳建平等[4]提出,在國(guó)家大數(shù)據(jù)戰(zhàn)略背景下構(gòu)建地質(zhì)云,要以數(shù)據(jù)需求為核心目標(biāo),以數(shù)據(jù)鏈技術(shù)流程和大數(shù)據(jù)技術(shù)方法為手段,并探討了大數(shù)據(jù)技術(shù)和理念在地質(zhì)圖件和文本類(lèi)地質(zhì)資料中的應(yīng)用;梁虹等[5]分析了地質(zhì)云成都中心分節(jié)點(diǎn)系統(tǒng)架構(gòu)建設(shè)、服務(wù)體系,提出通過(guò)地質(zhì)云建設(shè),可消除各單位之間的數(shù)據(jù)鴻溝,匯聚海量的數(shù)據(jù)資源,提高資料服務(wù)獲取能力,將地質(zhì)調(diào)查工作向在線化、智能化工作模式轉(zhuǎn)變;安天浩等[6]介紹了依托地質(zhì)云北京有色節(jié)點(diǎn),開(kāi)展有色地質(zhì)資料的數(shù)字化加工流程與信息化系統(tǒng)建設(shè)情況并總結(jié)了相關(guān)實(shí)踐經(jīng)驗(yàn)。學(xué)者們的研究,偏向地質(zhì)云平臺(tái)的構(gòu)建,對(duì)如何通過(guò)地質(zhì)云平臺(tái)加強(qiáng)對(duì)地質(zhì)資料原生電子文件的歸檔與管理、地質(zhì)資料數(shù)據(jù)資源匯聚與利用服務(wù)方面,還有待深化研究。
在大數(shù)據(jù)與5G時(shí)代地質(zhì)資料信息化建設(shè)方面,學(xué)者們主要對(duì)大數(shù)據(jù)環(huán)境下地質(zhì)資料信息化建設(shè)的內(nèi)容、方向、保障等方面進(jìn)行了研究。黃少芳等[7-8]提出大數(shù)據(jù)背景下的地質(zhì)資料信息化建設(shè),數(shù)字化是基礎(chǔ),網(wǎng)絡(luò)運(yùn)行體系是保障,標(biāo)準(zhǔn)化是重要條件,數(shù)字資料館是目標(biāo),知識(shí)管理、開(kāi)發(fā)與服務(wù)是方向;孔昭煜等[9]提出要從網(wǎng)絡(luò)保障體系、數(shù)據(jù)支撐保障體系和數(shù)據(jù)安全保障體系三方面建設(shè)地質(zhì)資料數(shù)字資源管理保障體系;劉春娥[10]提出大數(shù)據(jù)背景下地質(zhì)資料信息化建設(shè)的關(guān)鍵要素包括地質(zhì)云平臺(tái)、大數(shù)據(jù)應(yīng)用服務(wù)系統(tǒng)和技術(shù)標(biāo)準(zhǔn)體系,有效策略包括做好數(shù)字化轉(zhuǎn)換、強(qiáng)化知識(shí)創(chuàng)新、做好保障支撐;高洋等[11]探討了陜西省從數(shù)據(jù)服務(wù)環(huán)境建設(shè)、外部數(shù)據(jù)整合、多源內(nèi)容重構(gòu)整合等方面開(kāi)展大數(shù)據(jù)環(huán)境下的地質(zhì)資料智能服務(wù)的具體做法;宋艷茹等[12]提出在5G時(shí)代通過(guò)地質(zhì)大數(shù)據(jù)、地質(zhì)云建設(shè)和人工智能的融合應(yīng)用,地質(zhì)工作將向“云+端”的地質(zhì)調(diào)查模式轉(zhuǎn)變。學(xué)者們的研究,主要著眼于對(duì)目前在研、在用技術(shù)的介紹和探討,對(duì)大數(shù)據(jù)、5G等新興信息技術(shù)在地質(zhì)資料管理方面的落地融合應(yīng)用,還缺乏深入的研究。
在信息系統(tǒng)與平臺(tái)建設(shè)方面,學(xué)者們主要對(duì)系統(tǒng)與平臺(tái)建設(shè)思路、體系架構(gòu)、功能實(shí)現(xiàn)、運(yùn)維保障等方面進(jìn)行了研究。馬艷[13]從設(shè)計(jì)框架、軟硬件部署、功能設(shè)置、安全策略、應(yīng)用現(xiàn)狀等方面探討了地質(zhì)資料信息管理系統(tǒng)的構(gòu)建和展望;陳忠良等[14]從信息化技術(shù)下地質(zhì)數(shù)據(jù)采集與管理、數(shù)據(jù)分析與綜合、社會(huì)化服務(wù)業(yè)務(wù)流程重組入手,提出了地質(zhì)資料信息服務(wù)平臺(tái)的設(shè)計(jì)思路,對(duì)平臺(tái)的架構(gòu)、體系結(jié)構(gòu)、核心要素間關(guān)聯(lián)及關(guān)鍵技術(shù)展開(kāi)討論;夏菁等[15]探討了地質(zhì)資料信息化綜合管理平臺(tái)的總體架構(gòu),主要功能與數(shù)據(jù)庫(kù)設(shè)計(jì)思路,提出了平臺(tái)功能實(shí)現(xiàn)路徑;孔昭煜等[16]從物理環(huán)境、IT基礎(chǔ)設(shè)施運(yùn)行、網(wǎng)絡(luò)環(huán)境、存儲(chǔ)和備份系統(tǒng)運(yùn)行、安全管控等方面,對(duì)數(shù)字地質(zhì)資料館平臺(tái)智慧運(yùn)維體系進(jìn)行了探索和實(shí)踐;汪艷梅等[17]則以?xún)?nèi)蒙古地質(zhì)資料接收管理系統(tǒng)信息系統(tǒng)為麻雀,對(duì)其設(shè)計(jì)、開(kāi)發(fā)與應(yīng)用進(jìn)行了解剖。這些研究,對(duì)地質(zhì)資料管理系統(tǒng)的建設(shè)具有一定的指導(dǎo)意義,但是對(duì)以前端控制理念、文件生命周期理論指導(dǎo)地質(zhì)資料管理系統(tǒng)建設(shè),實(shí)現(xiàn)地質(zhì)資料管理系統(tǒng)與各項(xiàng)業(yè)務(wù)系統(tǒng)的集成整合方面研究不夠深入系統(tǒng)。
在地質(zhì)資料數(shù)據(jù)中心建設(shè)方面,學(xué)者們重點(diǎn)對(duì)數(shù)據(jù)中心基礎(chǔ)設(shè)施、基礎(chǔ)架構(gòu)、管理體系與技術(shù)規(guī)范等方面開(kāi)展了研究。楊麗君[18]從IT基礎(chǔ)體系、數(shù)據(jù)資源體系、應(yīng)用服務(wù)體系、信息安全體系、標(biāo)準(zhǔn)規(guī)范體系、管理體系等方面闡述了上海市地質(zhì)資料數(shù)據(jù)中心建設(shè)和運(yùn)營(yíng)的關(guān)鍵技術(shù)和具體措施;孔昭煜等[19]對(duì)國(guó)家地質(zhì)資料數(shù)據(jù)中心基礎(chǔ)設(shè)施建設(shè)和運(yùn)行維護(hù)工作進(jìn)行了詳細(xì)介紹,對(duì)其基礎(chǔ)設(shè)施進(jìn)行了功能分析;孔昭煜等[20]對(duì)地質(zhì)資料數(shù)據(jù)中心基礎(chǔ)環(huán)境、基礎(chǔ)架構(gòu)和管理體系進(jìn)行了綜合研究;趙林林等[21]從文件級(jí)數(shù)據(jù)組織、地圖服務(wù)標(biāo)準(zhǔn)、可視化服務(wù)、主-分中心同步機(jī)制等方面探討了地質(zhì)云分布式數(shù)據(jù)中心數(shù)據(jù)建設(shè)有關(guān)機(jī)制。這些研究,對(duì)于從技術(shù)層面指導(dǎo)地質(zhì)資料數(shù)據(jù)中心建設(shè)具有重要意義,對(duì)于從業(yè)務(wù)層面指導(dǎo)地質(zhì)資料數(shù)據(jù)中心建設(shè)較為欠缺。
對(duì)地質(zhì)資料數(shù)字資源建設(shè)的研究,主要集中于匯交電子文檔制作與管理、電子文件(檔)管理、地質(zhì)資料數(shù)據(jù)庫(kù)建設(shè)等方面。
在匯交電子文檔制作與管理方面,學(xué)者們重點(diǎn)探討了成果地質(zhì)資料電子文檔制作方面的相關(guān)問(wèn)題。李向東[22]從電子文檔制作流程、目錄數(shù)據(jù)的著錄方面探討了成果地質(zhì)資料電子文檔的制作方法;孔媛媛等[23]以MapGis為例,梳理了附圖類(lèi)電子文件格式要求、地質(zhì)圖件常見(jiàn)問(wèn)題及歸檔要求,探討了附圖類(lèi)存檔電子文件的制作方法;席同熙等[24]梳理了項(xiàng)目與資料匯交內(nèi)容的關(guān)系,探討了不同種類(lèi)成果地質(zhì)資料電子文件匯交格式的運(yùn)用;馬飛飛等[25]對(duì)比了可信時(shí)間戳、數(shù)字簽名、MD5散列算法三種不同原始性保證技術(shù)在匯交地質(zhì)資料方面的優(yōu)缺點(diǎn),證明MD5散列算法在地質(zhì)資料原始性檢驗(yàn)方面具有操作簡(jiǎn)單、成本低、無(wú)負(fù)擔(dān)等優(yōu)勢(shì);蘇循新等[26]從便于地勘單位制作匯交、館藏機(jī)構(gòu)利于今后保管和更好地服務(wù)于借閱查詢(xún)的角度出發(fā),就如何規(guī)范電子文件命名和統(tǒng)一匯交數(shù)據(jù)格式等進(jìn)行了研究。這些成果,偏向于在操作層面指導(dǎo)匯交電子文檔的制作,對(duì)于多個(gè)匯交項(xiàng)目存在的電子文檔重名,技術(shù)飛速發(fā)展環(huán)境下匯交電子文檔格式優(yōu)選、長(zhǎng)期保存策略、存儲(chǔ)載體等方面未進(jìn)行系統(tǒng)研究,對(duì)匯交電子文檔的長(zhǎng)期科學(xué)保管與有效利用服務(wù)缺乏指導(dǎo)。
在電子文件(檔)管理方面,學(xué)者們重點(diǎn)探討了地質(zhì)資料電子文件的安全和質(zhì)量方面的問(wèn)題。馬卓敏等[27]以“焦家式”金礦地質(zhì)資料信息服務(wù)集群化和產(chǎn)業(yè)化工作為例,提出要從全方位監(jiān)管、標(biāo)準(zhǔn)和制度化管理、安全化管理、專(zhuān)業(yè)化管理和雙軌制管理五個(gè)方面,提升新時(shí)代地質(zhì)資料電子文檔管理水平;毛明[28]分析了地質(zhì)資料電子文檔在其使用環(huán)節(jié)上面臨的安全隱患和威脅,從管理、技術(shù)、人員三個(gè)方面提出了保護(hù)電子文檔的思路與對(duì)策;杜艷玲等[29]從收集、存儲(chǔ)、應(yīng)用三方面對(duì)地質(zhì)資料電子文件管理存在的問(wèn)題進(jìn)行了梳理,有針對(duì)性地提出了電子文件質(zhì)量管理的應(yīng)對(duì)策略。這些研究相對(duì)較為淺顯,沒(méi)有從前沿技術(shù)、技術(shù)發(fā)展、管理與技術(shù)并重等方面系統(tǒng)探討電子文件的安全和管理問(wèn)題。
在地質(zhì)資料數(shù)據(jù)庫(kù)建設(shè)方面,學(xué)者們則重點(diǎn)討論了地質(zhì)資料目錄服務(wù)中心、數(shù)據(jù)庫(kù)建設(shè)、元數(shù)據(jù)、數(shù)字資源建設(shè)方面的問(wèn)題。連健等[30]研究了全國(guó)地質(zhì)資料目錄服務(wù)中心系統(tǒng)的總體技術(shù)路線、功能框架以及數(shù)據(jù)庫(kù)架構(gòu),指出了需要解決的關(guān)鍵問(wèn)題;伍錦程等[31]闡述了XML結(jié)構(gòu)化文本數(shù)據(jù)在WEB應(yīng)用系統(tǒng)上數(shù)據(jù)交換的優(yōu)勢(shì),并對(duì)采用XML語(yǔ)言對(duì)地質(zhì)資料多元異構(gòu)信息進(jìn)行了統(tǒng)一化結(jié)構(gòu)描述;齊釩宇等[32]提出要從打破信息壁壘,建立相應(yīng)的法規(guī)政策體系,重視原始地質(zhì)資料的數(shù)字資源管理,聯(lián)合各級(jí)地質(zhì)資料館藏機(jī)構(gòu)等方面來(lái)提升地質(zhì)資料數(shù)字資源的管理與服務(wù)水平;田園等[33]通過(guò)對(duì)美國(guó)地質(zhì)調(diào)查局科學(xué)數(shù)據(jù)目錄庫(kù)的開(kāi)發(fā)背景、主要功能、數(shù)據(jù)管理與服務(wù)融合等方面進(jìn)行分析,提出了對(duì)我國(guó)地質(zhì)資料目錄數(shù)據(jù)庫(kù)的建設(shè)及社會(huì)化服務(wù)的借鑒和啟示;袁雪玲[34]則分析了當(dāng)前我國(guó)地質(zhì)資料目錄建設(shè)現(xiàn)狀,針對(duì)地質(zhì)資料目錄數(shù)據(jù)庫(kù)建設(shè)存在的問(wèn)題提出了建議措施;商云濤等[35]從總體設(shè)計(jì)原則、系統(tǒng)平臺(tái)架構(gòu)、功能設(shè)計(jì)與實(shí)現(xiàn)、技術(shù)實(shí)現(xiàn)難點(diǎn)等方面進(jìn)行了地質(zhì)資料服務(wù)元數(shù)據(jù)互聯(lián)互查平臺(tái)設(shè)計(jì)研究;高學(xué)正等[36-37]闡述了地質(zhì)資料元數(shù)據(jù)著錄系統(tǒng)的設(shè)計(jì)原則、系統(tǒng)架構(gòu)、功能實(shí)現(xiàn)以及技術(shù)實(shí)現(xiàn)難點(diǎn),并從數(shù)字地質(zhì)資料館數(shù)字資源組織與建設(shè)的角度出發(fā),從元數(shù)據(jù)系統(tǒng)、元數(shù)據(jù)成果與數(shù)據(jù)服務(wù)進(jìn)展等方面全面論述了地質(zhì)資料元數(shù)據(jù)建設(shè)情況,分析當(dāng)前館藏機(jī)構(gòu)在元數(shù)據(jù)建設(shè)中存在的問(wèn)題并提出了相關(guān)建議。這些研究對(duì)地質(zhì)資料目錄數(shù)據(jù)庫(kù)設(shè)、統(tǒng)一的地質(zhì)資料目錄數(shù)據(jù)資源匯聚建設(shè)具有很強(qiáng)的指導(dǎo)意義,但是對(duì)統(tǒng)一的地質(zhì)資料全文數(shù)據(jù)資源中心建設(shè)還可以進(jìn)行更長(zhǎng)遠(yuǎn)、深入和系統(tǒng)的研究。
對(duì)地質(zhì)資料利用服務(wù)的研究,主要集中于地質(zhì)資料知識(shí)服務(wù)、社會(huì)化服務(wù)、網(wǎng)絡(luò)化服務(wù)以及大數(shù)據(jù)時(shí)代的地質(zhì)資料信息服務(wù)等方面。
在地質(zhì)資料知識(shí)服務(wù)方面,學(xué)者們的研究重點(diǎn)是地質(zhì)資料向知識(shí)服務(wù)的轉(zhuǎn)型。齊釩宇等[38]指出地質(zhì)資料知識(shí)服務(wù)將成為新常態(tài),提出了包括知識(shí)檢索、知識(shí)關(guān)聯(lián)、細(xì)粒度知識(shí)聚合和產(chǎn)品研發(fā)、用戶(hù)需求定制與智能推送服務(wù)四個(gè)方面的地質(zhì)資料知識(shí)服務(wù)策略;李敏等[39]提出了基于本體構(gòu)建地質(zhì)數(shù)據(jù)知識(shí)模型、基于關(guān)聯(lián)數(shù)據(jù)實(shí)現(xiàn)地質(zhì)資料機(jī)構(gòu)知識(shí)庫(kù)的語(yǔ)義擴(kuò)展以及基于地質(zhì)大數(shù)據(jù)的知識(shí)檢索模型;高洋等[40]以知識(shí)流動(dòng)為切入點(diǎn),分析了地質(zhì)知識(shí)在文本中的內(nèi)在知識(shí)構(gòu)成和外在類(lèi)型特征,提出了知識(shí)結(jié)構(gòu)化的思路和方法。這些研究反映出,學(xué)者們普遍認(rèn)為地質(zhì)資料向知識(shí)服務(wù)的轉(zhuǎn)型已是大勢(shì)所趨,并進(jìn)行了積極的探索,取得了可觀的成績(jī),但是對(duì)地質(zhì)資料中蘊(yùn)含的隱性知識(shí)的顯性化方面的探索還未深入進(jìn)行。
在地質(zhì)資料社會(huì)化服務(wù)方面,學(xué)者們主要在地質(zhì)資料社會(huì)化服務(wù)政策,社會(huì)化服務(wù)問(wèn)題及建議方面進(jìn)行研究。許百泉等[41]提出地質(zhì)資料社會(huì)服務(wù)的發(fā)展趨勢(shì)是信息化、知識(shí)化、標(biāo)準(zhǔn)化、屬地化和低成本化,并給出了建立統(tǒng)一服務(wù)標(biāo)準(zhǔn)、開(kāi)展專(zhuān)題服務(wù)、提升信息化服務(wù)能力和推進(jìn)服務(wù)產(chǎn)業(yè)化四個(gè)方面的對(duì)策建議;高學(xué)正等[42]提出要充分開(kāi)展社會(huì)化服務(wù),需要健全服務(wù)體系、豐富服務(wù)內(nèi)容、完善信息系統(tǒng),而孫克峰等[43]則認(rèn)為要樹(shù)立服務(wù)意識(shí)、加強(qiáng)服務(wù)宣傳、創(chuàng)新服務(wù)方式、豐富服務(wù)內(nèi)容、完善制度建設(shè)、強(qiáng)化服務(wù)監(jiān)督;丁克永等[44]提出了從服務(wù)組織形式創(chuàng)新、理念創(chuàng)新、產(chǎn)品創(chuàng)新、管理創(chuàng)新、技術(shù)創(chuàng)新、人才培養(yǎng)等多方面探索地質(zhì)資料服務(wù)“供給側(cè)”的具體措施;連健等[45]則提出要從增強(qiáng)基本服務(wù)、推進(jìn)開(kāi)發(fā)共享、加強(qiáng)能力建設(shè)三方面優(yōu)化地質(zhì)資料社會(huì)化服務(wù)政策。這些研究反映出業(yè)界已經(jīng)摒棄了傳統(tǒng)模式重管理輕服務(wù)的管理理念,并對(duì)新常態(tài)下地質(zhì)資料服務(wù)工作進(jìn)行了廣泛的探索,但是對(duì)于地質(zhì)資料社會(huì)服務(wù)主體、客體以及雙方之間的關(guān)系,服務(wù)產(chǎn)品開(kāi)發(fā)、服務(wù)社會(huì)化方面還沒(méi)有深入、系統(tǒng)的研究。
在地質(zhì)資料網(wǎng)絡(luò)化服務(wù)方面,學(xué)者們主要圍繞網(wǎng)絡(luò)服務(wù)形式、“互聯(lián)網(wǎng)+”、LBS(Location Based Services)以及移動(dòng)智能終端服務(wù)方面進(jìn)行研究。高學(xué)正等[46]將地質(zhì)資料網(wǎng)絡(luò)服務(wù)產(chǎn)品分為查詢(xún)服務(wù)、空間數(shù)據(jù)服務(wù)、專(zhuān)題服務(wù)、信息類(lèi)和互聯(lián)互查服務(wù)五大類(lèi);吳小平等[47]認(rèn)為要借鑒“互聯(lián)網(wǎng)+政務(wù)服務(wù)”應(yīng)用模式,以地質(zhì)資料政務(wù)信息管理和公共服務(wù)為核心構(gòu)建地質(zhì)資料信息管理服系統(tǒng)總體架構(gòu),實(shí)現(xiàn)全國(guó)地質(zhì)資料管理和服務(wù)信息的“一站協(xié)同、一網(wǎng)通查、一碼通管”;韓肖肖等[48]探討了基于位置的地質(zhì)資料信息服務(wù)系統(tǒng)的數(shù)據(jù)來(lái)源與組織、系統(tǒng)總體框架;賈麗瓊等[49]提出移動(dòng)智能終端可以提供包括辦事指南、檢索、咨詢(xún)、預(yù)約、信息發(fā)布、地質(zhì)資料征集、培訓(xùn)、推送、資源、微展廳、反饋等服務(wù)內(nèi)容??傮w來(lái)看,學(xué)者們對(duì)于“互聯(lián)網(wǎng)+”、LBS、移動(dòng)服務(wù)等方面的研究,還不夠深入和系統(tǒng),尤其是對(duì)LBS和移動(dòng)服務(wù)方面的研究。
在大數(shù)據(jù)時(shí)代的地質(zhì)資料信息服務(wù)方面,學(xué)者們重點(diǎn)探討了大數(shù)據(jù)管理思想在地質(zhì)資料利用服務(wù)中的應(yīng)用以及管理理念、機(jī)制建設(shè)方面的內(nèi)容。王翔等[50]從需求、產(chǎn)品、技術(shù)、共享四個(gè)方面探討了大數(shù)據(jù)管理思想下的地質(zhì)資料信息服務(wù);黃少芳等[51]提出要培育建立智慧數(shù)據(jù)檔案體系的大數(shù)據(jù)-大檔案-大服務(wù)的新理念和新機(jī)制;李丹秋[52]提出在大數(shù)據(jù)時(shí)代背景下構(gòu)建數(shù)字檔案知識(shí)服務(wù)體系、挖掘并開(kāi)發(fā)知識(shí)產(chǎn)品、建立共享交流機(jī)制地質(zhì)資料檔案信息服務(wù)思路。學(xué)者們的研究,偏重于大數(shù)據(jù)管理思想與地質(zhì)資料信息服務(wù)的集合,如何應(yīng)用大數(shù)據(jù)技術(shù)推進(jìn)地質(zhì)資料信息服務(wù)向縱深發(fā)展,乃至發(fā)掘新的服務(wù)模式方面研究的較少。
在上述文獻(xiàn)研讀的基礎(chǔ)上,結(jié)合國(guó)家“十四五”期間地質(zhì)資料管理工作的四個(gè)重點(diǎn)方向,筆者預(yù)測(cè),在“十四五”期間,國(guó)內(nèi)地質(zhì)資料管理業(yè)界工作和學(xué)界研究的重心將集中在如下三個(gè)方面。
地質(zhì)資料數(shù)據(jù)資源建設(shè)是地質(zhì)資料管理與服務(wù)的根基,自《地質(zhì)資料管理?xiàng)l例》頒布實(shí)施以來(lái),經(jīng)過(guò)近二十年的發(fā)展,通過(guò)掃描數(shù)字化的方式來(lái)推進(jìn)存量紙質(zhì)地質(zhì)資料的數(shù)據(jù)資源建設(shè),各單位都開(kāi)展了大量的工作,也取得了巨大的成果,“十四五”期間,地質(zhì)資料數(shù)據(jù)資源建設(shè)的重心將轉(zhuǎn)向增量電子地質(zhì)資料資源建設(shè)。信息技術(shù)的發(fā)展、新的工藝方法的應(yīng)用,除了電子文檔以外,還會(huì)持續(xù)產(chǎn)生各種新類(lèi)型的電子文件,這些新類(lèi)型的電子文件,在歸檔、匯交時(shí)該采用什么格式方能兼顧長(zhǎng)期保管與高效利用的平衡,這是一個(gè)重要的研究方向;不僅如此,電子文件信息與載體的可分離性、易篡改性、易變性等,與地質(zhì)資料檔案管理的原始性、真實(shí)性要求存在很大的差距,如何確保歸檔的、在庫(kù)中保管的電子文件與其形成終稿時(shí)保持一致,如何利用技術(shù)手段來(lái)檢驗(yàn)這種一致,即電子文件的真實(shí)性、完整性、可用性和安全性檢測(cè)(學(xué)界稱(chēng)為“四性”檢測(cè)),同樣是一個(gè)重要的研究方向;同時(shí),隨著信息技術(shù)的發(fā)展,各種各樣的業(yè)務(wù)管理系統(tǒng)被建立并在地質(zhì)行業(yè)廣泛應(yīng)用,這些系統(tǒng)中存儲(chǔ)著的電子文件應(yīng)該被視為地質(zhì)資料檔案而歸檔保管,存在著部分系統(tǒng)的電子文件難以通過(guò)傳統(tǒng)的“紙電雙套制”的形式進(jìn)行轉(zhuǎn)化歸檔,如地質(zhì)建模數(shù)據(jù)、仿真數(shù)據(jù)等,如何通過(guò)前端控制理論、電子文件全生命周期理論來(lái)指導(dǎo)這些電子地質(zhì)資料的歸檔與管理,即業(yè)務(wù)系統(tǒng)原生電子文件的在線集成與在線歸檔,也是必須要研究的重點(diǎn)方向;另外,無(wú)論是光盤(pán)、磁帶還是磁盤(pán),這些光磁載體本身的保管壽命相較于傳統(tǒng)的紙質(zhì)載體,都存在著很大的差距,對(duì)于需要永久保管的地質(zhì)資料,如何優(yōu)選良好的存儲(chǔ)載體以便于長(zhǎng)期保管和提供利用服務(wù),采用何種技術(shù)手段對(duì)各級(jí)各類(lèi)地質(zhì)資料館藏機(jī)構(gòu)保管的大量的電子文件進(jìn)行異地異質(zhì)備份等問(wèn)題,也是不可忽視的研究方向和研究趨勢(shì)。
地質(zhì)資料數(shù)據(jù)中心建設(shè)是地質(zhì)資料管理和服務(wù)的依托,沒(méi)有規(guī)?;牡刭|(zhì)資料數(shù)據(jù)中心,各級(jí)各類(lèi)館藏機(jī)構(gòu)保管的地質(zhì)資料仍然是孤立、分散的電子文件,無(wú)法利用大數(shù)據(jù)技術(shù)發(fā)揮規(guī)?;?yīng),下一步地質(zhì)資料數(shù)據(jù)中心建設(shè)的方向,必然是區(qū)域性甚至全國(guó)性的數(shù)據(jù)中心建設(shè),在技術(shù)層面,如何應(yīng)用云計(jì)算、區(qū)塊鏈、人工智能等新興技術(shù)來(lái)指導(dǎo)數(shù)據(jù)中心建設(shè),如何保障數(shù)據(jù)中心硬件、軟件、數(shù)據(jù)、信息的安全等問(wèn)題;在業(yè)務(wù)層面,如何對(duì)各級(jí)各類(lèi)館藏機(jī)構(gòu)保管的多元、多源、異構(gòu)數(shù)據(jù)進(jìn)行統(tǒng)一規(guī)范描述,如何實(shí)現(xiàn)這些數(shù)據(jù)的集成與匯聚,如何科學(xué)、高效處理好數(shù)據(jù)中心數(shù)據(jù)利用服務(wù)與安全保密管理的平衡,都是重要的研究方向。
提供利用服務(wù)是地質(zhì)資料管理工作的終極目標(biāo),也是地質(zhì)資料管理工作發(fā)揮價(jià)值最重要的體現(xiàn)。面對(duì)海量的地質(zhì)資料,傳統(tǒng)的“單打獨(dú)斗”式的提供單件或小批量地質(zhì)資料利用服務(wù)模式已經(jīng)越來(lái)越滿足不了用戶(hù)的需求。下一步,如何利用大數(shù)據(jù)、云計(jì)算、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、人工智能等信息技術(shù),對(duì)各級(jí)各類(lèi)館藏機(jī)構(gòu),區(qū)域性、全國(guó)性地質(zhì)資料數(shù)據(jù)中心保管的海量的地質(zhì)資料進(jìn)行深度挖掘,結(jié)合國(guó)民經(jīng)濟(jì)發(fā)展重點(diǎn)工程、重大項(xiàng)目、重要事件,快速、敏捷、高效甚至自動(dòng)化的開(kāi)發(fā)地質(zhì)資料專(zhuān)題產(chǎn)品;如何高質(zhì)、高效的將海量的地質(zhì)資料中蘊(yùn)含的專(zhuān)家經(jīng)驗(yàn)、認(rèn)識(shí)等隱性知識(shí)顯性化,來(lái)提高地質(zhì)資料知識(shí)服務(wù)的效率和效果,真正實(shí)現(xiàn)地質(zhì)資料利用服務(wù)向知識(shí)服務(wù)的轉(zhuǎn)變;如何準(zhǔn)確、高效地把握社會(huì)公眾對(duì)地質(zhì)資料的利用需求,進(jìn)而有針對(duì)性的提供利用服務(wù);如何乘好移動(dòng)互聯(lián)網(wǎng)的“東風(fēng)”,將地質(zhì)資料利用服務(wù)工作突破時(shí)空限制,實(shí)現(xiàn)全天候無(wú)人化利用服務(wù);如何依托社會(huì)力量,借好“外腦”來(lái)拓展地質(zhì)資料利用服務(wù)模式等,都是地質(zhì)資料資源開(kāi)發(fā)與社會(huì)化利用服務(wù)的主要研究方向。
地質(zhì)資料既是地質(zhì)工作的產(chǎn)物,也是地質(zhì)工作的依據(jù),在信息化時(shí)代,傳統(tǒng)的地質(zhì)資料管理對(duì)象和管理方式已經(jīng)發(fā)生了巨大的變化,而在悄然而至的智能化時(shí)代,這種變化將更加持續(xù)和巨大。順應(yīng)、擁抱這種變化,變革管理模式,才能將地質(zhì)資料管理事業(yè)發(fā)展得更快更好。本文通過(guò)對(duì)2000年以來(lái)學(xué)術(shù)期刊所刊載的地質(zhì)資料管理領(lǐng)域文進(jìn)行文獻(xiàn)計(jì)量與分析,基于CiteSpace軟件,利用關(guān)鍵詞提取、網(wǎng)絡(luò)共現(xiàn)、主題聚類(lèi)、研究機(jī)構(gòu)合作等方法,得到了我國(guó)地質(zhì)資料管理領(lǐng)域二十余年來(lái)的基本研究概貌,分析了“十四五”乃至更長(zhǎng)時(shí)期內(nèi)我國(guó)地質(zhì)資料管理的研究趨勢(shì),進(jìn)一步映證了我國(guó)地質(zhì)資料管理學(xué)界、業(yè)界在信息化時(shí)代、智能化時(shí)代所付出的努力和探索。下一步,依托智能化時(shí)代所帶來(lái)的全新技術(shù)革命,全力以赴做好以電子文件為對(duì)象的地質(zhì)資料數(shù)字資源建設(shè)及其相關(guān)工作,以數(shù)據(jù)資源匯聚為途徑的區(qū)域性、全國(guó)性地質(zhì)資料數(shù)據(jù)中心建設(shè)及其相關(guān)工作,以及以互聯(lián)網(wǎng)為依托的地質(zhì)資料資源開(kāi)發(fā)與社會(huì)化利用服務(wù)及其相關(guān)工作,為國(guó)民經(jīng)濟(jì)、社會(huì)發(fā)展提供又快又好的地質(zhì)資料利用服務(wù),才能更好的發(fā)揮地質(zhì)資料的價(jià)值,彰顯地質(zhì)資料管理工作的意義。