張春艷 孫杰 蔡夢凡
【摘要】本文從大數(shù)據(jù)視角看海洋檔案發(fā)展,與傳統(tǒng)檔案對比,分析大數(shù)據(jù)背景下海洋檔案的新特點(diǎn),發(fā)展原因,以及大數(shù)據(jù)技術(shù)在海洋檔案中的應(yīng)用。
【關(guān)鍵詞】大數(shù)據(jù);海洋檔案;發(fā)展;技術(shù)應(yīng)用
一、大數(shù)據(jù)時(shí)代背景
計(jì)算機(jī)技術(shù)革命性地改變世界,全面融入社會(huì)生活,帶來的信息積累的速度和信息量爆炸式增長引發(fā)新的變革?!按髷?shù)據(jù)”,順勢而生,它是具有更強(qiáng)的決策力、洞察力、流程優(yōu)化能力、高增長率和多樣化的信息資產(chǎn),同時(shí)具有容量大、多樣、快速、價(jià)值密度相對較低的特點(diǎn)。大數(shù)據(jù)技術(shù)在海洋領(lǐng)域的戰(zhàn)略意義不在于掌握的數(shù)據(jù)信息的數(shù)量,而是在于對這些有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理體現(xiàn)其價(jià)值。比如我們可以通過收集、分析歷年的海洋災(zāi)情數(shù)據(jù),包括臺(tái)風(fēng)風(fēng)暴潮、海浪災(zāi)害等,并對數(shù)據(jù)進(jìn)行比較分析,建立一個(gè)特定的數(shù)學(xué)模型,深入研究海洋災(zāi)害歷史性影響范圍,為海洋防災(zāi)減災(zāi)提供輔助決策支撐。
二、傳統(tǒng)海洋檔案特點(diǎn)
(一)傳統(tǒng)海洋檔案來源有限。傳統(tǒng)的海洋檔案數(shù)據(jù)來源基本靠延遲歸檔的海洋檔案資料。這些資料主要來自日常的海洋行政管理和海洋業(yè)務(wù)工作包括海洋臺(tái)站觀測、船舶設(shè)備管理、船舶測報(bào)、海洋專題調(diào)查、海洋斷面調(diào)查、基本建設(shè)等。
(二)傳統(tǒng)海洋檔案載體單一。從國家海洋局兩次歷史檔案進(jìn)館內(nèi)容來看,紙質(zhì)檔案占主導(dǎo)。東海區(qū)移交至中國海洋檔案館1965-2000年檔案中紙質(zhì)檔案7500余卷。其中第一次移交進(jìn)館的1965-1982年產(chǎn)生的檔案3400余卷,均為紙質(zhì)檔案材料。第二次移交進(jìn)館1983-2000年歷史檔案,紙質(zhì)檔案約4100余卷,僅有少量的照片檔案,聲像檔案、史料檔案。
(三)海洋檔案類型固定。海洋檔案主要是在履行業(yè)務(wù)職能和承擔(dān)各類項(xiàng)目等活動(dòng)中形成的科技檔案,以及在管理工作中形成的機(jī)關(guān)文書檔案。1965-2000年間產(chǎn)生的檔案多為海洋科技檔案。這些科技檔案中多數(shù)為海洋臺(tái)站觀測記錄,類型和格式都相對固定。
(四)傳統(tǒng)檔案數(shù)量增長穩(wěn)定。通過國家海洋局東海分局(以下簡稱東海分局)兩次歷史檔案進(jìn)館分析過去30年海洋檔案的增長速度:第一次檔案進(jìn)館檔案海濱觀測和東海標(biāo)準(zhǔn)斷面調(diào)查分別為1779卷、230卷,與第二次進(jìn)館數(shù)量對比2029卷、274卷相差不大,見“圖1”。
三、現(xiàn)代海洋檔案的發(fā)展
21世紀(jì)是海洋世紀(jì),為了實(shí)現(xiàn)我國的“海洋強(qiáng)國”戰(zhàn)略,海洋科技實(shí)力不斷提高,海洋檔案作為各類海洋活動(dòng)記錄載體也發(fā)生了歷史性的變革。
(一)與傳統(tǒng)檔案的對比。1.海洋檔案數(shù)據(jù)來源多頭、載體多樣。隨著海洋業(yè)務(wù)的擴(kuò)展和先進(jìn)的海洋儀器的大量采用,數(shù)據(jù)來源越來越廣,數(shù)據(jù)量越來越大。業(yè)務(wù)系統(tǒng)傳輸數(shù)據(jù)、業(yè)務(wù)系統(tǒng)的加工數(shù)據(jù)、收集資料等都納入了海洋檔案歸檔范圍中。同時(shí),海洋檔案的外延不斷延伸,檔案載體和形式也千姿百態(tài)?,F(xiàn)代海洋檔案涵蓋了紙質(zhì)(含照片和圖件)、錄音帶、錄像帶、磁盤、光盤、硬盤、底片、膠片、幻燈片和實(shí)物等不同的載體形式。2.海洋檔案類型及屬性更復(fù)雜。在海洋業(yè)務(wù)中,進(jìn)行海洋地質(zhì)勘探、水下地形測量、海洋環(huán)境監(jiān)測、水動(dòng)力要素觀測、氣象要素觀測、生物種類鑒定、放化殘毒分析、海洋環(huán)境要素預(yù)報(bào)、海洋災(zāi)害預(yù)測預(yù)報(bào)等活動(dòng)過程中形成了大量的檔案文獻(xiàn)、專業(yè)基礎(chǔ)數(shù)據(jù)等資料。在實(shí)際的實(shí)施上,由于有多個(gè)系統(tǒng)記錄的海洋信息的各種數(shù)據(jù),形成了非常密集的記錄。這些記錄所涵蓋的信息包羅萬象,既有時(shí)間維度,也有地理維度,同時(shí)還有頻率維度、區(qū)域維度、站點(diǎn)維度等等。3.現(xiàn)代海洋檔案數(shù)據(jù)量增長快。隨著聲光電等高科技手段在海洋業(yè)務(wù)中的應(yīng)用、數(shù)字信息及載體的迅猛發(fā)展、現(xiàn)代智能技術(shù)和信息技術(shù)與海洋裝備和海洋活動(dòng)相結(jié)合,07年開始東海區(qū)部分臺(tái)站數(shù)據(jù)電子化,到09年基本所有臺(tái)站都實(shí)現(xiàn)自動(dòng)化觀測,在日常運(yùn)營中生成、海洋實(shí)時(shí)傳輸中產(chǎn)生的數(shù)據(jù)以每分MB的速度累積。4.海洋檔案需求多樣性呈現(xiàn)個(gè)性化趨勢。隨著海洋業(yè)務(wù)的擴(kuò)展,使海洋科技檔案和資料工作不斷發(fā)揮作用,這就對海洋檔案的利用提出了新的更高要求,更快,更準(zhǔn)、更全。傳統(tǒng)的海洋檔案服務(wù)是比較狹隘和單一的,一般情況是在知道某個(gè)明確需求(某份文件)下,檔案人員為此提供一對一的服務(wù)。在傳統(tǒng)的檔案信息化技術(shù)下,通過數(shù)字化手段和數(shù)字檔案館的建設(shè)檔案服務(wù)水平得到一些提升,但同樣是面臨服務(wù)單一的問題。一是嚴(yán)重依賴于檔案管理水平,比如著錄的準(zhǔn)確度、詳細(xì)度。二是在跨類別、跨庫檢索上會(huì)有缺陷。大數(shù)據(jù)時(shí)代背景下,為滿足業(yè)務(wù)需求,海洋檔案服務(wù)向多元化發(fā)展,以提供海洋檔案信息服務(wù)(憑證參考作用)、電子信息利用服務(wù)(文檔類)、數(shù)據(jù)資料服務(wù)(電子資料)、數(shù)據(jù)產(chǎn)品服務(wù)這四類為主。
(二)發(fā)展變革原因。1.海洋業(yè)務(wù)的擴(kuò)展。1965-2000年,海洋局的職能歷經(jīng)8次調(diào)整,經(jīng)歷了艱苦創(chuàng)業(yè)時(shí)期、改革發(fā)展時(shí)期、依法管海時(shí)期3個(gè)階段。海洋檔案依托于海洋事業(yè)的發(fā)展,不同的海洋活動(dòng)產(chǎn)生不同的資料,隨著業(yè)務(wù)的發(fā)展海洋檔案類型不斷新增,見“圖2”。以海濱觀測為例,觀測臺(tái)站由最初的20個(gè)臺(tái)站,發(fā)展到現(xiàn)在50多個(gè),其中近半數(shù)為現(xiàn)代自動(dòng)化觀測站。隨著海濱觀測業(yè)務(wù)的不斷發(fā)展完善,1958-2006年海濱觀測規(guī)范,經(jīng)歷了6個(gè)版本的變遷,在觀測要素、觀測方法、記錄方式等方面做了許多調(diào)整和改動(dòng)。2.海洋科學(xué)技術(shù)發(fā)展。隨著時(shí)代的進(jìn)步與科學(xué)技術(shù)的發(fā)展,海洋事業(yè)實(shí)現(xiàn)了前所未有的飛躍。高科技多媒體的聲光電技術(shù),成為現(xiàn)代化海洋科技發(fā)展中不可缺少的輔助手段之一,其應(yīng)用越來越廣泛,并且隨著技術(shù)的提高與種類的多樣化,越來越起著拓寬海洋業(yè)務(wù)手段和范圍的作用。地波雷達(dá)、海上大型浮標(biāo)的布設(shè)、船用測量儀器、聲學(xué)儀器、以及GPS技術(shù)等其他高精尖手段廣泛應(yīng)用于日常的海洋觀監(jiān)測、勘察、調(diào)查等科學(xué)研究過程中。海洋物探、水文調(diào)查、地形地貌調(diào)查、觀測預(yù)報(bào)、測繪等工作的數(shù)字化產(chǎn)生,海洋科技檔案也隨之從傳統(tǒng)的紙質(zhì)檔案逐漸轉(zhuǎn)變?yōu)殡娮訖n案。3.新時(shí)代要求。與全球性的海洋開發(fā)利用熱潮相適應(yīng),海洋信息化進(jìn)程不斷加快,中國近?!皵?shù)字海洋”信息基礎(chǔ)框架建設(shè)完成,各海洋專題服務(wù)網(wǎng)站建設(shè)不斷完善,海洋綜合管理信息系統(tǒng)建設(shè)得到深化拓展。同時(shí),“智慧海洋”也要求將各類海洋信息資源整合在一起,海洋檔案作為重要的海洋信息資源,探索大數(shù)據(jù)技術(shù)在海洋檔案方面的應(yīng)用是“智慧海洋”的內(nèi)在要求。
(三)大數(shù)據(jù)技術(shù)應(yīng)用。在大數(shù)據(jù)時(shí)代,利用大數(shù)據(jù)技術(shù)從大量的電子化和數(shù)字化海洋檔案文獻(xiàn)、專業(yè)基礎(chǔ)數(shù)據(jù)中實(shí)現(xiàn)智能化檢索檔案,探索非結(jié)構(gòu)化檔案文獻(xiàn)的關(guān)系、災(zāi)害趨勢預(yù)測、災(zāi)害處置預(yù)案推薦分析、觀測數(shù)據(jù)的挖掘分析等。在節(jié)約人力和物力的同時(shí)能夠高效實(shí)現(xiàn)檔案文獻(xiàn)分類整理檢索、專業(yè)基礎(chǔ)數(shù)據(jù)挖掘分析,給用戶呈現(xiàn)精細(xì)化、直觀的、動(dòng)態(tài)的、趨勢的專業(yè)數(shù)據(jù)分析結(jié)果。1.與傳統(tǒng)海洋數(shù)據(jù)分析對比。傳統(tǒng)意義上的數(shù)據(jù)是賦值的數(shù)字,大數(shù)據(jù)時(shí)代的數(shù)據(jù)內(nèi)涵和概念擴(kuò)展為數(shù)字和信息的統(tǒng)稱?,F(xiàn)在的海洋業(yè)務(wù)中大數(shù)據(jù)分析,跟傳統(tǒng)意義的分析有一個(gè)本質(zhì)區(qū)別,就是傳統(tǒng)的分析是基于結(jié)構(gòu)化、關(guān)系型的數(shù)據(jù),而且往往是取一個(gè)很小的數(shù)據(jù)集,來對整個(gè)海洋數(shù)據(jù)進(jìn)行預(yù)測和判斷。但現(xiàn)在是大數(shù)據(jù)時(shí)代,理念已完全改變,現(xiàn)在的海洋大數(shù)據(jù)分析是對整個(gè)數(shù)據(jù)全集直接進(jìn)行存儲(chǔ)和管理分析。2.大數(shù)據(jù)分析技術(shù)在海洋檔案中的應(yīng)用。大數(shù)據(jù)分析采用的模式識(shí)別技術(shù)、圖文轉(zhuǎn)換技術(shù)、語義分析技術(shù)、地理信息技術(shù)等成為關(guān)鍵技術(shù)。通過對涉海海洋檔案、文獻(xiàn),海洋活動(dòng)數(shù)據(jù)充分獲取,應(yīng)用大數(shù)據(jù)的方法和技術(shù)處理(ETL),收集、過濾、加工、分析、展現(xiàn)并提供開放的信息訪問接口。用戶通過訪問數(shù)據(jù)接口,提供數(shù)據(jù)處理的展示平臺(tái),也可以進(jìn)一步為各類用戶、系統(tǒng)開發(fā)所需的個(gè)性化數(shù)據(jù)服務(wù)。大數(shù)據(jù)分析的工具從長期來說可以提高工作效率,優(yōu)化人力資源分配,促進(jìn)海洋各項(xiàng)工作的進(jìn)展。目前國家海洋局東海信息中心正在探索建設(shè)的東海檔案數(shù)據(jù)庫管理系統(tǒng)就是大數(shù)據(jù)技術(shù)在海洋檔案方面應(yīng)用的典型?;趯n案文獻(xiàn)和專業(yè)數(shù)據(jù)等數(shù)據(jù)清洗、整理、轉(zhuǎn)換、展現(xiàn)應(yīng)用計(jì)算機(jī)模型建立海洋檔案智能檢索及專業(yè)數(shù)據(jù)分析系統(tǒng)平臺(tái),從多個(gè)視角、多個(gè)層次、多個(gè)維度碎片化檔案文獻(xiàn)數(shù)據(jù)、刻畫海洋觀測、監(jiān)測的高清數(shù)據(jù)畫像,進(jìn)一步分析檔案數(shù)據(jù)、實(shí)時(shí)監(jiān)測數(shù)據(jù),為更好地管理和利用海洋提供數(shù)字支持。
四、結(jié)語
當(dāng)代海洋檔案發(fā)展,既要有較高的學(xué)術(shù)和價(jià)值定位,又要符合大數(shù)據(jù)的時(shí)代背景。同時(shí),還要不斷地利用現(xiàn)代信息化手段,讓海洋檔案資料充分應(yīng)用和投入到海洋生產(chǎn)、再生產(chǎn)等實(shí)踐過程中,為海洋業(yè)務(wù)決策提供相應(yīng)的數(shù)據(jù)、信息支撐,優(yōu)化決策,造福于民。
【參考文獻(xiàn)】
[1]吳依林.新的《海濱觀測規(guī)范》[J].海洋預(yù)報(bào),1988(2).
[2]張弘弢.發(fā)展智慧海洋建設(shè)海洋強(qiáng)國[N].中國船舶報(bào), 2015-06-12(001).
[3]黃少芳,劉曉鴻,孫玲,朱青峰.初論大數(shù)據(jù)時(shí)代地質(zhì)資料信息集成與服務(wù)[J].中國礦業(yè),2016(02):170-172.