劉志杰 孔敏 舒雨婷 崔曉健 楊揚(yáng) 吳春芳
摘要:為確保海洋環(huán)境調(diào)查資料在匯集、處理、管理和服務(wù)全過程中語義表達(dá)的一致性,需采用統(tǒng)一分類和編碼技術(shù),設(shè)計(jì)資料分類編碼體系,以滿足海洋環(huán)境調(diào)查資料的匯集、管理與服務(wù)需求。在對海洋調(diào)查資料分類現(xiàn)狀研究的基礎(chǔ)上,系統(tǒng)分析了分類影響因素,提出了分類原則和方法,初步構(gòu)建了基于學(xué)科、數(shù)據(jù)類型和調(diào)查方式為主的海洋調(diào)查資料分類體系,并對其進(jìn)行規(guī)范化編碼。目前該分類體系與編碼已應(yīng)用到海洋環(huán)境資料和信息管理業(yè)務(wù)化工作中。
關(guān)鍵詞:海洋環(huán)境資料;分類;編碼;管理;海洋信息活動
中圖分類號:P731.11 文獻(xiàn)標(biāo)志碼:A 文章編號:1005-9857(2020)01-0034-05
Abstract: In order to ensure the consistency of semantic expression of marine environmental survey data in the whole process of collection,processing,management and service,it is necessary to adopt unified classification and coding technology and design data classification coding system to meet the requirements of collection,management and service of marine environmental survey data.On the basis of research on the classification status of marine survey data,this paper systematically analyzed the classification influencing factors,proposed the classification principles and methods,constructed a five-level classification system based on disciplines,data types and survey methods,and carried out standardized coding for it.The classification system and coding had been applied to the operational management of marine environment data management.
Key words:Marine environmental data,Classification,Coding,Management,Marine information activities
0 引言
海洋調(diào)查資料分類編碼是從不同角度對資料進(jìn)行抽象和分類,以便對資料進(jìn)行更好的概括,是海洋調(diào)查資料管理的一項(xiàng)基礎(chǔ)性工作,關(guān)系到海洋調(diào)查資料匯集、處理、管理和共享各個方面。中華人民共和國成立以來,我國海洋事業(yè)進(jìn)入大發(fā)展時期,以專項(xiàng)調(diào)查、綜合科考、資源勘探和專題研究為目的,先后在我國近海及深海大洋區(qū)域開展了一系列調(diào)查活動,取得了豐富的海洋調(diào)查資料和信息。隨著科技進(jìn)步,海洋調(diào)查技術(shù)日新月異,水下滑翔機(jī)、海底地震儀(OBS)、自制無人深潛器(AUV)、纜控水下機(jī)器人(ROV)、深海載人深潛器(HOV)等被廣泛應(yīng)用于現(xiàn)代海洋調(diào)查活動中,數(shù)據(jù)類型、種類不斷豐富,數(shù)據(jù)量呈指數(shù)級增長。如何對海洋資料進(jìn)行合理分類和高效管理,一直是海洋資料管理者所面臨的一個重要問題。針對不同應(yīng)用目的,往往會出現(xiàn)多角度多級別的分類標(biāo)準(zhǔn)[1-3]。這些標(biāo)準(zhǔn)規(guī)范在一定程度上為海洋調(diào)查資料分類提供了依據(jù),但側(cè)重需求不同,往往自成體系,難以滿足海洋調(diào)查資料綜合管理需要。目前尚未形成面向海洋調(diào)查資料管理的科學(xué)分類編碼體系,從而影響和制約了海洋調(diào)查資料的管理和使用效率。本研究在系統(tǒng)分析現(xiàn)有分類現(xiàn)狀的基礎(chǔ)上,結(jié)合已有數(shù)據(jù)資源,探討形成了基于學(xué)科、數(shù)據(jù)類型和調(diào)查方式為主的數(shù)據(jù)分類編碼體系,以便對海洋數(shù)據(jù)資源進(jìn)行合理規(guī)劃、管理和利用。
1 分類與編碼研究現(xiàn)狀
海洋調(diào)查資料的分類研究實(shí)際上貫穿于海洋信息活動的全過程,由于信息活動過程或應(yīng)用目的不同,海洋調(diào)查資料的分類也呈現(xiàn)多樣化。比如在海洋調(diào)查資料采集、處理階段,往往以學(xué)科為體系,進(jìn)行各學(xué)科資料種類和類型的劃分;在共享服務(wù)階段,則會根據(jù)服務(wù)目的不同,采用不同組織分類,總體上更注重資料查詢檢索實(shí)效 [4]。隨著海洋信息化進(jìn)程的加快,我國在海洋信息分類標(biāo)準(zhǔn)化方面開展了深入研究,并形成相應(yīng)標(biāo)準(zhǔn)規(guī)范。2005年原國家海洋局頒布了海洋行業(yè)標(biāo)準(zhǔn)《海洋信息分類與代碼》[1],該標(biāo)準(zhǔn)是一個龐雜的分類體系,涉及海洋資源信息、海洋經(jīng)濟(jì)統(tǒng)計(jì)信息、海洋環(huán)境數(shù)據(jù)信息、海洋基礎(chǔ)地理信息、海洋情報文獻(xiàn)信息和海洋法規(guī)信息,且下延到每一數(shù)據(jù)類型的數(shù)據(jù)項(xiàng),其目的主要為海洋數(shù)據(jù)庫系統(tǒng)建設(shè)提供有效支撐。其中海洋環(huán)境數(shù)據(jù)既包含船載調(diào)查數(shù)據(jù)又有業(yè)務(wù)化觀測數(shù)據(jù),從數(shù)據(jù)庫建設(shè)的角度以學(xué)科和數(shù)據(jù)類型為主要分類依據(jù),對數(shù)據(jù)要素項(xiàng)進(jìn)行了統(tǒng)一編碼,以保證數(shù)據(jù)庫中存儲和交換的一致性。該標(biāo)準(zhǔn)在歷史時期數(shù)據(jù)庫建設(shè)過程中發(fā)揮了重要作用,但難以適用于前期數(shù)據(jù)采集與處理。我國國家標(biāo)準(zhǔn)《海洋調(diào)查規(guī)范第7部分:海洋調(diào)查資料交換》[2]作為海洋調(diào)查標(biāo)準(zhǔn)體系的一部分,主要針對海洋調(diào)查資料交換內(nèi)容和記錄格式進(jìn)行了規(guī)定,以各學(xué)科標(biāo)準(zhǔn)數(shù)據(jù)集為分類對象,涉及海洋水文、海洋氣象、海洋聲光、海水化學(xué)、海洋生物、海洋地質(zhì)地球物理六大類。該分類層級更具有概括性,部分調(diào)查數(shù)據(jù)如海洋遙感、沉積化學(xué)等學(xué)科數(shù)據(jù)分類尚未囊括其中。2008年,依托國家科技基礎(chǔ)條件平臺建設(shè)項(xiàng)目,為規(guī)范、統(tǒng)一海洋信息數(shù)據(jù)共享發(fā)布,國家海洋信息中心編制了《海洋信息分類和分級共享標(biāo)準(zhǔn)》,該標(biāo)準(zhǔn)主要強(qiáng)調(diào)數(shù)據(jù)共享的分類和用戶分級,分類體系更為寬泛。此外,2016年頒布的國家標(biāo)準(zhǔn)《海洋要素圖式圖例及符號》[5]和2017年頒布的海洋行業(yè)標(biāo)準(zhǔn)《極地考察要素分類代碼和圖式圖例》[3]中所涉及的分類仍是建立在學(xué)科基礎(chǔ)上,分別對海洋和極地專題調(diào)查要素進(jìn)行分類研究,主要規(guī)定了不同要素圖式圖例及符號,用于海洋和極地考察專題要素圖集及地圖產(chǎn)品的制作,側(cè)重于要素的空間化表達(dá)和管理。
綜上,為滿足不同業(yè)務(wù)應(yīng)用需求,國內(nèi)已形成不同的海洋調(diào)查資料分類體系,但主要針對某一個專題或一項(xiàng)調(diào)查制定[6]。隨著海洋信息化發(fā)展和調(diào)查技術(shù)手段的進(jìn)步,其分類層次和內(nèi)容也需要不斷更新。目前,尚未建立基于文件的面向海洋調(diào)查資料匯集、處理和管理的分類體系與編碼,不利于海洋信息資源的高效匯集和統(tǒng)籌管理。為此,在《海洋調(diào)查標(biāo)準(zhǔn)體系》[7]框架指導(dǎo)下,建立海洋調(diào)查資料分類與編碼,是實(shí)現(xiàn)跨部門、跨領(lǐng)域、多源、多時相、多尺度的海洋調(diào)查資料整合與管理的前提,將有利于我國海洋調(diào)查資料科學(xué)規(guī)劃、管理和后續(xù)集成應(yīng)用。
2 分類與編碼原則
海洋環(huán)境調(diào)查資料分類是一項(xiàng)復(fù)雜的工作,涉及學(xué)科領(lǐng)域多,數(shù)據(jù)類型復(fù)雜且具有一定的綜合性和交叉性。不同學(xué)科資料特點(diǎn)顯著不同,有的資料種類少,調(diào)查手段復(fù)雜,如海洋水文資料;有的資料種類繁多,調(diào)查手段相對單一,如海洋生物和海洋底質(zhì)。因此,在分類時要充分考慮不同學(xué)科資料的特點(diǎn),厘清數(shù)據(jù)間邏輯關(guān)系,并遵循用戶使用習(xí)慣,結(jié)合學(xué)科未來發(fā)展需求。另外,為便于海洋資料匯集、處理和管理,保持分類的連續(xù)性和穩(wěn)定性,其分類也不宜過細(xì),總體以文件為分類最小基本單元,遵循基本原則如下。
(1)科學(xué)性原則:海洋環(huán)境調(diào)查資料的分類要從實(shí)際需求出發(fā),結(jié)合數(shù)據(jù)資源的具體特點(diǎn),著眼于實(shí)用,分類合理,具有可操作性,能夠滿足數(shù)據(jù)管理需求。
(2)系統(tǒng)性原則:綜合考慮資料主題的一致性,按其內(nèi)在聯(lián)系對每一類都進(jìn)行系統(tǒng)化排列,確保類目唯一、結(jié)構(gòu)層次清晰,既體現(xiàn)數(shù)據(jù)資源總體架構(gòu),又能減少冗余。
(3)規(guī)范性原則:資料分類與編碼簡潔、規(guī)范,資料類別采用通用名稱,確保語義無二義性。
(4)兼容性原則:充分考慮已有分類基礎(chǔ),盡可能引用相關(guān)標(biāo)準(zhǔn)或與之充分銜接。最大限度保留已被人們所熟悉和慣用的框架,便于用戶掌握和運(yùn)用。
(5)可擴(kuò)充性原則:基于編碼對象的屬性特點(diǎn),保證分類對象增加或細(xì)化時,已有分類體系能夠延續(xù)和拓展,確保分類編碼穩(wěn)定,可修訂和完善。
3 分類體系構(gòu)建
任何資料都具有多維屬性,海洋調(diào)查資料也不例外。資料分類有兩個要素:一是分類對象;二是分類依據(jù)。資料分類依據(jù)即分類粒度問題是分類首要考慮因素,影響到資料分類層級,又與分類目的緊密聯(lián)系。海洋調(diào)查資料門類的劃分總體以《海洋調(diào)查標(biāo)準(zhǔn)體系》[7]為依據(jù),從調(diào)查內(nèi)容考慮,分為海洋環(huán)境、海洋資源和海洋經(jīng)濟(jì)三大部分。本研究即以海洋環(huán)境調(diào)查資料作為門類分類對象,探討該門類下資料層級關(guān)系。學(xué)科、調(diào)查方式、資料類型、調(diào)查儀器、介質(zhì)以及數(shù)據(jù)加工程度和自身屬性等都是影響海洋環(huán)境調(diào)查資料分類的影響因素。從資料匯集和管理角度,重點(diǎn)需要考慮的分類影響因子為學(xué)科、資料加工程度、資料類型和調(diào)查方式等,再根據(jù)分類因子之間的邏輯關(guān)系,組成關(guān)聯(lián)有序的資料分類體系。
海洋環(huán)境調(diào)查通常以項(xiàng)目為主線開展,調(diào)查任務(wù)常作為資料管理單元,涉及現(xiàn)場采集、室內(nèi)測試分析、處理解釋和研究等多個環(huán)節(jié)。海洋環(huán)境資料包括資料種類和資料類型兩個維度。資料種類的劃分適用于所有學(xué)科,是根據(jù)數(shù)據(jù)加工程度進(jìn)行的劃分,通常包含任務(wù)文檔類、原始數(shù)據(jù)集、整編數(shù)據(jù)集、標(biāo)準(zhǔn)數(shù)據(jù)集、報告專著類、圖件圖集類、圖像攝像類、軟件類和其他類(表1),其中原始數(shù)據(jù)集、整編數(shù)據(jù)集和標(biāo)準(zhǔn)數(shù)據(jù)集是調(diào)查數(shù)據(jù)的主體部分,資料類型的劃分主要基于數(shù)據(jù)集,將海洋環(huán)境數(shù)據(jù)細(xì)分為大類、中類、小類和子類的嵌套體系。
海洋環(huán)境調(diào)查資料大類劃分并不等同于學(xué)科分類,二者有聯(lián)系又不完全一一對應(yīng),但資料分類一定是建立在學(xué)科分類基礎(chǔ)上[8]。海洋環(huán)境調(diào)查資料學(xué)科大類以2007年國家頒布執(zhí)行的《海洋調(diào)查規(guī)范》系列國家標(biāo)準(zhǔn)[9]為主要依據(jù),并參考《海洋調(diào)查標(biāo)準(zhǔn)體系》[7],在此基礎(chǔ)上做補(bǔ)充。大類遵循慣用學(xué)科體系框架,分為海洋水文、海洋氣象、海洋生物、海洋化學(xué)、海洋聲學(xué)、海洋光學(xué)、海洋底質(zhì)、海洋地球物理、海底地形地貌、海洋遙感、海洋生態(tài)和海島海岸帶十二大類。需要說明的是,為保證分類體系的科學(xué)性和兼容性,海洋災(zāi)害資料可根據(jù)要素屬性分到其他相應(yīng)學(xué)科類別中,因此不單獨(dú)作為海洋環(huán)境資料大類類別。
由于每個學(xué)科大類資料特點(diǎn)不一,影響每一學(xué)科資料劃分的主因和次因都不完全相同,因此資料中類和小類的劃分,不能采用“一刀切”式的同一劃分標(biāo)準(zhǔn)。比如,海洋水文中類以資料類型劃分,小類則以獲取方式劃分,調(diào)查儀器信息作為數(shù)據(jù)字段存放于數(shù)據(jù)文件中。水文調(diào)查方式多樣包括大面、走航、定點(diǎn)連續(xù)和漂流等,不同方式獲取的資料在處理和存儲管理方面都有所不同,因此要加以區(qū)分。而對于海洋底質(zhì)、海洋地球物理和海底地形調(diào)查資料來講,調(diào)查方式相對固定,海洋底質(zhì)調(diào)查多以定點(diǎn)取樣為主,海洋地球物理和地形地貌以走航調(diào)查為主,因此調(diào)查方式不作為海洋底質(zhì)、海洋地球物理和海底地形調(diào)查的分類因素。海洋氣象、海洋化學(xué)、海洋生物和海洋底質(zhì)調(diào)查都會涉及不同調(diào)查對象,因此這些資料中類的劃分以調(diào)查對象為分類因素,如海洋氣象分為常規(guī)氣象、海氣邊界層和高空氣象。海洋地球物理和海底地形主要采用不同的勘探方法來獲得海底物質(zhì)物理性質(zhì)(密度、磁性、電性、放射性和熱導(dǎo)率等)以及海底水深變化規(guī)律和分布狀態(tài),并進(jìn)一步推斷解釋地質(zhì)構(gòu)造、礦產(chǎn)資源分布和海底地形狀況,因此海洋地球物理和海底地形中類的劃分以勘探方法為主因。海洋遙感則針對不同應(yīng)用方向,以應(yīng)用目標(biāo)作為中類分類依據(jù)。海島海岸帶調(diào)查既有常規(guī)學(xué)科調(diào)查又有專題調(diào)查,常規(guī)學(xué)科調(diào)查數(shù)據(jù)納入相應(yīng)學(xué)科體系中,專題調(diào)查數(shù)據(jù)類型作為海島海岸帶資料中類劃分依據(jù)。海洋生態(tài)中類的劃分則以珊瑚礁、紅樹林和海草床等調(diào)查類型為劃分依據(jù)。各學(xué)科小類的劃分,除海洋水文外,其他均以資料類型作為劃分依據(jù),個別學(xué)科如海洋底質(zhì)資料層級較深,可以再將小類細(xì)分為不同子類(表2)。
4 海洋環(huán)境資料編碼
資料編碼是建立在分類基礎(chǔ)上,將資料賦予具有一定規(guī)律的,易于計(jì)算機(jī)和人識別處理的符號[10]。資料種類和類型由于考慮維度不同,應(yīng)分別進(jìn)行編碼設(shè)計(jì)。調(diào)查資料種類編碼共由3位編碼組成,包括1位數(shù)字和2位資料種類英文縮寫碼(表1),與資料類型碼無沖突,也可組合使用。資料類型編碼基于學(xué)科體系建立,主要由門類碼、大類碼、中類碼和小類碼組成的有序無含義碼,其中門類碼用1位阿拉伯?dāng)?shù)字表示,大類、中類和小類碼分別由2位阿拉伯?dāng)?shù)字組成(圖1)。個別數(shù)據(jù)類型分類層級較多,在小類基礎(chǔ)上可再分為子類,子類碼由1位阿拉伯?dāng)?shù)字表示,與小類碼之間用“-”連接(圖1,表2)。根據(jù)資料分類編碼的兼容性原則,門類碼繼承《海洋信息分類與代碼》中約定海洋環(huán)境門類編碼“3”。海洋環(huán)境資料分類編碼長度由分類粒度決定,編碼長度5~9位。如某一類資料只分到中類,下無嵌套小類,則編碼只到中類即可,長度為5位;如數(shù)據(jù)編碼需要分到小類,則編碼長度為7位;如分到子類,則編碼長度為9位。以海洋底質(zhì)沉積物常量元素?cái)?shù)據(jù)為例,其編碼為3070105-1,從左至右,“3”代表門類碼——海洋環(huán)境,“07”代表大類碼——海洋底質(zhì),“01”代表中類碼——沉積物,“05”代表小類碼——沉積物化學(xué),最后一位“1”則代表子類碼——常量元素。為保證編碼的靈活性,編碼不采用補(bǔ)位方式,編碼長度由資料類型決定。
5 結(jié)語
海洋環(huán)境資料分類與編碼是一項(xiàng)復(fù)雜的基礎(chǔ)性工作,其目的是為了更有效地組織和管理海洋環(huán)境資料。在海洋資料分類研究基礎(chǔ)上,結(jié)合已掌握數(shù)據(jù)資源實(shí)際情況,清晰地梳理出海洋環(huán)境資料脈絡(luò)體系,建立海洋環(huán)境資料分類與編碼,有效避免了資料在使用過程中表達(dá)的二義性,也能更好地滿足未來調(diào)查多學(xué)科綜合發(fā)展的需求,便于自上而下部署和組織數(shù)據(jù)集的生產(chǎn)和集成[4],有效提升海洋調(diào)查環(huán)境資料匯集、處理和管理服務(wù)水平。該分類體系是一個動態(tài)開放的體系,會隨著調(diào)查技術(shù)水平的提高,資料類型的豐富,不斷成熟和完善。
參考文獻(xiàn)
[1] 國家海洋局.HY/T 075-2005海洋信息分類與代碼[S].北京:中國標(biāo)準(zhǔn)出版社,2005.
[2] 中華人民共和國國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局,中國國家標(biāo)準(zhǔn)化管理委員會.GB/T 12763.7-2007海洋調(diào)查規(guī)范第7部分:海洋調(diào)查資料交換[S].北京:中國標(biāo)準(zhǔn)出版社,2008.
[3] 國家海洋局.HY/T 221-2017,極地考察要素分類代碼和圖式圖例[S].北京:中國標(biāo)準(zhǔn)出版社,2017.
[4] 王卷樂,林海,冉盈盈,等.面向數(shù)據(jù)共享的地球系統(tǒng)科學(xué)數(shù)據(jù)分類探討[J].地球科學(xué)進(jìn)展,2014,29(2):265-274.
[5] 中華人民共和國國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局,中國國家標(biāo)準(zhǔn)化管理委員會.GB/T32067-2015海洋要素圖式圖例及符號[S].北京:中國標(biāo)準(zhǔn)出版社,2016.
[6] 白降麗,彭道黎,楊馥寧.森林資源信息分類及編碼體系研究[J].浙江農(nóng)林大學(xué)學(xué)報,2007,24(3):326-330.
[7] 國家海洋局.HY/T244-2018海洋調(diào)查標(biāo)準(zhǔn)體系[S].北京:中國標(biāo)準(zhǔn)出版社,2019.
[8] 廖順寶,蔣林.地球系統(tǒng)科學(xué)數(shù)據(jù)分類體系研究.[J].地理科學(xué)進(jìn)展,2005,24(6):93-98.
[9] 《海洋調(diào)查規(guī)范》系列國家標(biāo)準(zhǔn)[J].中國標(biāo)準(zhǔn)化,2011(5):22-23.
[10] 耿慶齋,張行南,朱星明.基于多維組合的水利科學(xué)數(shù)據(jù)分類體系及其編碼結(jié)構(gòu)[J].河海大學(xué)學(xué)報:自然科學(xué)版,2009,37(3):346-350.