司 莉 劉 堯
(武漢大學信息管理學院,湖北 武漢 430072)
隨著“一帶一路”高質(zhì)量發(fā)展被寫入《中華人民共和國國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035年遠景目標綱要》,“一帶一路”建設正從謀篇布局的“大寫意”階段轉(zhuǎn)向精耕細作的“工筆畫”階段,進一步凝聚合作共識、扎實推進互聯(lián)互通、大力拓展市場合作成為高質(zhì)量發(fā)展的要求[1]。為跟進高質(zhì)量發(fā)展的戰(zhàn)略綱要,彌補沿線國家間信息不對稱,增進雙方互信,需建設“一帶一路”經(jīng)濟管理專題數(shù)據(jù)庫(以下簡稱“經(jīng)管專題庫”)。
標準化是專題庫建設過程中的重要環(huán)節(jié)。標準規(guī)范是人文社科專題庫建設的首要問題和深度開發(fā)利用的前提[2],也是跨國信息資源整合的基礎[3]。但當前“一帶一路”專題庫在建設過程中面臨規(guī)范化管理不足的問題。一方面,各庫資源采集標準尚未確定,組織方式各不相同[4],跨國信息資源整合機制尚未形成;另一方面,“一帶一路”沿線國家在信息采集、加工、存儲、交換等環(huán)節(jié)所使用的標準差異較大[3],不利于沿線國家信息的融合和服務體系的建立。該問題同樣存在于經(jīng)管專題庫中。經(jīng)管專題庫建設是項龐大復雜的系統(tǒng)工程,涉及沿線多個國家和部門及語種,亟需通過標準規(guī)范進行統(tǒng)籌協(xié)調(diào);目前已建成的專題庫中尚未采用統(tǒng)一標準,其建庫目的、數(shù)據(jù)來源和服務對象各異,為資源整合與用戶的統(tǒng)一檢索帶來不便。因此,本文對經(jīng)管專題庫的標準體系的模型及框架進行探討,以期提升專題資源建設效率,進而增進沿線國家政策溝通與經(jīng)濟合作,推動共建“一帶一路”向高質(zhì)量方向轉(zhuǎn)變。
目前研究中的專題庫標準體系主要有以下幾種構(gòu)建思路:①基于業(yè)務板塊的構(gòu)建思路,主要從專題庫的架構(gòu)角度,針對標準體系所面臨的業(yè)務要求如技術、管理、服務等方面建立標準。國家科技管理信息系統(tǒng)標準體系框架由總體、信息資源、應用服務、支撐技術、基礎設施和管理類標準構(gòu)成[5];檔案數(shù)據(jù)庫建設標準體系綜合考慮技術、管理、工作和專業(yè)等不同性質(zhì)標準[6];環(huán)境影響評價基礎數(shù)據(jù)庫標準規(guī)范體系設置數(shù)據(jù)資源、數(shù)據(jù)庫、共享交換和應用服務4個大類12個小類[7];基層醫(yī)療衛(wèi)生信息系統(tǒng)的標準體系由基礎類、數(shù)據(jù)類、技術類、安全與隱私類和管理類標準構(gòu)成[8];教育宏觀決策數(shù)據(jù)庫標準體系由基礎、數(shù)據(jù)、技術和管理標準構(gòu)成[9]。②基于數(shù)據(jù)處理的構(gòu)建思路,聚焦于專題庫的數(shù)據(jù)描述、組織、規(guī)范控制等處理過程構(gòu)建標準體系。如“一帶一路”新型智庫信息資源標準規(guī)范體系由信息處理、唯一標識符和元數(shù)據(jù)標準等組成[10];“一帶一路”沿線多語種、共享型經(jīng)濟管理數(shù)據(jù)庫元數(shù)據(jù)標準體系包括數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)值、數(shù)據(jù)內(nèi)容、數(shù)據(jù)格式和技術交換標準[11];專題檔案資源庫采用國際國內(nèi)通用數(shù)據(jù)著錄標準、數(shù)據(jù)格式標準、數(shù)據(jù)標引標準、規(guī)范控制標準對資源進行系統(tǒng)化、邏輯化的組織[12];古籍書目數(shù)據(jù)庫標準規(guī)范從著錄標準、分類標準和用字規(guī)范等方面構(gòu)建[13];CALIS重點學科網(wǎng)絡資源導航庫制定的相關標準規(guī)范包括資源選擇標準、元數(shù)據(jù)規(guī)范、著錄規(guī)則、資源類型控制標準[14]。
國際經(jīng)濟行業(yè)組織的數(shù)據(jù)標準建設多集中于元數(shù)據(jù)、質(zhì)量控制和發(fā)布環(huán)節(jié)。國際貨幣基金組織(IMF)發(fā)布的《通用數(shù)據(jù)傳播標準》和《專用數(shù)據(jù)傳播標準》提出,從數(shù)據(jù)傳播中的4個維度控制數(shù)據(jù)質(zhì)量[15];世界銀行的《信息分類和控制政策》《銀行指南:發(fā)展數(shù)據(jù)采集與存儲》《信息獲取政策》[16]對數(shù)據(jù)的采集、組織、存儲和利用等流程進行控制;經(jīng)濟合作與發(fā)展組織(OECD)制定的《統(tǒng)計數(shù)據(jù)質(zhì)量準則》[17]《統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)交換(SDMX)》[18]和《數(shù)據(jù)集和表格的發(fā)布標準》[19]等;英國數(shù)據(jù)存檔(UKDA)通過制定編目指南、元數(shù)據(jù)標準、館藏發(fā)展政策、數(shù)據(jù)處理標準和保存標準,對其從英國經(jīng)濟與社會研究委員會(ESRC)和國家統(tǒng)計局獲取的經(jīng)濟數(shù)據(jù)進行管理[20];歐盟統(tǒng)計局發(fā)布了統(tǒng)計數(shù)據(jù)質(zhì)量控制標準框架和元數(shù)據(jù)標準,并對國際貿(mào)易和農(nóng)業(yè)經(jīng)濟等領域數(shù)據(jù)的收集、編碼、發(fā)布進行規(guī)范[21]。
有研究對審計與銀行的數(shù)據(jù)標準進行探討。如審計信息化標準體系包括基礎、信息處理和基礎支撐3個大類,并按業(yè)務和主體維度對部分標準進行細分[22];銀行數(shù)據(jù)標準管理體系包括組織建設、體系規(guī)劃、監(jiān)督檢查與維護等[23]。
現(xiàn)有研究中提出的專題庫標準體系能為本文提出的框架在整體結(jié)構(gòu)上提供參考,但尚未涉及“一帶一路”和經(jīng)管領域;經(jīng)管類數(shù)據(jù)標準建設研究在元數(shù)據(jù)、質(zhì)量控制和發(fā)布上已有探索,但多是基于工作經(jīng)驗提出,缺乏頂層設計和理論指導,未能覆蓋數(shù)據(jù)的整個生命周期。因此,本文基于霍爾的三維結(jié)構(gòu)理論,從適用范圍、主題類型和數(shù)據(jù)流程維度構(gòu)建標準體系模型和框架;再結(jié)合標準化部門和國際經(jīng)濟行業(yè)組織的標準文件,對經(jīng)管專題庫數(shù)據(jù)流程中各環(huán)節(jié)的標準內(nèi)容進行解析。
2.1.1 理論基礎
1)霍爾三維結(jié)構(gòu)理論。由美國系統(tǒng)工程專家霍爾提出,它將系統(tǒng)工程的過程分散到三維空間結(jié)構(gòu)中,即6個階段(時間維)、7個步驟(邏輯維)和專業(yè)知識(知識維);結(jié)合3個維度可準確定位工程進度,進行計劃、組織和控制[24]。該理論被應用于全球范圍的大型復雜系統(tǒng)的規(guī)劃、組織及管理,在標準體系構(gòu)建過程中已得到較多應用[25]。本文借鑒該理論,將標準分列為3個維度。
2)總體架構(gòu)(Enterprise Architecture,EA)方法論。它是在信息系統(tǒng)設計與實施的實踐基礎上發(fā)展而來的方法,描述了業(yè)務、信息、應用和技術互動的整體構(gòu)想。美國國家標準與技術研究院等提出5層EA模型,包括技術基礎設施層、數(shù)據(jù)描述層、系統(tǒng)與應用層、信息流及其關系、業(yè)務流程層[26]。該理論已成為普遍采用的復雜系統(tǒng)設計與實施的理論和工具[27],用于整體架構(gòu)和頂層設計,為標準體系模型的主題類型維的設計提供支撐。
3)信息生命周期理論。信息生命周期指信息從生成到失去價值的整個時間區(qū)間[28],不同時期的信息可能在格式、目的、價值和使用上經(jīng)歷多種轉(zhuǎn)換。英國數(shù)據(jù)檔案項目聯(lián)盟提出的DDI 3.0生命周期模型要素包括數(shù)據(jù)收集、處理、存檔、發(fā)布、發(fā)現(xiàn)、分析和再利用[29]。該理論為理解和開展數(shù)據(jù)管理提供了框架,能夠識別數(shù)據(jù)的演變階段和使用人員的特定需求,確定建庫過程中的標準化任務,是標準體系模型的數(shù)據(jù)流程維的理論基礎。
2.1.2 標準體系的三維模型
本文立足上述理論,構(gòu)建了經(jīng)管專題庫標準體系模型,如圖1所示。具體而言,依據(jù)霍爾三維結(jié)構(gòu)確定模型的結(jié)構(gòu),即適用范圍、數(shù)據(jù)流程和主題類別三維;總體架構(gòu)方法論和信息生命周期理論分別用于主題類別和數(shù)據(jù)流程維標準的劃分。
圖1 經(jīng)管專題庫標準體系三維模型
1)適用范圍維標準。《標準體系構(gòu)建原則和要求(GB/T 13016-2018)》指出,應立足個性標準,提取共性技術要求作為上層的共性標準[30],說明標準體系應被劃分為適用于共性、個性的層次結(jié)構(gòu),由指導、通用和專用3個層次組成[31]。本文結(jié)合霍爾三維結(jié)構(gòu)的邏輯維,將適用范圍維標準劃分為指導、通用和專用標準。
2)主題類別維標準。數(shù)據(jù)庫的建設是一個系統(tǒng)工程,其業(yè)務活動涉及到數(shù)據(jù)處理、數(shù)據(jù)應用、基礎設施和運行管理等多個環(huán)節(jié),是標準規(guī)范體系構(gòu)建所面向的業(yè)務需求,需從信息系統(tǒng)整體架構(gòu)的角度對其進行梳理。參考EA模型,將主題類別維劃分為基礎設施、資源建設、應用服務和運行管理類標準。
3)數(shù)據(jù)流程維標準。專題庫的建設涵蓋數(shù)據(jù)從產(chǎn)生到消亡的全過程,以數(shù)據(jù)生命周期為視角,結(jié)合DDI 3.0生命周期模型的要素,對建庫中的數(shù)據(jù)處理進行階段化管理,建立數(shù)據(jù)采集、描述、組織、加工、保存、服務和復用標準。
經(jīng)管專題庫標準體系的結(jié)構(gòu)框架立足三維模型,從適用范圍、主題類型和數(shù)據(jù)流程3個維度出發(fā),由頂層設計、主體結(jié)構(gòu)到內(nèi)容體系形成了三大要素體系,如圖2所示。其中,頂層設計是經(jīng)管專題庫標準在適用范圍維度上的體現(xiàn),不僅從全局統(tǒng)領標準化建設,還能對4個主題結(jié)構(gòu)提供指導;主題類型維構(gòu)成了標準體系的主體結(jié)構(gòu),既是適用范圍維中指導標準的具體實踐,也是通用標準的具體展開,從基礎設施、資源建設、應用服務和組織管理層面具體分解標準體系的建設思路;作為經(jīng)管專題庫在建設初期的主要標準化任務,主題類型維的資源建設和應用服務標準在數(shù)據(jù)流程維中被分別具體化為資源采選、元數(shù)據(jù)、分類編碼、內(nèi)容加工、長期保存標準和數(shù)據(jù)服務規(guī)范、開放共享標準,是標準體系的核心內(nèi)容。
圖2 標準體系的結(jié)構(gòu)框架
2.2.1 適用范圍維標準的構(gòu)成
1)指導標準。是與標準的制定、應用和理解等方面相關的標準,國家科技管理信息系統(tǒng)標準體系中包含基本術語和標準化指南[5];科學數(shù)據(jù)共享工程標準體系中包括標準體系及參考模型、標準化指南、概念與術語、標準一致性測試。本文指導標準包括經(jīng)濟管理與數(shù)據(jù)庫術語、標準體系參考模型、規(guī)范性引用文件和專題庫標準化建設實施指南。
2)通用標準。是對特定的流程和事件提出要求或提供標準化的執(zhí)行方法[5],包括數(shù)據(jù)描述類、數(shù)據(jù)產(chǎn)品與生產(chǎn)類、數(shù)據(jù)管理類、數(shù)據(jù)服務類、應用系統(tǒng)建設類標準[31];“一帶一路”智庫信息標準規(guī)范體系中的通用標準包括技術標準、管理標準、服務標準[10]。本文通用標準包括基礎設施類、資源建設類、應用服務類和運行管理類,即主題類型維的四大主體結(jié)構(gòu)。
3)專用標準。是根據(jù)通用標準制定以滿足特定領域數(shù)據(jù)資源建設需求的標準。具有領域特點的信息資源需要制定相應的專用標準,且應遵循或繼承通用標準[5];例如,企業(yè)投資項目和科研立項是“一帶一路”信息資源體系的重要內(nèi)容[32],在收集、整合多源異構(gòu)的項目信息、建立“一帶一路”項目庫過程中,可基于通用標準,制定針對項目信息的采選、描述、組織、多語言處理和整合標準。
2.2.2 主題范圍維標準的構(gòu)成
該維度從以下4個方面展開:
1)基礎設施標準。基礎設施標準針對經(jīng)管專題庫的硬件和網(wǎng)絡制定,《數(shù)據(jù)中心基礎設施施工及驗收規(guī)范(GB50462-2015)》將其劃分為綜合布線與網(wǎng)絡系統(tǒng)、安全防范系統(tǒng)、配電系統(tǒng)等[33];國家科技管理信息系統(tǒng)標準體系中包括信息安全、網(wǎng)絡基礎設施、計算機及存儲系統(tǒng)、機房及配套設施[5]。本文基礎設施標準包括基礎設施施工及驗收規(guī)范、系統(tǒng)建設通用技術要求、信息安全標準和網(wǎng)站建設規(guī)范。
2)資源建設標準。是數(shù)據(jù)庫規(guī)范化管理的核心,對數(shù)據(jù)采集、創(chuàng)建、描述等相關要素進行規(guī)范。中國科學院數(shù)據(jù)云標準體系將其劃分為數(shù)據(jù)采集與整理、元數(shù)據(jù)與元模型、數(shù)據(jù)管理、數(shù)據(jù)服務標準[34];審計信息處理類標準包括數(shù)據(jù)采集、預處理、存儲與管理、分析標準[35]。結(jié)合信息生命周期理論,本文將資源建設標準劃分為資源采選、元數(shù)據(jù)、分類與編碼內(nèi)容加工和長期保存規(guī)范。
3)應用服務標準。針對經(jīng)管專題庫的服務對象、內(nèi)容、方式、績效、宣傳與引導、監(jiān)督預評價方面進行規(guī)范。國家科技管理信息系統(tǒng)中將其劃分為支持互聯(lián)互通的基本接口、統(tǒng)一認證與業(yè)務集成標準,以及數(shù)據(jù)管理和移動端應用服務規(guī)范;中科院數(shù)據(jù)應用環(huán)境建設與服務標準規(guī)范框架中,應用服務標準包括服務的對象類型、方式與要求、數(shù)據(jù)交換格式及數(shù)據(jù)的共享分類分級政策。本文將應用服務標準劃分為數(shù)據(jù)服務規(guī)范和開放共享辦法,與資源建設類標準共同作為數(shù)據(jù)流程維標準的內(nèi)容。
4)組織管理標準。為信息系統(tǒng)建設和服務提供管理手段與措施,是保證信息系統(tǒng)高效運作的重要保障,由運維管理、數(shù)據(jù)評估、數(shù)據(jù)資產(chǎn)管理等構(gòu)成[36]。中國科學院數(shù)據(jù)云的數(shù)據(jù)管理標準包含數(shù)據(jù)質(zhì)量管理規(guī)范、數(shù)據(jù)質(zhì)量評測方法與指標體系和數(shù)據(jù)加工增值管理辦法等[34];考慮到經(jīng)管專題庫數(shù)據(jù)由多渠道采集而來,可能存在知識產(chǎn)權風險,因此,本文的管理標準除數(shù)據(jù)質(zhì)量評估與控制外,還有知識產(chǎn)權管理規(guī)范。
2.2.3 數(shù)據(jù)流程維標準的構(gòu)成
數(shù)據(jù)流程維標準是經(jīng)管專題庫標準的內(nèi)容體系,也是建設初期的主要標準化任務。具體包括資源采選、元數(shù)據(jù)、分類與編碼、內(nèi)容加工、數(shù)據(jù)服務和開放共享標準。詳細內(nèi)容見本文的第3部分。
經(jīng)管專題庫標準內(nèi)容體系主要包含資源與服務兩個體系,其中資源標準體系需基于經(jīng)管專題庫資源建設的過程,明確資源的生命周期,結(jié)合已有的標準文件,建設資源采選標準、元數(shù)據(jù)標準、分類與編碼標準、內(nèi)容加工規(guī)范和長期保存標準。服務標準體系則包含數(shù)據(jù)服務規(guī)范和開放共享標準,對其主客體、內(nèi)容、流程與評估進行規(guī)范。具體來說,主要包含以下幾個方面。
3.1.1 資源采選標準
資源采選標準是數(shù)據(jù)庫資源建設的核心問題,為確定“一帶一路”經(jīng)管資源采選指標,筆者收集了數(shù)字資源和經(jīng)管信息的采選標準,如表1所示。數(shù)字資源的采選標準在考慮用戶需求、成本效益和用戶服務方面,與經(jīng)管專題庫具有共性,且已有標準化組織和圖書館聯(lián)盟的實踐經(jīng)驗;經(jīng)管領域的組織在館藏內(nèi)容上與經(jīng)管專題庫有相似性,可參考其采選標準。
表1 數(shù)字資源/經(jīng)管信息采選標準
結(jié)合調(diào)研結(jié)果,確定經(jīng)管專題庫資源采選的維度為:①契合度,主要考察資源內(nèi)容是否與“一帶一路”和經(jīng)濟管理相關,是否滿足政府、科研和企業(yè)用戶的決策與研究需求;②質(zhì)量,即完整性、準確性和時效性等;主要從資源的時空跨度、記錄與元數(shù)據(jù)是否完整、資源來源是否權威、更新時間和頻率等方面評估;③成本,主要考慮資源的價格、維護成本、人均使用量等;④風險,主要考慮許可協(xié)議中是否保證資源版權的合法性、是否規(guī)定版權糾紛發(fā)生時適用的法律和解決方式、是否制定用戶隱私保護條例等。
3.1.2 元數(shù)據(jù)標準
沿線不同國家、機構(gòu)的異構(gòu)元數(shù)據(jù)不利于信息的整合與訪問,需要統(tǒng)一的元數(shù)據(jù)標準。根據(jù)課題組前期研究[10],經(jīng)管專題庫元數(shù)據(jù)標準應包括:①數(shù)據(jù)結(jié)構(gòu)標準。主要記錄資源的類型和內(nèi)容等信息,其中,數(shù)據(jù)集核心元數(shù)據(jù)為標識符、標題、主題、關鍵詞、摘要、語種、時空范圍、更新頻率、責任者、權限、許可、格式、URL、關聯(lián)資源和數(shù)據(jù)結(jié)構(gòu);②數(shù)據(jù)值標準,用于規(guī)范元素中所出現(xiàn)的人名、地名、專業(yè)詞匯等;③數(shù)據(jù)內(nèi)容標準,用于規(guī)范數(shù)據(jù)值的格式和語法規(guī)則,包括元數(shù)據(jù)著錄指南、編目規(guī)則,以及針對具體元素的編碼規(guī)范;④數(shù)據(jù)格式和技術交換標準,是上述元數(shù)據(jù)標準的機讀格式表述,規(guī)范其多語言處理與置標過程。
表2 元數(shù)據(jù)標準框架及其可參考標準
3.1.3 分類與編碼標準
信息要被不同用戶和應用系統(tǒng)共享,須有一致認可的定義和表示法;前者依賴于信息分類,后者則需要信息編碼[37]。參考《信息分類和編碼的基本原則與方法》的相關要求和《數(shù)字資源知識組織分類標準規(guī)范》[38]的內(nèi)容結(jié)構(gòu),經(jīng)管專題庫分類與編碼標準包括:①基本原則,即科學性、系統(tǒng)性、可擴延性、兼容性和綜合實用性;②分類體系架構(gòu),包含主表、分類與代碼表、復分表。其中,主表、分類與代碼表包含宏觀、部門和微觀經(jīng)濟3個基本大類、33個二級類目、245個三級類目;復分表6個,對信息的時空、語種、類型和來源進行揭示[39];③編碼規(guī)則,規(guī)范代碼類型、特征、表現(xiàn)形式、編號方法。
表3 信息分類與編碼標準框架及其可參考標準
3.1.4 內(nèi)容加工規(guī)范
內(nèi)容加工指將大量分散、凌亂、無序的內(nèi)容資源進行整理、濃縮、提煉,并按邏輯順序加以編排,使之系統(tǒng)化的過程[40],即對資源進行校對、清洗、編碼和標識,以供描述和標記。筆者將內(nèi)容加工規(guī)范劃分為以下3個方面:
1)數(shù)據(jù)質(zhì)量控制標準。數(shù)據(jù)質(zhì)量是指數(shù)據(jù)的特性滿足明確的和隱含的要求的程度[41]?!耙粠б宦贰苯?jīng)管數(shù)據(jù)具有多源異構(gòu)性,需對其數(shù)據(jù)結(jié)構(gòu)和格式不一致、關聯(lián)性差、數(shù)據(jù)軟件不兼容、數(shù)據(jù)重復、內(nèi)容錯誤、缺失、更新和傳輸有誤等質(zhì)量問題進行評估、發(fā)現(xiàn)和修正。
2)數(shù)據(jù)字符編碼標準。數(shù)據(jù)字符編碼是網(wǎng)絡傳輸數(shù)字資源的基本通信技術和規(guī)范[42],用于規(guī)范經(jīng)管專題庫對資源的編碼描述。目前已有廣泛使用的標準規(guī)范,可直接選用。
3)數(shù)字對象唯一標識符標準。數(shù)字對象唯一標識符是為任意類型的對象提供永久性唯一標識[43],其標準規(guī)范了標識符的語法、描述和解析功能,以及對標識符名稱進行注冊和管理的基本原則。
4)不同類型的資源加工操作指南。鑒于經(jīng)管專題庫的資源包括文本、音視頻和圖像等多種形式,可參考《內(nèi)容資源數(shù)字化加工(GB/T 38548)》和圖書館資源數(shù)字化標準,針對各類型資源建立加工指南,對其內(nèi)容標記、資源格式體系、加工級別、技術參數(shù)和加工流程進行規(guī)范,具體如表4所示。
表4 內(nèi)容加工規(guī)范框架及其可參考標準
3.1.5 長期保存標準
“一帶一路”信息資源體量較大,僅“一帶一路”研究與決策支撐平臺就收錄超過401萬條數(shù)據(jù)、21萬篇文獻和4.8萬篇報告[44];然而載體老化、技術過時等因素使數(shù)字資源生命周期較短,標準缺失不利于數(shù)字資源的長期保存和可獲取[45]。在參照長期保存參考模型和框架、信息與文件保存相關標準的基礎上,筆者認為,經(jīng)管專題庫資源長期保存標準包括管理標準和技術標準。
管理標準針對數(shù)據(jù)資源和元數(shù)據(jù)定義了保存環(huán)境的基本功能、實施主體及其職責范圍等。技術標準包含存儲規(guī)范和系統(tǒng)標準,前者明確了長期保存中資源傳輸和存儲的技術標準、數(shù)據(jù)格式和載體要求,后者規(guī)定了長期保存系統(tǒng)的運行及其互操作所需達到的技術要求,如表5所示。
表5 長期保存標準框架及其可參考標準
3.2.1 數(shù)據(jù)服務規(guī)范
服務規(guī)范用于規(guī)定服務應滿足的要求以確保其適用性[46]?;凇斗諛I(yè)組織標準化工作指南(GB/T 24421)》的一級標準,結(jié)合經(jīng)管信息、政務信息、新聞資訊和科學數(shù)據(jù)服務標準,筆者將經(jīng)管專題庫標準分為:①服務通用標準,即對服務術語和服務分類進行規(guī)范。為保障標準的適應性,服務分類標準可參考“一帶一路”專題庫的功能模塊[47],并結(jié)合中科院《數(shù)據(jù)服務指導性規(guī)范》確定導航、檢索、數(shù)據(jù)下載、分析、多語種服務、個性化服務和新媒體服務7類服務;②服務提供標準。參考服務要求標準和服務標準編寫通則,對7類服務的環(huán)節(jié)、人員、功能、合同和安全進行規(guī)定;③服務評價標準。根據(jù)國家標準從服務組織、人員、環(huán)境、環(huán)節(jié)、信息、滿意度、效果等指標對服務進行評價,以確定服務提升措施。
表6 數(shù)據(jù)服務標準框架及其可參考標準
3.2.2 開放共享標準
提供共享服務是經(jīng)管專題庫建設的終極目標。參考政務數(shù)據(jù)開放共享、中國科學院科學數(shù)據(jù)共享工程標準的結(jié)構(gòu),筆者將資源開放共享標準劃分為3個部分。
1)共享服務標準,主要對共享主體、內(nèi)容和方式進行規(guī)定,統(tǒng)籌協(xié)調(diào)數(shù)據(jù)內(nèi)容、整合過程。根據(jù)課題組前期研究,需對共享主體在資源整合、人員配置、經(jīng)費使用等方面進行規(guī)范化控制;確定共享方式,明確與政府部門、商業(yè)和科研機構(gòu)、國際組織和聯(lián)盟機構(gòu)之間的業(yè)務、技術、項目和協(xié)議等合作形式;規(guī)范共享數(shù)據(jù)的內(nèi)容、格式和載體等。
2)共享保障標準,指為保障數(shù)據(jù)開放共享的實施,所建立的數(shù)據(jù)描述與組織標準、網(wǎng)絡與平臺要求、管理與評估標準。
3)開放共享評估標準,借鑒政務數(shù)據(jù)和科學數(shù)據(jù)的相關標準,從數(shù)據(jù)資源、平臺設施、安全保障、管理評價和應用成效角度,對共享效果和開放程度進行評估,并對評估原則、指標體系和方法進行規(guī)定。
標準體系框架的構(gòu)建是確保經(jīng)管專題庫建設的有序推進、提高資源質(zhì)量的基礎性工作。本文以國家標準為指導,參考借鑒霍爾三維結(jié)構(gòu)、EA理論和信息生命周期理論,從適用范圍、主題類別和數(shù)據(jù)流程3個維度,建立了標準體系的三維模型,并進一步構(gòu)建了包含三大頂層設計、四大主體結(jié)構(gòu),以資源采選、元數(shù)據(jù)、分類編碼、內(nèi)容加工、長期保存、數(shù)據(jù)服務和開放共享標準為內(nèi)容的標準體系框架。同時,為提升標準體系對經(jīng)管領域的針對性,其資源采選標準的制定過程中參考了OECD、IMF、CCSA等國際經(jīng)濟行業(yè)組織的標準;元數(shù)據(jù)標準體系中制定了多語種經(jīng)濟術語對照詞表;分類與編碼標準參考了《國民經(jīng)濟行業(yè)分類》、國家統(tǒng)計局《中國統(tǒng)計年鑒》、中國信息經(jīng)濟網(wǎng)、《經(jīng)濟類型分類與代碼》等。所構(gòu)建的標準體系框架滿足數(shù)據(jù)庫在硬件、資源、服務和管理等方面的需求,覆蓋數(shù)據(jù)的整個生命周期,能為數(shù)據(jù)庫的規(guī)范化管理提供參考。
但本文僅提出了標準體系的基本框架,后續(xù)研究可基于此對其中要素進行細化,獲得具備直接指導意義的標準、指南;同時,應考慮到跨語言技術、數(shù)據(jù)庫服務的發(fā)展對標準提出的新要求,在維持標準體系框架結(jié)構(gòu)穩(wěn)定的前提下,進行豐富與完善。