国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

我國開放政府?dāng)?shù)據(jù)目錄體系構(gòu)建研究

2024-06-03 00:00:00孫小荃
圖書館學(xué)刊 2024年2期

[摘 要]目前我國還未建成國家級的政府?dāng)?shù)據(jù)開放平臺,也無法實現(xiàn)各省市開放政府?dāng)?shù)據(jù)的跨地區(qū)共享和互操作。通過調(diào)查分析我國現(xiàn)有的開放政府?dāng)?shù)據(jù)門戶網(wǎng)站,借鑒美國、英國、歐盟的開放政府?dāng)?shù)據(jù)目錄體系,提出統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)和標(biāo)識符編碼規(guī)則,并運(yùn)用SKOS技術(shù)實現(xiàn)各地區(qū)數(shù)據(jù)主題的語義關(guān)聯(lián)。為解決我國各地區(qū)開放政府?dāng)?shù)據(jù)門戶網(wǎng)站存在的元數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、目錄分類方式少和主題分類不一致等問題,結(jié)合實際情況提出我國開放政府?dāng)?shù)據(jù)目錄體系的構(gòu)建方案。

[關(guān)鍵詞]開放政府?dāng)?shù)據(jù) 目錄體系 元數(shù)據(jù)標(biāo)準(zhǔn) SKOS 語義關(guān)聯(lián) 主題分類

[分類號]G203;D63

大數(shù)據(jù)時代,開放政府?dāng)?shù)據(jù)運(yùn)動在全球興起,公眾越來越認(rèn)識到開放政府?dāng)?shù)據(jù)的重要性,開放政府?dāng)?shù)據(jù)不僅幫助市民參與政府工作,而且?guī)椭覀兠總€人做好日常決策。構(gòu)建政府?dāng)?shù)據(jù)的開放、管理、查詢、獲取和再利用的官方平臺,建設(shè)開放數(shù)據(jù)目錄的“一站式”門戶網(wǎng)站是各國在開放政府?dāng)?shù)據(jù)運(yùn)動中普遍采取的關(guān)鍵舉措[1]。2009年5月21日,美國上線全球第一個國家數(shù)據(jù)門戶網(wǎng)站(Data.gov)[2];歐盟于2012年12月和2015年11月上線歐盟開放數(shù)據(jù)門戶(European Union Open Data Portal, ODP)和歐洲統(tǒng)一的開放數(shù)據(jù)門戶(www.europeandataportal.eu)。截至2019年4月,我國已有82個地方政府推出政府?dāng)?shù)據(jù)開放平臺,其中省級地方政府13個、副省級與地市級地方政府69個[3],但尚未建成國家級開放政府?dāng)?shù)據(jù)門戶網(wǎng)站,在全國范圍內(nèi)對某類數(shù)據(jù)的查找仍然存在困難,也無法實現(xiàn)各省市開放政府?dāng)?shù)據(jù)跨地區(qū)的共享和互操作。目錄管理是開放數(shù)據(jù)門戶網(wǎng)站的核心,能夠幫助提供用戶數(shù)據(jù)集的查找、顯示和利用等服務(wù)[4],國務(wù)院于2015年頒布的《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》[5]和于2017年印發(fā)的《政務(wù)信息系統(tǒng)整合共享實施方案》[6]均強(qiáng)調(diào)各級政府要“制定政府?dāng)?shù)據(jù)共享開放目錄,依法推進(jìn)數(shù)據(jù)資源向社會開放”。

開放政府?dāng)?shù)據(jù)有著數(shù)據(jù)集數(shù)量多、涉及內(nèi)容廣、增長速度快、表現(xiàn)形式各異、存在分散等特點(diǎn),會降低用戶獲取數(shù)據(jù)的準(zhǔn)確度、相關(guān)度和速度。通過建設(shè)目錄體系可以全面梳理整合數(shù)據(jù),基于統(tǒng)一的標(biāo)準(zhǔn)描述開放政府?dāng)?shù)據(jù)和編制目錄,建立科學(xué)規(guī)范的分類體系,有序組織數(shù)據(jù),便于數(shù)據(jù)的存儲、導(dǎo)航、檢索和應(yīng)用。

在學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫檢索我國開放政府?dāng)?shù)據(jù)的元數(shù)據(jù)、開放政府?dāng)?shù)據(jù)分類及開放政府?dāng)?shù)據(jù)目錄相關(guān)主題文獻(xiàn),發(fā)現(xiàn)目前學(xué)者在開放政府?dāng)?shù)據(jù)目錄技術(shù)方面已有一些研究,也初步提出了我國開放政府?dāng)?shù)據(jù)核心元數(shù)據(jù)推薦標(biāo)準(zhǔn)和方案。如趙蓉英等[7]以Data.gov.uk為研究對象,從文件結(jié)構(gòu)、元素組成及規(guī)則等方面歸納總結(jié)元數(shù)據(jù)標(biāo)準(zhǔn)。司莉等[8]分析了Data.gov中的元數(shù)據(jù)標(biāo)準(zhǔn),為我國開放政府?dāng)?shù)據(jù)的元數(shù)據(jù)標(biāo)準(zhǔn)制定提供參考。黃如花等[9]調(diào)研英國、美國、加拿大、澳大利亞、新西蘭、歐盟的政府?dāng)?shù)據(jù)開放門戶的元數(shù)據(jù)描述規(guī)范,統(tǒng)一元數(shù)據(jù)格式并提出元數(shù)據(jù)元素集草案。Krishnamurthy等[10]提出Data.gov存在允許人們訪問的統(tǒng)一數(shù)據(jù)目錄,其同時擁有多種目錄分類方式,如主題、數(shù)據(jù)集類型、標(biāo)記、格式和組織類型等,能夠幫助公眾更好地搜索、瀏覽和下載數(shù)據(jù)集。Gligorijevi[í] [c]等[11]分析英國、美國和澳大利亞等8個開放政府?dāng)?shù)據(jù)平臺中的數(shù)據(jù)集分類情況,通過形式化的概念來分析生成一個共享概念化的數(shù)據(jù)結(jié)構(gòu),并將其作為知識庫對未分類的開放數(shù)據(jù)集進(jìn)行分類。高國偉等[12]對政府開放數(shù)據(jù)資源分類的問題和特征進(jìn)行分析,通過構(gòu)建自組織的分類框架來構(gòu)建開放政府?dāng)?shù)據(jù)的分類目錄。于夢月等[13]分析Data.gov的目錄聚合功能,劉汪洋等[14]分析了Data.gov.uk的目錄聚合功能,研究開放政府?dāng)?shù)據(jù)的元數(shù)據(jù)標(biāo)準(zhǔn)在開放政府?dāng)?shù)據(jù)目錄聚合上的應(yīng)用成果,為我國制定開放政府?dāng)?shù)據(jù)的元數(shù)據(jù)標(biāo)準(zhǔn)和建設(shè)國家級開放政府?dāng)?shù)據(jù)門戶網(wǎng)站提供參考。

綜上,我國開放政府?dāng)?shù)據(jù)目錄體系的研究還處于起步階段,應(yīng)借鑒美國、英國、歐盟等開放政府?dāng)?shù)據(jù)水平較高的政府?dāng)?shù)據(jù)門戶建設(shè)的成功經(jīng)驗,設(shè)計并建成我國開放政府?dāng)?shù)據(jù)目錄體系,為我國國家級開放政府?dāng)?shù)據(jù)門戶網(wǎng)站的建設(shè)奠定基礎(chǔ)。

1 開放政府?dāng)?shù)據(jù)目錄體系框架

開放政府?dāng)?shù)據(jù)是政務(wù)信息資源的一個新分支,我國開放政府?dāng)?shù)據(jù)目錄體系建設(shè)可以借鑒政務(wù)信息資源目錄體系建設(shè)的經(jīng)驗。2017年7月,國家發(fā)展改革委 中央網(wǎng)信辦印發(fā)了《政務(wù)信息資源目錄編制指南(試行)》,用于指導(dǎo)國家政務(wù)信息資源目錄的編制和各地政務(wù)信息資源目錄的編制、管理等[15]。政務(wù)信息資源目錄體系早已從前期理論研究階段進(jìn)入建設(shè)實施階段,并且在政務(wù)信息資源開發(fā)利用及部門協(xié)同辦公方面發(fā)揮重大作用[16]。借鑒政務(wù)信息資源目錄體系框架設(shè)計出開放政府?dāng)?shù)據(jù)目錄體系框架,目錄體系標(biāo)準(zhǔn)包括元數(shù)據(jù)、數(shù)據(jù)分類和標(biāo)識符編碼等。元數(shù)據(jù)是描述開放政府?dāng)?shù)據(jù)屬性的數(shù)據(jù),便于數(shù)據(jù)的發(fā)現(xiàn)、使用和管理;分類標(biāo)準(zhǔn)規(guī)定開放政府?dāng)?shù)據(jù)分類方法和原則,規(guī)范的分類體系方便數(shù)據(jù)管理,用戶可以多途徑查找數(shù)據(jù);標(biāo)識符編碼標(biāo)準(zhǔn)規(guī)范開放政府?dāng)?shù)據(jù)標(biāo)識符的編碼結(jié)構(gòu)和分配原則,保證每個數(shù)據(jù)集的唯一性。開放政府?dāng)?shù)據(jù)目錄體系概念模型見圖1,技術(shù)結(jié)構(gòu)見圖2。

我國國家級開放政府?dāng)?shù)據(jù)門戶網(wǎng)站負(fù)責(zé)存儲和管理開放政府?dāng)?shù)據(jù)主目錄,地方開放政府?dāng)?shù)據(jù)門戶網(wǎng)站則存儲和管理相關(guān)分目錄。同時應(yīng)建立主題目錄,國家級政府部門和地方政府部門直接在目錄中心注冊、保存和維護(hù)相關(guān)核心元數(shù)據(jù),用戶通過目錄中心提供的目錄進(jìn)行查詢和檢索,目錄體系管理結(jié)構(gòu)見圖3。

2 國外開放政府?dāng)?shù)據(jù)目錄體系

許多開放數(shù)據(jù)水平較高的國家已經(jīng)建成開放政府?dāng)?shù)據(jù)目錄體系,有著統(tǒng)一的分類標(biāo)準(zhǔn),目錄分類方式多樣,用戶可以多角度快速查詢到所需數(shù)據(jù)。元數(shù)據(jù)在提高開放政府?dāng)?shù)據(jù)的可發(fā)現(xiàn)性上起著很大作用,能幫助用戶理解和選擇數(shù)據(jù)集,有希望達(dá)成語義化、標(biāo)準(zhǔn)化和機(jī)器可讀,被廣泛使用的元數(shù)據(jù)標(biāo)準(zhǔn)方案有萬維網(wǎng)聯(lián)盟(World Wide Web Consortium,W3C)的數(shù)據(jù)目錄詞匯表(Data Catalog Vocabulary,DCAT)、美國的開放政府?dāng)?shù)據(jù)項目(Project Open Data,POD)和歐盟的DCAT應(yīng)用綱要(DCAT-AP)。

其中DCAT是W3C的正式標(biāo)準(zhǔn)[17],得到美國、英國、加拿大、澳大利亞等多國政府?dāng)?shù)據(jù)開放門戶的使用,適用于多種元數(shù)據(jù)文檔[18]。DCAT是RDF詞匯表,支持?jǐn)?shù)據(jù)目錄之間的互操作性,可用于描述數(shù)據(jù)集,提高開放數(shù)據(jù)集的可發(fā)現(xiàn)性,使應(yīng)用程序能從多個數(shù)據(jù)目錄中讀取數(shù)據(jù)集的元數(shù)據(jù)。

2.1 美國開放政府?dāng)?shù)據(jù)目錄體系

美國開放政府?dāng)?shù)據(jù)目錄體系提供了較全面的目錄分類方式,能夠滿足用戶多樣的查詢需求,目錄體系中包括主題目錄、主題分類目錄、數(shù)據(jù)集類型目錄、標(biāo)簽?zāi)夸?、格式目錄、組織類型目錄、組織目錄、發(fā)布者目錄、機(jī)構(gòu)目錄等。主題目錄是最基本的目錄分類方式,美國開放政府?dāng)?shù)據(jù)主題目錄下的分類包括農(nóng)業(yè)、氣候、消費(fèi)者、生態(tài)系統(tǒng)、教育、能源、金融、健康、當(dāng)?shù)卣⒅圃鞓I(yè)、海事、海洋、公共安全、科學(xué)和研究這14個主題。數(shù)據(jù)集類型目錄則將數(shù)據(jù)集分為地理和非地理數(shù)據(jù),美國有通用的地理元數(shù)據(jù)標(biāo)準(zhǔn)用于地理數(shù)據(jù)集。格式目錄中提供了48種數(shù)據(jù)資源格式,基本滿足用戶的應(yīng)用程序的各種使用需求。組織目錄、發(fā)布者目錄和機(jī)構(gòu)目錄提供了各部門和一些地區(qū)的開放數(shù)據(jù),Data.gov利用基于“元數(shù)據(jù)采集”的目錄聚合機(jī)制將部門和地方的數(shù)據(jù)自動聚合到該門戶上供用戶瀏覽和使用[19]。

2.2 英國開放政府?dāng)?shù)據(jù)目錄體系

英國開放政府?dāng)?shù)據(jù)目錄體系中包括主題目錄、發(fā)布者目錄和文件格式目錄。主題分類目錄中包括商業(yè)和經(jīng)濟(jì)、犯罪與司法、防御、教育、環(huán)境、政府、政府開支、健康、制圖、社會、小鎮(zhèn)和城市、運(yùn)輸這12個一級目錄,并且在一級目錄下提供具有更詳細(xì)信息的二級目錄。Data.gov.uk還提供基于地圖搜索查詢的數(shù)據(jù)集,本質(zhì)上是提供按地區(qū)分類的數(shù)據(jù),這種分類方式的優(yōu)勢是使地區(qū)的大小范圍可以根據(jù)所需要求控制,使得查詢更加智能化。只需要對所需數(shù)據(jù)所屬的地區(qū)區(qū)域進(jìn)行選擇,地圖抓取數(shù)據(jù)工具就能將所選區(qū)域記錄下來并轉(zhuǎn)換成機(jī)器可識別的數(shù)據(jù)提交給地區(qū)分類目錄。英國還開放了不同領(lǐng)域的數(shù)據(jù),走在了世界前列,如“開放合同數(shù)據(jù)”,既是開放政府?dāng)?shù)據(jù)的重點(diǎn)領(lǐng)域,也是國際反腐敗開放數(shù)據(jù)的突破口[20]。

2.3 歐盟開放政府?dāng)?shù)據(jù)目錄體系

歐洲統(tǒng)一開放數(shù)據(jù)門戶包括捷克、德國、法國等35個國家的開放數(shù)據(jù),目錄體系包括國家目錄、門戶目錄、主題目錄、關(guān)鍵詞目錄、格式目錄、許可目錄。主題目錄包括農(nóng)業(yè)、漁業(yè)、林業(yè)和食品,經(jīng)濟(jì)和金融,教育、文化和體育,能源,環(huán)境,政府和公共部門,健康,國際問題,正義、法制和公共安全,地區(qū)和城市,人口與社會,科學(xué)和技術(shù),交通等13個主題。

為規(guī)范元數(shù)據(jù)取值和幫助目錄體系更好地發(fā)揮其作用,歐盟出臺了多語種敘詞表——EuroVoc,它能夠?qū)⑺饕~匯的術(shù)語標(biāo)準(zhǔn)化,允許更準(zhǔn)確地數(shù)據(jù)檢索,還能在不同語言表達(dá)的相同概念之間建立語言等價性,允許以文檔列表的語言對文檔進(jìn)行索引,并以用戶的語言進(jìn)行搜索。EuroVoc包括概念敘詞表、領(lǐng)域敘詞表、語言敘詞表、關(guān)系敘詞表、范圍和歷史注釋敘詞表、詞典敘詞表和同義詞敘詞表。EuroVoc被建模為SKOS和SKOS-XL類和屬性的直接擴(kuò)展,重用并重新聲明部分都柏林核心屬性,并將其與15個敘詞表間建立概念映射,一個詞匯的給定概念與不同詞匯中的概念具有一定程度的對應(yīng)關(guān)系。SKOS可以把海量無序化數(shù)據(jù)進(jìn)行組織分類,運(yùn)用SKOS編碼技術(shù)對開放政府?dāng)?shù)據(jù)分類法中的語義關(guān)系進(jìn)行準(zhǔn)確描述,使其具有數(shù)據(jù)交換和機(jī)器可處理的能力。

3 我國開放政府?dāng)?shù)據(jù)的元數(shù)據(jù)

3.1 我國開放政府?dāng)?shù)據(jù)元數(shù)據(jù)調(diào)研

我國地方政府已經(jīng)開始制定政府開放數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn),用于指導(dǎo)門戶中元數(shù)據(jù)的使用。目前,廣東、山東和貴州三省已經(jīng)出臺地方政府開放數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)。雖然我國地方開放政府?dāng)?shù)據(jù)門戶網(wǎng)站能提供基本元數(shù)據(jù)信息,但仍存在元數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、重要元數(shù)據(jù)項缺失和元數(shù)據(jù)質(zhì)量低等問題,通過調(diào)研開放數(shù)林指數(shù)報告中我國82個地方政府?dāng)?shù)據(jù)開放平臺中的元數(shù)據(jù)(其中5個平臺無法訪問或查詢不到數(shù)據(jù)集信息),得到元數(shù)據(jù)信息如圖4所示,柱形圖上標(biāo)明的數(shù)字代表元數(shù)據(jù)元素項出現(xiàn)的次數(shù),次數(shù)在5次以下的沒有進(jìn)行展示。

3.2 元數(shù)據(jù)方案設(shè)計

調(diào)研中發(fā)現(xiàn)元數(shù)據(jù)信息越完善,開放數(shù)據(jù)使用效率越高。開放政府?dāng)?shù)據(jù)元數(shù)據(jù)的設(shè)計需滿足數(shù)據(jù)集的可訪問性和數(shù)據(jù)目錄間的互操作性,應(yīng)按照DCAT標(biāo)準(zhǔn)提供DCAT中核心的元素項,并選擇性提供另外一些有利于開放政府?dāng)?shù)據(jù)發(fā)現(xiàn)、理解和使用的元數(shù)據(jù)元素項。將我國地方開放政府?dāng)?shù)據(jù)現(xiàn)有的元數(shù)據(jù)元素項和DCAT標(biāo)準(zhǔn)中的核心元數(shù)據(jù)元素項進(jìn)行映射,得出擬推薦的元數(shù)據(jù)方案,見表1。

機(jī)器可讀的元數(shù)據(jù)格式在元數(shù)據(jù)實際使用中非常重要,XML、RDF格式的元數(shù)據(jù)機(jī)器可讀且支持元數(shù)據(jù)的互操作,XML、RDF和JSON格式作為編碼元數(shù)據(jù)的有效方式已被美國、英國等國家采納。如果我國地方政府都提供這種格式的元數(shù)據(jù),應(yīng)用程序就能做到跨多個數(shù)據(jù)目錄的讀取和解析,從而自動查找、選擇數(shù)據(jù)集,向目錄體系的建設(shè)邁出一大步。

4 我國開放政府?dāng)?shù)據(jù)分類目錄

我國地方開放政府?dāng)?shù)據(jù)門戶網(wǎng)站有各自的分類目錄,通過調(diào)查分析發(fā)現(xiàn)普遍存在的分類目錄有主題目錄、機(jī)構(gòu)(部門)目錄、(資源)類型目錄、評分目錄、地市(地區(qū))目錄等,表2是部分地區(qū)開放政府?dāng)?shù)據(jù)門戶網(wǎng)站的分類目錄。

我國地方開放政府?dāng)?shù)據(jù)門戶網(wǎng)站分類目錄少,分類角度不全面,分類標(biāo)準(zhǔn)不一致,與美國、英國等國家的多個分類目錄相比無法更靈活地滿足用戶的查找需求。下面將提出符合我國實際情況的幾種分類目錄。

4.1 主題目錄

按主題分類是多種目錄分類方式中最普遍且被用戶使用最多的分類方式,各地主題分類標(biāo)準(zhǔn)不一致,對相同語義的主題采用了不同的命名方式,給建設(shè)國家級開放政府?dāng)?shù)據(jù)主題目錄帶來困難。調(diào)查我國地方開放政府?dāng)?shù)據(jù)的主題分類方式,整理我國部分地區(qū)開放政府?dāng)?shù)據(jù)的主題目錄,如表3所示。

結(jié)合我國地方政府開放政府?dāng)?shù)據(jù)主題目錄分類的25個類目,借鑒美國、英國和歐盟等國家的主題目錄,進(jìn)行我國開放政府?dāng)?shù)據(jù)目錄體系中主題目錄的建設(shè),可以將我國開放政府?dāng)?shù)據(jù)分為11個主題,分別是經(jīng)濟(jì)、交通、環(huán)境、健康、教育與科研、政府、民生、農(nóng)業(yè)、司法、宗教、娛樂。這11個主題包含且對應(yīng)了以上25個類目。以北京市開放政府?dāng)?shù)據(jù)門戶主題目錄為例,我國國家級開放政府?dāng)?shù)據(jù)目錄體系主題目錄和北京市開放政府?dāng)?shù)據(jù)主題目錄對應(yīng)情況如表4所示。

表4 主題目錄對應(yīng)情況

[序號 我國國家級開放政府?dāng)?shù)據(jù)主題目錄 北京市開放政府?dāng)?shù)據(jù)

主題目錄 1 經(jīng)濟(jì) 經(jīng)濟(jì)建設(shè) 2 交通 交通服務(wù) 3 環(huán)境 環(huán)境與資源保護(hù) 4 教育與科研 教育科研 5 健康 醫(yī)療健康 6 政府 政府機(jī)構(gòu)與社會團(tuán)體 7 民生 生活安全 社會保障 勞動就業(yè) 生活服務(wù) 房屋住宅 企業(yè)服務(wù) 8 農(nóng)業(yè) 農(nóng)業(yè)農(nóng)村 9 司法 — 10 宗教 宗教信仰 11 娛樂 旅游住宿 餐飲美食 文體娛樂 消費(fèi)購物 ]

由于我國開放政府?dāng)?shù)據(jù)平臺并沒有自上而下進(jìn)行建設(shè),地方平臺數(shù)據(jù)集主題存在差異,直接通過數(shù)據(jù)集主題進(jìn)行整合存在困難,應(yīng)利用SKOS技術(shù)對主題目錄進(jìn)行語義化描述[18]。隨著語義網(wǎng)和關(guān)聯(lián)數(shù)據(jù)的不斷發(fā)展,SKOS被廣泛應(yīng)用于術(shù)語集成與映射,解決不同知識組織系統(tǒng)的互操作問題,將各類術(shù)語資源向敘詞表和分類表進(jìn)行映射[21],為用戶提供一站式服務(wù),彌合不同知識組織工具之間的語義縫隙。用SKOS對主題詞表進(jìn)行語義描述早就成為主流,國外學(xué)者已經(jīng)完成了《美國國會圖書館主題詞表》和EuroVoc的SKOS轉(zhuǎn)化實驗[22-24],我國也實現(xiàn)了《中國分類主題詞表》的SKOS表示[25]。采用SKOS技術(shù)將地方政府?dāng)?shù)據(jù)開放平臺中的主題詞和我國國家級開放政府?dāng)?shù)據(jù)的主題目錄映射起來,將實現(xiàn)全國范圍內(nèi)的數(shù)據(jù)整合。

SKOS詞匯表提供以下映射構(gòu)造子“鏈接”兩個KOS中的詞匯,包括skos:exactMatch、skos:closeMatch、skos:broadMatch、skos:narrowMatch、skos:relatedMatch。其中skos:exactMatch表示兩個術(shù)語的“意義”一致,可相互替換,且具有傳遞性;skos:closeMatch表示兩個術(shù)語的“意義”基本一致,可相互替換,但不具有傳遞性;skos:exactMatch是skos:closeMatch的子屬性。SKOS的映射構(gòu)造能夠用于關(guān)聯(lián)集之間的鏈接構(gòu)建,將地方開放政府?dāng)?shù)據(jù)的主題映射到我國國家級開放政府?dāng)?shù)據(jù)門戶網(wǎng)站的主題目錄中,以便快速準(zhǔn)確地查詢到某個主題的開放政府?dāng)?shù)據(jù)。以“環(huán)境”這一主題為例,描述國家級和地方開放政府?dāng)?shù)據(jù)門戶網(wǎng)站中數(shù)據(jù)主題的映射關(guān)系,關(guān)系模型如圖5所示。

利用SKOS技術(shù)將地方開放政府?dāng)?shù)據(jù)門戶網(wǎng)站主題目錄對應(yīng)的主題詞鏈接到總結(jié)出來的11個主題詞上,實現(xiàn)所需主題的數(shù)據(jù)查詢、獲取和利用,最終實現(xiàn)主題目錄的建設(shè)。

4.2 地區(qū)目錄

在我國國家級開放政府?dāng)?shù)據(jù)門戶網(wǎng)站中建立地區(qū)分類目錄,將目錄中的地區(qū)直接鏈接到對應(yīng)的地方政府開放數(shù)據(jù)門戶上。目前我國很多省市已經(jīng)建成地方政府?dāng)?shù)據(jù)開放平臺,而且山東省和貴陽市的開放數(shù)據(jù)平臺已經(jīng)包含地區(qū)目錄,能夠初步聚合下級開放數(shù)據(jù)平臺中的數(shù)據(jù),應(yīng)在此基礎(chǔ)上建成國家級開放政府?dāng)?shù)據(jù)地區(qū)目錄,更好地發(fā)揮地方開放政府?dāng)?shù)據(jù)的價值。

4.3 機(jī)構(gòu)(部門)目錄

將部門劃分成中央和地方兩大類,再進(jìn)行具體政府部門的細(xì)分,用戶可以按部門對數(shù)據(jù)進(jìn)行查找。由于我國地方政府部門數(shù)量較多,地方部門的數(shù)據(jù)應(yīng)實行集中分布式查找。如某用戶想要查找北京市公安局的開放政府?dāng)?shù)據(jù),可以先通過地區(qū)分類目錄查詢到北京市開放政府?dāng)?shù)據(jù)門戶網(wǎng)站,再通過其部門分類目錄查找到北京市公安局的開放政府?dāng)?shù)據(jù)(如圖6所示)。

4.4 數(shù)據(jù)集格式目錄

美國政府開放數(shù)據(jù)門戶的數(shù)據(jù)目錄(https://catalog.data.gov/dataset)把數(shù)據(jù)集按資源格式進(jìn)行分類,包括HTML、PDF、XML、CSV、Originator data format、ZIP、JSON、WMS、TIFF、SID、RDF、JPEG、API等。英國開放政府?dāng)?shù)據(jù)門戶(https://data.gov.uk)中的數(shù)據(jù)集分類格式包括PDF、CSV、HTML、ODS、WMS、XLS、XLSX、XML。目前我國開放政府?dāng)?shù)據(jù)廣泛使用的數(shù)據(jù)格式有CSV、XLS、XLSX、XML、JSON、RDF、API等。應(yīng)構(gòu)建目錄體系中的數(shù)據(jù)集格式目錄并鼓勵提供多種格式的數(shù)據(jù)集,方便用戶通過數(shù)據(jù)集的格式對數(shù)據(jù)進(jìn)行查找。

4.5 評分目錄

目錄體系還可以包含數(shù)據(jù)綜合評價目錄,在數(shù)據(jù)及時更新的基礎(chǔ)上采用開放政府?dāng)?shù)據(jù)的“五星評級模型”[26],使用戶可以通過評價的星級查找自己所需級別的數(shù)據(jù)。

(1)一星級別:以“開放許可”將數(shù)據(jù)發(fā)布到Web上,格式不限,可以是紙質(zhì)文件的掃描件或PDF文檔等;

(2)二星級別:發(fā)布為機(jī)器可讀的結(jié)構(gòu)化數(shù)據(jù),如Excel電子表格;

(3)三星級別:發(fā)布為非專有格式,如CSV;

(4)四星級別:采用W3C開放標(biāo)準(zhǔn),其特征為通過URI來表示事物;

(5)五星級別:將數(shù)據(jù)鏈接到其他數(shù)據(jù)集。

5 我國開放政府?dāng)?shù)據(jù)標(biāo)識符編碼規(guī)則

建立目錄體系就是要采集和管理元數(shù)據(jù),應(yīng)對每個開放政府?dāng)?shù)據(jù)集規(guī)定唯一固定的標(biāo)識符編碼,便于數(shù)據(jù)的檢索、查詢和定位,使其發(fā)揮更大的價值。筆者調(diào)研我國77個地方開放政府?dāng)?shù)據(jù)門戶中的元數(shù)據(jù),發(fā)現(xiàn)僅有24個平臺提供標(biāo)識符這一元數(shù)據(jù)元素項,而且提供的標(biāo)識符也未遵循統(tǒng)一規(guī)范。如浙江省政府?dāng)?shù)據(jù)開放平臺(data.zjzwfw.gov.cn)的“道路運(yùn)輸證”數(shù)據(jù)集(http://data.zjzwfw.gov.cn/jdop_front/detail/data.do?iid=3946amp;searchStri-ng=道路)和深圳市政府?dāng)?shù)據(jù)開放平臺(opendata.sz.gov.cn)的“城市道路信息”數(shù)據(jù)集(https://opendata.sz.gov.cn/data/dataSet/toDataDetails/29200_00403085)的標(biāo)識符編碼分別為30701600003032/259和29200/00403085。用戶無法從這兩個數(shù)據(jù)集的標(biāo)識符中得到潛在信息,因為兩者未遵循統(tǒng)一的規(guī)則,影響了標(biāo)識符自身的價值。

借鑒政務(wù)信息資源的標(biāo)識符編碼規(guī)則[27],筆者提出我國開放政府?dāng)?shù)據(jù)元數(shù)據(jù)的標(biāo)識符編碼參考規(guī)則,標(biāo)識符編碼應(yīng)由前段碼、間隔符和后段碼組成。前段碼為機(jī)構(gòu)編碼共8位,前6位表示地區(qū),后兩位表示機(jī)構(gòu),中央機(jī)構(gòu)前6位都是0,后段碼長度不限,標(biāo)識符的表現(xiàn)形式如圖7所示。

6 結(jié)語

目錄體系是開放政府?dāng)?shù)據(jù)門戶網(wǎng)站的核心和基礎(chǔ),筆者通過設(shè)計統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)、目錄分類方式和標(biāo)識符編碼等標(biāo)準(zhǔn)來構(gòu)建我國開放政府?dāng)?shù)據(jù)目錄體系,以期有效推動我國開放政府?dāng)?shù)據(jù)平臺的建設(shè)和升級。該方案仍存在一些不足,如元數(shù)據(jù)標(biāo)準(zhǔn)的實施、元數(shù)據(jù)存在的質(zhì)量問題和實際建設(shè)中遇到的問題等,還需要進(jìn)一步地研究。

參考文獻(xiàn):

[1] 張涵,王忠.國外政府開放數(shù)據(jù)的比較研究[J].情報雜志,2015(8):142-146,151.

[2] 汪慶怡,高潔.面向用戶服務(wù)的美國政府開放數(shù)據(jù)研究及啟示——以美國Data.gov網(wǎng)站為例[J].情報雜志,2016(7):145-150.

[3] 人民網(wǎng).《2019中國地方政府?dāng)?shù)據(jù)開放報告》暨“中國開放數(shù)林指數(shù)”[EB/OL].[2019-05-24].http://gz.people.com.cn/n2/2019/0524/c391492-32976531.html.

[4] Ku?era J, Chlapek D, Ne?asky M. Open Government Data Catalogs: Current Approaches and Quality Perspective[C].Technology-Enabled Innovation for Democracy, Government and Governance,2013(26):152-166.

[5] 國務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動綱要的通知[EB/OL].[2015-09-05].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.

[6] 國務(wù)院辦公廳關(guān)于印發(fā)政務(wù)信息系統(tǒng)整合共享實施方案的通知[EB/OL].[2017-05-18].http://www.gov.cn/zhengce/content/2017-05/18/content_5194971.htm.

[7] 趙蓉英,梁志森,段培培.英國政府?dāng)?shù)據(jù)開放共享的元數(shù)據(jù)標(biāo)準(zhǔn)——對Data.gov.uk的調(diào)研與啟示[J].圖書情報工作,2016(19):31-39.

[8] 司莉,趙潔.美國開放政府?dāng)?shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)及啟示[J].圖書情報工作,2018(3):86-93.

[9] 黃如花,林焱.國外開放政府?dāng)?shù)據(jù)描述規(guī)范的調(diào)查與分析[J].圖書情報工作,2017(20):37-52.

[10] Rashmi Krishnamurthy,Yukika Awazu. Liberating data for public value: The case of Data.gov[J]. International Journal of Information Management,2016(4):668-672.

[11] Milena Frtuni? Gligorijevi?,et al.Open data categorization based on formal concept analysis[C].IEEE Tronsactions on Emevging Topics in Computing, 2021(2):571-581.

[12] 高國偉,龔掌立,李永先.基于自組織的政府開放數(shù)據(jù)資源分類模式[J].圖書館學(xué)研究,2017(23):31-35.

[13] 于夢月,等.美國政府開放數(shù)據(jù)的元數(shù)據(jù)標(biāo)準(zhǔn)及其啟示:目錄聚合的視角[J].情報雜志,2017(12):145-151.

[14] 劉汪洋,等.英國政府開放數(shù)據(jù)的目錄聚合機(jī)制及對我國的啟示[J].圖書館,2019(4):53-59.

[15] 趙潤娣.我國政府?dāng)?shù)據(jù)開放分類分級研究——基于開放政府?dāng)?shù)據(jù)平臺教育類數(shù)據(jù)的調(diào)查[J].現(xiàn)代情報,2021(4):90-100.

[16] 張曉娟,任文華.我國政務(wù)信息資源目錄體系研究述評[J].圖書與情報,2017(2):48-54.

[17] W3C.Data Catalog Vocabulary(DCAT)[EB/OL].[2014-01-16].http://www.w3.org/TR/vocab-dcat/.

[18] W3C.SKOS Core Guide[EB/OL].[2012-12-13].https://www.w3.org/2004/02/skos/.

[19] 孫小荃,翟軍.中美兩國政府開放數(shù)據(jù)的元數(shù)據(jù)比較研究[J].圖書館雜志,2021(11):39-47.

[20] 翟軍,等.反腐敗視角下英國政府開放合同數(shù)據(jù)的實踐與啟示[J].圖書館,2021(3):72-79.

[21] 宋培彥.基于知識組織的術(shù)語服務(wù)體系研究[J].圖書情報工作,2012(22):6-11.

[22] Harper C A.Encoding library of congress subject headings in SKOS:authority control for the semantic web[C].Proceedings of the 2006 International Conference on Dublin Core and Metadata Applications: Metadata for Knowledge and Learning.Dublin Core Metadata Initiative,2006:89-94.

[23] Summers E,et al.LCSH,SKOS and linked data[C].Proceedings of the 2008 International Conference on Dublin Core and Metadata Applications. Dublin Core Metadata Initiative,2008:25-33.

[24] 石澤順,肖明.基于網(wǎng)絡(luò)敘詞表的圖情學(xué)科SKOS構(gòu)建與可視化研究[J].情報學(xué)報,2018(3):274-284.

[25] 劉麗斌,等.《中國分類主題詞表》的SKOS描述自動轉(zhuǎn)換研究[J].中國圖書館學(xué)報,2009(6):56-60.

[26] 翟軍.關(guān)聯(lián)政府?dāng)?shù)據(jù)原理與應(yīng)用——大數(shù)據(jù)時代開放數(shù)據(jù)的技術(shù)與實踐[M].北京:電子工業(yè)出版社,2016.

[27] 彭言海.基于云計算的政務(wù)信息資源共享交換與整合平臺的研究與實現(xiàn)[D].鄭州:鄭州大學(xué),2017.

孫小荃 女,1997年生。碩士,助教。研究方向:開放政府?dāng)?shù)據(jù)、目錄體系、元數(shù)據(jù)標(biāo)準(zhǔn)。

(收稿日期:2022-12-12;責(zé)編:鄧鈺。)

石首市| 游戏| 荣昌县| 高雄市| 洛浦县| 雅江县| 南陵县| 石景山区| 聂荣县| 微山县| 南开区| 长汀县| 萨迦县| 东丽区| 望江县| 炎陵县| 西安市| 陕西省| 德令哈市| 读书| 桃园市| 卓尼县| 老河口市| 屏南县| 突泉县| 都兰县| 鄄城县| 莫力| 嘉祥县| 东乌| 嵊泗县| 水城县| 上犹县| 榆中县| 肇庆市| 佛教| 如东县| 临桂县| 商城县| 正阳县| 淮安市|