王 衛(wèi),王 晶,張夢(mèng)君(北京師范大學(xué)政府管理學(xué)院)
生命周期的概念源于生物學(xué)領(lǐng)域,其本質(zhì)是描述一個(gè)生物體從誕生、成長(zhǎng)、成熟直至衰亡的過程,后經(jīng)學(xué)者們的引申和擴(kuò)展,逐漸被廣泛應(yīng)用于經(jīng)濟(jì)學(xué)、管理學(xué)等各個(gè)學(xué)科領(lǐng)域,成為一種重要的研究方法。[1]數(shù)據(jù)生命周期是指從數(shù)據(jù)產(chǎn)生、經(jīng)數(shù)據(jù)加工和發(fā)布,最終實(shí)現(xiàn)數(shù)據(jù)再利用的一個(gè)循環(huán)過程,[2]它作為一種重要的理論已被應(yīng)用于眾多研究領(lǐng)域。[1,3]
事物的發(fā)展變化具有動(dòng)態(tài)性和規(guī)律性,都存在一定的生命周期。政府?dāng)?shù)據(jù)被發(fā)布到開放平臺(tái)上成為政府開放數(shù)據(jù),平臺(tái)作為政府開放數(shù)據(jù)的重要載體,在建設(shè)過程中應(yīng)考慮政府開放數(shù)據(jù)的生命周期過程,使平臺(tái)建設(shè)符合數(shù)據(jù)發(fā)展規(guī)律,保證數(shù)據(jù)開放平臺(tái)的可持續(xù)性。
目前,關(guān)于政府開放數(shù)據(jù)生命周期的階段劃分各不相同,如將政府開放數(shù)據(jù)生命周期分為創(chuàng)建和發(fā)布、檢索和使用、反饋三個(gè)階段,[4]或?qū)⑵浞譃樽R(shí)別、準(zhǔn)備、發(fā)布、重用和評(píng)估五個(gè)階段等。[5]盡管國(guó)內(nèi)外存在很多對(duì)政府開放數(shù)據(jù)生命周期的研究,但大多對(duì)政府?dāng)?shù)據(jù)開放過程進(jìn)行了簡(jiǎn)化,許多重要步驟被省略。政府?dāng)?shù)據(jù)開放是一個(gè)完整的生命周期過程,平臺(tái)建設(shè)的每個(gè)階段都會(huì)影響平臺(tái)整體效果的實(shí)現(xiàn)?;诖?,本文根據(jù)Attard等提出的生命周期模型,[6]從數(shù)據(jù)創(chuàng)建、數(shù)據(jù)篩選、數(shù)據(jù)發(fā)布、數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)管理、數(shù)據(jù)檢索、數(shù)據(jù)開發(fā)、數(shù)據(jù)互動(dòng)八個(gè)方面提出了政府開放數(shù)據(jù)平臺(tái)建設(shè)的理論框架(見下圖)。
圖 政府開放數(shù)據(jù)平臺(tái)的理論框架
政府開放數(shù)據(jù)平臺(tái)理論框架由數(shù)據(jù)層、平臺(tái)層、服務(wù)層三部分組成,包括相互關(guān)聯(lián)、連續(xù)迭代的八個(gè)階段。數(shù)據(jù)層是政府開放數(shù)據(jù)平臺(tái)的基礎(chǔ),它為平臺(tái)層提供原始數(shù)據(jù)集,包括數(shù)據(jù)創(chuàng)建和數(shù)據(jù)篩選兩個(gè)階段。平臺(tái)層為服務(wù)層提供服務(wù)支撐,包括數(shù)據(jù)發(fā)布、數(shù)據(jù)關(guān)聯(lián)和數(shù)據(jù)管理三個(gè)階段。數(shù)據(jù)發(fā)布將數(shù)據(jù)層提供的數(shù)據(jù)集發(fā)布到平臺(tái)上成為開放數(shù)據(jù);數(shù)據(jù)關(guān)聯(lián)將發(fā)布的數(shù)據(jù)進(jìn)行關(guān)聯(lián)以發(fā)現(xiàn)更多潛在的有價(jià)值信息;數(shù)據(jù)管理通過更新、清理、歸檔和保存等方式對(duì)數(shù)據(jù)進(jìn)行動(dòng)態(tài)維護(hù)。服務(wù)層是用戶獲取資源、開發(fā)應(yīng)用、反饋交流的重要渠道,包括數(shù)據(jù)檢索、數(shù)據(jù)開發(fā)和數(shù)據(jù)互動(dòng)三個(gè)階段,它將更新數(shù)據(jù)等意見反饋給平臺(tái)層,將請(qǐng)求新的數(shù)據(jù)集或?qū)σ寻l(fā)布數(shù)據(jù)集的評(píng)價(jià)等內(nèi)容反饋給數(shù)據(jù)層,政府部門依據(jù)用戶請(qǐng)求和評(píng)價(jià)等調(diào)整數(shù)據(jù)創(chuàng)建,進(jìn)而又進(jìn)入下一個(gè)政府開放數(shù)據(jù)生命周期的循環(huán)。
數(shù)據(jù)層是政府開放數(shù)據(jù)平臺(tái)提供服務(wù)的基礎(chǔ),該層提供的原始數(shù)據(jù)集質(zhì)量將直接影響數(shù)據(jù)的再利用和再發(fā)布,同時(shí)也會(huì)影響公眾使用數(shù)據(jù)集的體驗(yàn)。調(diào)查顯示,77%的政府機(jī)構(gòu)認(rèn)為不準(zhǔn)確的數(shù)據(jù)削弱了他們提供卓越用戶體驗(yàn)的能力。[7]
2.1.1 數(shù)據(jù)創(chuàng)建
數(shù)據(jù)創(chuàng)建是指各政府部門收集公共領(lǐng)域或部門內(nèi)部產(chǎn)生的數(shù)據(jù)。公共領(lǐng)域的數(shù)據(jù)包括氣候、污染、公共運(yùn)輸、交通、教育等;政府部門內(nèi)部的數(shù)據(jù)包括預(yù)算與支出、人口、地理數(shù)據(jù)、會(huì)議數(shù)據(jù)等。為方便下游信息處理和開發(fā)利用,數(shù)據(jù)創(chuàng)建過程要明確數(shù)據(jù)來源、遵循元數(shù)據(jù)描述標(biāo)準(zhǔn)、符合統(tǒng)一數(shù)據(jù)開放規(guī)范。
明確數(shù)據(jù)來源,對(duì)保障發(fā)布數(shù)據(jù)的質(zhì)量具有重要意義。遵循元數(shù)據(jù)描述標(biāo)準(zhǔn),有利于將不同政府部門創(chuàng)建的數(shù)據(jù)進(jìn)行關(guān)聯(lián),便于推動(dòng)跨部門、跨機(jī)構(gòu)的數(shù)據(jù)整合與分析,實(shí)現(xiàn)公眾數(shù)據(jù)發(fā)現(xiàn)、挖掘和重用。美國(guó)開放政府?dāng)?shù)據(jù)采用DCAT標(biāo)準(zhǔn)進(jìn)行元數(shù)據(jù)描述規(guī)范,英國(guó)、澳大利亞則在借鑒DC標(biāo)準(zhǔn)的基礎(chǔ)上,根據(jù)實(shí)際需要擬定了本國(guó)政府開放數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)草案。[8]政府?dāng)?shù)據(jù)開放離不開標(biāo)準(zhǔn)規(guī)范的引導(dǎo),遵循統(tǒng)一的數(shù)據(jù)開放規(guī)范,有利于提高政府?dāng)?shù)據(jù)創(chuàng)建效率。美國(guó)高度重視數(shù)據(jù)開放標(biāo)準(zhǔn)規(guī)范的制定,其政府開放數(shù)據(jù)平臺(tái)上的信息均符合聯(lián)邦信息處理標(biāo)準(zhǔn)(NIST)199號(hào)文件的規(guī)定,相關(guān)政府部門提交數(shù)據(jù)資源的操作必須按照上述標(biāo)準(zhǔn)的指引進(jìn)行。[9]
2.1.2 數(shù)據(jù)篩選
開放數(shù)據(jù)平臺(tái)上發(fā)布的數(shù)據(jù)應(yīng)剔除涉及個(gè)人隱私、知識(shí)產(chǎn)權(quán)和國(guó)家安全的數(shù)據(jù),并且應(yīng)符合現(xiàn)有的法律政策。為此,需要對(duì)創(chuàng)建的數(shù)據(jù)進(jìn)行篩選??紤]到數(shù)據(jù)集通過整合、分析后可能會(huì)產(chǎn)生衍生數(shù)據(jù),故數(shù)據(jù)篩選過程中應(yīng)對(duì)開放數(shù)據(jù)進(jìn)行多次審核、定期復(fù)審,實(shí)現(xiàn)數(shù)據(jù)本身安全和數(shù)據(jù)防護(hù)安全。[10]
法律政策是平臺(tái)進(jìn)行數(shù)據(jù)篩選的重要指導(dǎo)。美國(guó)、英國(guó)等開放數(shù)據(jù)運(yùn)動(dòng)的引領(lǐng)者,很早便建立了符合本國(guó)國(guó)情的開放數(shù)據(jù)政策法規(guī)體系。美國(guó)2009年發(fā)布的《開放政府令》,細(xì)化政府開放數(shù)據(jù)行動(dòng)內(nèi)容,包括在線發(fā)布信息、公開政府支出、提高信息質(zhì)量、共享開放經(jīng)驗(yàn)等;2010年發(fā)布的《13556號(hào)總統(tǒng)令》為敏感但非涉密信息創(chuàng)建開放、標(biāo)準(zhǔn)的系統(tǒng),避免過度隱瞞;2012年發(fā)布的《數(shù)字政府:建設(shè)21世紀(jì)更好服務(wù)美國(guó)人民的信息平臺(tái)》提出電子政府的戰(zhàn)略目標(biāo):數(shù)據(jù)服務(wù)概念模型,以信息為中心、以用戶為中心的戰(zhàn)略舉措。英國(guó)2011年發(fā)布《國(guó)家數(shù)據(jù)開放行動(dòng)方案》,提出集中開放數(shù)據(jù);2012年發(fā)布《英國(guó)政府?dāng)?shù)字化戰(zhàn)略》,要求推動(dòng)數(shù)字化服務(wù),提高政府服務(wù)水平;2013年發(fā)布《英國(guó)數(shù)據(jù)能力發(fā)展戰(zhàn)略規(guī)劃》,強(qiáng)調(diào)重視數(shù)據(jù)安全和隱私保護(hù),完善開放數(shù)據(jù)相關(guān)法律和制度。[11]
平臺(tái)層對(duì)數(shù)據(jù)層所提供數(shù)據(jù)集的進(jìn)一步加工,并通過數(shù)據(jù)關(guān)聯(lián)、更新、清理、保存和歸檔等數(shù)據(jù)集維護(hù)方式為服務(wù)層提供服務(wù)。
2.2.1 數(shù)據(jù)發(fā)布
數(shù)據(jù)發(fā)布是指將數(shù)據(jù)層產(chǎn)生的數(shù)據(jù)集發(fā)布到平臺(tái)上以供用戶訪問使用。政府部門持有很多能為企業(yè)發(fā)展、社會(huì)創(chuàng)新、科學(xué)知識(shí)增長(zhǎng)提供動(dòng)力的數(shù)據(jù),與公眾共享的數(shù)據(jù)越多,開放數(shù)據(jù)創(chuàng)造價(jià)值的潛力就越大。政府開放數(shù)據(jù)的發(fā)布方法有很多,包括技術(shù)途徑和組織途徑。[6]技術(shù)途徑依賴于現(xiàn)有的技術(shù)水平,包括數(shù)據(jù)發(fā)布格式、數(shù)據(jù)獲取方法、數(shù)據(jù)鏈接等。關(guān)聯(lián)開放數(shù)據(jù)五星模式是目前技術(shù)方面數(shù)據(jù)發(fā)布的指南,[6]星級(jí)越高,發(fā)布的數(shù)據(jù)格式越豐富,數(shù)據(jù)越便于用戶使用。目前,美國(guó)、英國(guó)和澳大利亞等國(guó)已基本達(dá)到四星模式,使用RDF、URI等格式和技術(shù),提升數(shù)據(jù)之間的關(guān)聯(lián)性。組織途徑強(qiáng)調(diào)數(shù)據(jù)被提供給用戶的方式,而不僅僅是數(shù)據(jù)的發(fā)布格式,分為直接提供和間接提供。直接提供是指平臺(tái)聚集所有部門的數(shù)據(jù)進(jìn)行統(tǒng)一發(fā)布;間接提供是指平臺(tái)僅提供實(shí)際數(shù)據(jù)的目錄鏈接。美國(guó)開放數(shù)據(jù)平臺(tái)主要采用直接提供的方式,用戶可以直接在平臺(tái)上訪問、下載各部門提供的數(shù)據(jù)集,這種方式方便用戶直接訪問,但存在數(shù)據(jù)更新滯后的缺點(diǎn),時(shí)效性較差。英國(guó)開放數(shù)據(jù)平臺(tái)主要采用間接提供的方式,平臺(tái)上僅提供每條數(shù)據(jù)集的簡(jiǎn)單介紹,如標(biāo)題、來源、主題、更新時(shí)間等,而原始數(shù)據(jù)集的訪問獲取則需要鏈接到數(shù)據(jù)提供者的網(wǎng)站,這種方式可以較好地保證數(shù)據(jù)集的時(shí)效性,但不便于用戶直接訪問數(shù)據(jù)集。
2.2.2 數(shù)據(jù)關(guān)聯(lián)
不同政府部門發(fā)布的數(shù)據(jù)集并不是完全獨(dú)立的,它們之間存在著錯(cuò)綜復(fù)雜的關(guān)系,而且開放數(shù)據(jù)具有不涉及授權(quán)、隱私和使用限制等特點(diǎn)。將發(fā)布的數(shù)據(jù)進(jìn)行關(guān)聯(lián),將會(huì)產(chǎn)生更多有價(jià)值的信息。
數(shù)據(jù)關(guān)聯(lián)的目標(biāo)是形成一個(gè)類似于互聯(lián)網(wǎng)的數(shù)據(jù)網(wǎng)(WebofData)。理想情況下,開放數(shù)據(jù)可通過開放許可協(xié)議以結(jié)構(gòu)化、非專有化的格式在線獲取,并可以通過URI鏈接到其他數(shù)據(jù)。美國(guó)率先使用數(shù)據(jù)關(guān)聯(lián)技術(shù)實(shí)現(xiàn)對(duì)平臺(tái)數(shù)據(jù)的管理,英國(guó)也已經(jīng)開始嘗試把數(shù)據(jù)發(fā)布為關(guān)聯(lián)數(shù)據(jù),以便于數(shù)據(jù)之間的連接與整合。從技術(shù)角度看,應(yīng)用語義網(wǎng)是未來開放數(shù)據(jù)平臺(tái)的發(fā)展方向之一,美國(guó)、英國(guó)等國(guó)家在數(shù)據(jù)組織方面使用了RDF、URI等格式和技術(shù),提升了數(shù)據(jù)的關(guān)聯(lián)性和有效性。數(shù)據(jù)開放是一個(gè)動(dòng)態(tài)過程,數(shù)據(jù)的更新、清理、補(bǔ)充等都可能導(dǎo)致已建立的關(guān)聯(lián)關(guān)系失效,如斷鏈、死鏈、錯(cuò)鏈等。因此,需要及時(shí)對(duì)關(guān)聯(lián)關(guān)系進(jìn)行維護(hù),可以采用基于協(xié)議、基于更新通知或基于主動(dòng)監(jiān)測(cè)機(jī)制的動(dòng)態(tài)鏈接維護(hù)等方法,[12]保證關(guān)聯(lián)關(guān)系的有效性和準(zhǔn)確性。
2.2.3 數(shù)據(jù)管理
數(shù)據(jù)管理包括數(shù)據(jù)更新、數(shù)據(jù)清理、數(shù)據(jù)歸檔與保存等,貫穿于整個(gè)開放數(shù)據(jù)生命周期,在確保發(fā)布數(shù)據(jù)的可持續(xù)方面至關(guān)重要。
政府部門和公共領(lǐng)域每天都會(huì)產(chǎn)生大量的數(shù)據(jù),及時(shí)對(duì)平臺(tái)數(shù)據(jù)進(jìn)行更新、按需補(bǔ)充,對(duì)保證平臺(tái)具有持續(xù)活力、吸引公眾使用數(shù)據(jù)具有重要意義。數(shù)據(jù)清理是指剔除平臺(tái)上的低質(zhì)量數(shù)據(jù)。數(shù)據(jù)質(zhì)量主要取決于數(shù)據(jù)的準(zhǔn)確性、完整性、時(shí)效性等,當(dāng)?shù)唾|(zhì)量的數(shù)據(jù)發(fā)布為開放數(shù)據(jù)時(shí),用戶需要付出額外的成本(人力、物力、財(cái)力等)來提高數(shù)據(jù)質(zhì)量,這是一種資源的浪費(fèi)。數(shù)據(jù)歸檔是指對(duì)未來可能用到的舊數(shù)據(jù)以及按法規(guī)要求必須保留的數(shù)據(jù)進(jìn)行歸檔處理。我國(guó)目前的歸檔范圍一般都是文件、圖紙等,尚沒有專門針對(duì)政府開放數(shù)據(jù)的歸檔管理。數(shù)據(jù)保存隨著平臺(tái)上開放數(shù)據(jù)數(shù)量的增多成為極其重要的問題。從全球來看,政府?dāng)?shù)據(jù)通常保存在開放數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)中,PDF是最常使用的數(shù)據(jù)集格式,但PDF文件無法修改,限制了用戶的訪問使用。
服務(wù)層由數(shù)據(jù)檢索、數(shù)據(jù)開發(fā)和數(shù)據(jù)互動(dòng)三個(gè)階段組成,它與用戶直接進(jìn)行交互,并將意見建議等反饋給數(shù)據(jù)層和平臺(tái)層,形成一個(gè)良性循環(huán)。數(shù)據(jù)檢索關(guān)系到平臺(tái)數(shù)據(jù)的可訪問性,包括檢索途徑和檢索結(jié)果的呈現(xiàn);數(shù)據(jù)開發(fā)是實(shí)現(xiàn)數(shù)據(jù)增值利用的有效方式,具有巨大的潛在社會(huì)效益;數(shù)據(jù)互動(dòng)可以提高公眾對(duì)開放數(shù)據(jù)的存在性認(rèn)知,對(duì)政府?dāng)?shù)據(jù)開放有促進(jìn)和監(jiān)督作用。
2.3.1 數(shù)據(jù)檢索
現(xiàn)有的檢索方式主要有關(guān)鍵詞檢索、分類檢索、字段限制檢索和可視化檢索。關(guān)鍵詞檢索是最通用的檢索方式,目前國(guó)內(nèi)外的開放數(shù)據(jù)平臺(tái)都能實(shí)現(xiàn)。分類檢索可以更直觀地對(duì)數(shù)據(jù)集進(jìn)行主題瀏覽,分類檢索效果因人而異,與用戶個(gè)人的知識(shí)結(jié)構(gòu)和信息素養(yǎng)密切相關(guān)。在字段限制檢索方面,美國(guó)、英國(guó)等支持該檢索方式,檢索字段包括標(biāo)題、組織機(jī)構(gòu)、數(shù)據(jù)格式、許可id、數(shù)據(jù)創(chuàng)建和更新時(shí)間等。可視化檢索,又叫作地圖檢索,是指根據(jù)地理空間區(qū)域進(jìn)行檢索的方式。檢索結(jié)果呈現(xiàn)方式影響用戶對(duì)數(shù)據(jù)集的使用體驗(yàn),目前國(guó)內(nèi)外平臺(tái)的檢索結(jié)果呈現(xiàn)方式包括數(shù)據(jù)顯示字段、數(shù)據(jù)篩選字段、數(shù)據(jù)排序方式等。國(guó)內(nèi)平臺(tái)提供的數(shù)據(jù)顯示字段與美國(guó)、英國(guó)等發(fā)達(dá)國(guó)家基本相同,包括每條檢索記錄的題名、簡(jiǎn)介、數(shù)據(jù)格式、發(fā)布機(jī)構(gòu)等;但國(guó)外平臺(tái)提供的數(shù)據(jù)篩選字段較為豐富,包括主題、標(biāo)簽、數(shù)據(jù)格式、發(fā)布機(jī)構(gòu)、綜合得分等。美國(guó)、英國(guó)和澳大利亞均提供按相關(guān)度、更新時(shí)間、瀏覽下載次數(shù)和熱度等排序方式。國(guó)內(nèi)提供的方式較為單一,不同地方政府開放數(shù)據(jù)平臺(tái)之間差異較大。
2.3.2 數(shù)據(jù)開發(fā)
數(shù)據(jù)開發(fā)的最終目的是為公民生活提供便利,實(shí)現(xiàn)政治、經(jīng)濟(jì)和社會(huì)價(jià)值。如,由美國(guó)氣象局、美國(guó)航空航天局和美國(guó)地質(zhì)調(diào)查局提供的數(shù)據(jù)而開發(fā)的應(yīng)用程序“Climate”,能夠及時(shí)提供氣候、田野作業(yè)以及農(nóng)作物生長(zhǎng)方面的信息,幫助農(nóng)民做出最優(yōu)決策,提高勞動(dòng)效率并增加利潤(rùn)。盡管開放政府?dāng)?shù)據(jù)強(qiáng)調(diào)公眾的參與,但大部分使用平臺(tái)上原始數(shù)據(jù)的用戶是專業(yè)的數(shù)據(jù)分析師或應(yīng)用程序開發(fā)人員,這就需要平臺(tái)提供數(shù)據(jù)集的API應(yīng)用程序接口、源代碼以及一些分析工具,為用戶的數(shù)據(jù)利用與再開發(fā)提供技術(shù)基礎(chǔ)。此外,通過跟蹤應(yīng)用程序的用戶訪問量、下載量等數(shù)據(jù),可以了解公眾對(duì)數(shù)據(jù)類型、質(zhì)量、使用方面的偏好,調(diào)整數(shù)據(jù)開放重點(diǎn)和應(yīng)用開發(fā)方向,提高政府執(zhí)行力和透明度,真正做到以人為本,為人民服務(wù)。
2.3.3 數(shù)據(jù)互動(dòng)
數(shù)據(jù)互動(dòng)包括交流反饋、信息分享、信息定制等,可以有效提高用戶對(duì)數(shù)據(jù)存在性的認(rèn)知,激發(fā)其使用數(shù)據(jù)的積極性,從而形成良性循環(huán),使政府?dāng)?shù)據(jù)最大限度的發(fā)揮價(jià)值。美國(guó)、英國(guó)和澳大利亞等國(guó)家的開放數(shù)據(jù)平臺(tái)提供的數(shù)據(jù)互動(dòng)方式具體有在線提交評(píng)論、請(qǐng)求數(shù)據(jù)集和網(wǎng)絡(luò)應(yīng)用、對(duì)數(shù)據(jù)集進(jìn)行評(píng)價(jià)等。此外,還允許用戶將信息分享到Y(jié)ouTube、Facebook、Twitter等網(wǎng)絡(luò)平臺(tái),而且提供RSS定制服務(wù)。用戶還可以使用常用的社交網(wǎng)絡(luò)工具賬號(hào)登錄,實(shí)現(xiàn)平臺(tái)與用戶社交網(wǎng)絡(luò)的融合。
伴隨大數(shù)據(jù)時(shí)代的來臨以及全球政府?dāng)?shù)據(jù)開放運(yùn)動(dòng)的推進(jìn),上海市政府?dāng)?shù)據(jù)服務(wù)網(wǎng)作為國(guó)內(nèi)建設(shè)相對(duì)較早、較完善的政府?dāng)?shù)據(jù)開放平臺(tái),對(duì)我國(guó)地方政府?dāng)?shù)據(jù)平臺(tái)建設(shè)具有重要的指導(dǎo)和借鑒作用。因此,筆者對(duì)上海市政府?dāng)?shù)據(jù)開放平臺(tái)進(jìn)行實(shí)證研究,驗(yàn)證本文提出的基于數(shù)據(jù)生命周期的數(shù)據(jù)開放平臺(tái)構(gòu)建框架。2012年上海市政府?dāng)?shù)據(jù)服務(wù)網(wǎng)正式投入使用,由上海市人民政府辦公廳、上海市經(jīng)濟(jì)和信息化委員會(huì)牽頭,相關(guān)政府部門共同參與建設(shè),向社會(huì)提供政府?dāng)?shù)據(jù)的瀏覽、查詢、下載等基本服務(wù),以及基于政府?dāng)?shù)據(jù)開發(fā)的應(yīng)用程序等增值服務(wù),其目標(biāo)是促進(jìn)政府?dāng)?shù)據(jù)資源的增值利用。本研究主要通過上海市政府?dāng)?shù)據(jù)服務(wù)網(wǎng)、學(xué)術(shù)論文、網(wǎng)絡(luò)、各政府部門網(wǎng)站等獲取相關(guān)數(shù)據(jù)。
數(shù)據(jù)層是政府?dāng)?shù)據(jù)開放平臺(tái)提供服務(wù)的基礎(chǔ),上海市政府?dāng)?shù)據(jù)服務(wù)網(wǎng)中的數(shù)據(jù)由發(fā)改委、公安局、食藥監(jiān)、法制辦等43個(gè)部門創(chuàng)建,數(shù)據(jù)涉及經(jīng)濟(jì)建設(shè)、資源環(huán)境、教育科技、道路交通等12個(gè)領(lǐng)域,數(shù)據(jù)來源可追溯。元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),使信息描述規(guī)范化,可以促進(jìn)數(shù)據(jù)集的高效利用。上海數(shù)據(jù)開放平臺(tái)上的元數(shù)據(jù)描述字段包括摘要、應(yīng)用場(chǎng)景、關(guān)鍵字、數(shù)據(jù)領(lǐng)域、國(guó)家主題分類、部門主題分類、公開屬性、更新頻率、首次發(fā)布日期、更新日期、數(shù)據(jù)提供方單位、訪問/下載次數(shù)12個(gè)基本字段。此外,某些記錄根據(jù)需要設(shè)置有參數(shù)說明、返回值說明等可選字段。平臺(tái)上開放的數(shù)據(jù)都是剔除涉及個(gè)人隱私、知識(shí)產(chǎn)權(quán)和國(guó)家安全的數(shù)據(jù)。由于缺乏政府?dāng)?shù)據(jù)開放方面的法律法規(guī),因此在數(shù)據(jù)篩選過程中依據(jù)的主要是政府信息公開的政策規(guī)定,如《關(guān)于加強(qiáng)信息資源開發(fā)利用工作的若干意見》《關(guān)于推進(jìn)公共資源配置領(lǐng)域政府信息公開的意見》等。
上海市政府?dāng)?shù)據(jù)開放平臺(tái)上各數(shù)據(jù)集提供單位都有各自的數(shù)據(jù)集發(fā)布入口,可以登記、發(fā)布、更新、修改其數(shù)據(jù),采用的發(fā)布方式是直接提供方式,即用戶可以直接在平臺(tái)上訪問、下載各部門提供的數(shù)據(jù)集,而無需鏈接到提供數(shù)據(jù)的官方部門網(wǎng)站。上海市政府?dāng)?shù)據(jù)服務(wù)網(wǎng)尚未發(fā)布關(guān)聯(lián)數(shù)據(jù),目前發(fā)布的數(shù)據(jù)格式包括XLS、XLSX、CSV三種。在數(shù)據(jù)更新方面,平臺(tái)上經(jīng)濟(jì)建設(shè)、機(jī)構(gòu)團(tuán)體、城市建設(shè)、資源環(huán)境、教育科技、道路交通、社會(huì)發(fā)展、公共安全、衛(wèi)生健康、民生服務(wù)領(lǐng)域數(shù)據(jù)大多按年更新,信用服務(wù)和文化休閑領(lǐng)域的數(shù)據(jù)大多按月更新,僅有極少部分?jǐn)?shù)據(jù)是按日更新。在數(shù)據(jù)歸檔方面,上海市數(shù)據(jù)開放平臺(tái)的歸檔范圍一般都是文件、圖紙等,尚沒有專門針對(duì)政府開放數(shù)據(jù)的歸檔管理。
服務(wù)層與用戶進(jìn)行直接交互,提供數(shù)據(jù)檢索、移動(dòng)應(yīng)用、數(shù)據(jù)互動(dòng)等服務(wù)。上海市政府?dāng)?shù)據(jù)服務(wù)網(wǎng)提供3種檢索方式:關(guān)鍵詞檢索、分類檢索和可視化檢索。關(guān)鍵詞檢索方式可以使用布爾邏輯AND、OR、NOT檢索技術(shù);分類檢索主要提供了三種分類方法,可以按照數(shù)據(jù)領(lǐng)域、提供機(jī)構(gòu)、綜合評(píng)價(jià)進(jìn)行檢索;可視化檢索主要用于地理信息板塊。檢索結(jié)果呈現(xiàn)方式部分,上海市政府?dāng)?shù)據(jù)開放平臺(tái)可以對(duì)檢索結(jié)果按下載次數(shù)、綜合得分、更新時(shí)間、瀏覽次數(shù)、名稱進(jìn)行升降排序;數(shù)據(jù)篩選字段包括資源類型、數(shù)據(jù)領(lǐng)域、數(shù)據(jù)提供單位、綜合得分;數(shù)據(jù)顯示字段包括查看次數(shù)、下載次數(shù)、綜合評(píng)價(jià)和數(shù)據(jù)集摘要。利用平臺(tái)開放數(shù)據(jù)開發(fā)的應(yīng)用程序是連接政府?dāng)?shù)據(jù)與普通公眾的橋梁,為公民生活提供了便利。目前,上海市政府?dāng)?shù)據(jù)開放平臺(tái)上總共有38個(gè)移動(dòng)應(yīng)用,其中訪問量排名前三的應(yīng)用為“阿拉自來水”“樂行上?!薄肮舱衅妇W(wǎng)”,分別屬于資源環(huán)境、道路交通和社會(huì)發(fā)展主題領(lǐng)域。上海市數(shù)據(jù)開放平臺(tái)的數(shù)據(jù)互動(dòng)板塊包括最新消息、調(diào)查問卷、需求調(diào)查、聯(lián)系我們、開放者社區(qū)、用戶幫助六個(gè),允許用戶提出請(qǐng)求、進(jìn)行評(píng)論、學(xué)習(xí)交流、意見反饋等。
首先,應(yīng)加強(qiáng)數(shù)據(jù)資源建設(shè)。從數(shù)量上,與國(guó)外相比,我國(guó)開放數(shù)據(jù)平臺(tái)存在數(shù)據(jù)量少、參與部門少等問題,政府?dāng)?shù)據(jù)開放力度有待進(jìn)一步加強(qiáng),另外還存在從政府視角出發(fā)盲目開放數(shù)據(jù)的現(xiàn)象。因此,應(yīng)該更多地從用戶需求出發(fā)開放數(shù)據(jù),實(shí)現(xiàn)從供應(yīng)驅(qū)動(dòng)到需求驅(qū)動(dòng)的轉(zhuǎn)化。從質(zhì)量上,應(yīng)明確數(shù)據(jù)來源,由數(shù)據(jù)提供部門負(fù)責(zé)數(shù)據(jù)的更新維護(hù),從源頭上保證開放數(shù)據(jù)的質(zhì)量,還應(yīng)建立開放數(shù)據(jù)描述標(biāo)準(zhǔn),規(guī)范開放數(shù)據(jù)的字段設(shè)置,增加可擴(kuò)充字段描述,以提升元數(shù)據(jù)的規(guī)范性、完整性和可擴(kuò)充性。
其次,應(yīng)加快制定數(shù)據(jù)開放相關(guān)法律法規(guī)。政策缺位是導(dǎo)致我國(guó)政府?dāng)?shù)據(jù)開放程度不高、統(tǒng)一開放數(shù)據(jù)平臺(tái)建設(shè)緩慢的重要因素。由于缺乏明確的政策法規(guī),部分政府機(jī)構(gòu)以保守的策略來應(yīng)對(duì)國(guó)家層面的數(shù)據(jù)開放與共享,不開放或盡量少開放數(shù)據(jù),造成數(shù)據(jù)量少、數(shù)據(jù)質(zhì)量低、數(shù)據(jù)可用性不強(qiáng)等問題。而且,由于缺乏相關(guān)法規(guī)對(duì)政府?dāng)?shù)據(jù)歸屬權(quán)的明確規(guī)定,政府部門壟斷數(shù)據(jù)資源,形成部門間數(shù)據(jù)壁壘,出現(xiàn)“信息孤島”和“信息煙囪”等不利局面,嚴(yán)重制約政府效能提升。因此,國(guó)家應(yīng)盡快制定與數(shù)據(jù)開放相關(guān)的法律法規(guī),對(duì)涉及數(shù)據(jù)開放各環(huán)節(jié)的政策和法規(guī)進(jìn)行系統(tǒng)性思考,明確各部門應(yīng)開放的數(shù)據(jù),打破部門壁壘,實(shí)現(xiàn)深層次數(shù)據(jù)共享。
(1)平臺(tái)應(yīng)提供豐富的資源格式。數(shù)據(jù)格式直接影響數(shù)據(jù)集的開放利用價(jià)值,美國(guó)開放數(shù)據(jù)平臺(tái)上提供的數(shù)據(jù)格式包括PDF、XML、CSV、RDF等49種,而我國(guó)多數(shù)開放數(shù)據(jù)平臺(tái)只提供PDF、XSL、DOC等格式。平臺(tái)應(yīng)提供多樣化的數(shù)據(jù)格式和呈現(xiàn)方式,可以設(shè)置選項(xiàng),提供相關(guān)數(shù)據(jù)集的多種可視化組合,以易理解的方式呈現(xiàn)數(shù)據(jù),從而方便用戶發(fā)現(xiàn)潛在的數(shù)據(jù)價(jià)值。
(2)使用直接提供和間接提供相結(jié)合的數(shù)據(jù)發(fā)布方式。直接提供和間接提供各有利弊,我國(guó)平臺(tái)在建設(shè)過程中應(yīng)結(jié)合實(shí)際情況,靈活使用兩種數(shù)據(jù)發(fā)布方式。對(duì)時(shí)效性要求較高的數(shù)據(jù)集可以使用間接提供方式,便于數(shù)據(jù)提供部門對(duì)數(shù)據(jù)集進(jìn)行及時(shí)更新;而對(duì)易用性要求較高的數(shù)據(jù)集,可以采用直接提供的方式,由統(tǒng)一平臺(tái)負(fù)責(zé)數(shù)據(jù)集的發(fā)布,方便用戶直接訪問使用。
(3)盡可能發(fā)布關(guān)聯(lián)數(shù)據(jù)。單一孤立的數(shù)據(jù)集,其價(jià)值是有限的。如果將數(shù)據(jù)集發(fā)布為關(guān)聯(lián)數(shù)據(jù),建立這些數(shù)據(jù)集之間的相互關(guān)系,將有助于實(shí)現(xiàn)平臺(tái)上數(shù)據(jù)資源之間的相互參考、數(shù)據(jù)創(chuàng)新、綜合開發(fā)和有效利用,創(chuàng)造更多的價(jià)值。
(4)提升數(shù)據(jù)管理水平。我國(guó)政府開放數(shù)據(jù)平臺(tái)上數(shù)據(jù)集的更新存在嚴(yán)重的滯后性,大部分地方政府的開放數(shù)據(jù)都是不定時(shí)更新或者按需更新,因此,平臺(tái)應(yīng)及時(shí)更新數(shù)據(jù),提高數(shù)據(jù)的時(shí)效性。此外,在數(shù)據(jù)歸檔保存方面,我國(guó)有必要研究和建立國(guó)家層面的數(shù)據(jù)歸檔保存政策,并設(shè)立專門的機(jī)構(gòu),利用先進(jìn)的科學(xué)技術(shù)來歸檔保存數(shù)據(jù)。
(1)完善數(shù)據(jù)檢索服務(wù)。豐富數(shù)據(jù)檢索方式,增加字段限制檢索;在主題分類方面,國(guó)家應(yīng)在調(diào)研用戶主題瀏覽習(xí)慣的基礎(chǔ)上,依據(jù)人們對(duì)事物分類的共同認(rèn)識(shí),設(shè)置科學(xué)合理的主題類目分類體系;借鑒國(guó)外先進(jìn)經(jīng)驗(yàn),提供多個(gè)數(shù)據(jù)顯示、篩選字段,豐富數(shù)據(jù)排序方式,為用戶提供多種數(shù)據(jù)呈現(xiàn)方式。
(2)舉辦競(jìng)賽活動(dòng)鼓勵(lì)數(shù)據(jù)開發(fā)。通過舉辦不同形式的競(jìng)賽活動(dòng)吸引公眾了解并參與到政府開放數(shù)據(jù)的建設(shè)過程中。我們可以借鑒紐約市經(jīng)濟(jì)發(fā)展公司,通過主辦“BigApp”挑戰(zhàn),鼓勵(lì)公眾使用、重用和傳播開放數(shù)據(jù),開發(fā)APP應(yīng)用,促進(jìn)原始數(shù)據(jù)的增值利用,創(chuàng)造社會(huì)效益。還可以舉辦以問題為導(dǎo)向的“Big Idea”挑戰(zhàn),鼓勵(lì)公眾參與城市創(chuàng)新,解決城市生活中的各種問題,為提高城市生活質(zhì)量做出貢獻(xiàn)。
(3)豐富互動(dòng)交流方式。在政府開放數(shù)據(jù)平臺(tái)建設(shè)過程中要豐富與公眾互動(dòng)交流的方式,如設(shè)置討論區(qū)、論壇等,并允許用戶將數(shù)據(jù)集分享至微博、微信等網(wǎng)絡(luò)平臺(tái),用戶可以利用社交工具賬號(hào)登錄,方便獲取數(shù)據(jù)。在服務(wù)內(nèi)容方面,提供信息定制服務(wù),如RSS訂閱服務(wù)等。同時(shí),政府應(yīng)該通過在平臺(tái)上開設(shè)虛擬社區(qū)等方式,及時(shí)獲取公眾提出的數(shù)據(jù)集請(qǐng)求及反饋意見;在服務(wù)對(duì)象方面,政府應(yīng)提供分類服務(wù)。平臺(tái)上的用戶不僅包括政府人員和普通公眾,還包括技術(shù)人員、數(shù)據(jù)分析公司等,他們有時(shí)需要獲取數(shù)據(jù)的源代碼,通過分析整合等方式來提供產(chǎn)品或服務(wù)。因此,平臺(tái)應(yīng)評(píng)估不同利益相關(guān)方對(duì)數(shù)據(jù)的不同使用方式,為不同用戶提供更有針對(duì)性的數(shù)據(jù)集,滿足個(gè)性化需求,推動(dòng)政府?dāng)?shù)據(jù)開放的可持續(xù)性。