梁發(fā)宏,楊 帆
(西安測繪總站,陜西 西安710054)
在Web 2.0的大環(huán)境下,隨著衛(wèi)星定位技術(shù)和移動終端技術(shù)的發(fā)展,地理信息傳遞和服務(wù)的模式經(jīng)歷著深刻的變化。網(wǎng)絡(luò)用戶不僅被動地消費(fèi)信息,也開始自己創(chuàng)建或編輯網(wǎng)頁內(nèi)容。相應(yīng)的一些項(xiàng)目蓬勃發(fā)展,用戶數(shù)量顯著增加,如維基百科、Flickr、YouTube等。
通用數(shù)據(jù)貢獻(xiàn)常常被稱為用戶生成內(nèi)容(usergenerated content,UGC),如維基百科條目或博客文章。UGC中有一種包含地理組件的特例,被稱為眾源地理數(shù)據(jù)[2]或協(xié)同地理信息[3],更常見的名稱為自發(fā)地理信息(volunteered geographic information,VGI)[1]。筆者以O(shè)penStreetMap為例,側(cè)重于數(shù)據(jù)及貢獻(xiàn)者分析的方法和結(jié)論,介紹了協(xié)作收集地理數(shù)據(jù)和相應(yīng)的貢獻(xiàn)者模式,全面回顧了VGI研究的現(xiàn)有成果,并展望其前景,指出需要解決的問題。
自發(fā)地理信息由Goodchild[1]在2007年提出,他認(rèn)為VGI是指使用工具創(chuàng)建、收集、傳播個人自發(fā)提供的地理信息。目前關(guān)于VGI還沒有形成一個統(tǒng)一的定義。維基百科中對VGI的定義是指用戶通過在線協(xié)作的方式,以普通手持GPS終端、開放獲取的高分辨率遙感影像,以及個人空間認(rèn)知的地理知識為基礎(chǔ)參考,創(chuàng)建、編輯、管理、維護(hù)的地理信息。李德仁等[4]從廣義和狹義兩個角度對VGI進(jìn)行了解釋,認(rèn)為狹義的VGI是由大量非專業(yè)用戶利用3S技術(shù)自發(fā)創(chuàng)建的地理信息;廣義的VGI是與狹義的VGI相關(guān)的概念、模式、方法和技術(shù)。
筆者認(rèn)為VGI的主要特征為:①向VGI平臺貢獻(xiàn)的信息必須匹配地理位置,地理位置既可以通過地理參考航空影像跟蹤采集,也可以通過指定設(shè)備主動收集GPS軌跡來獲取;②數(shù)據(jù)收集具有公眾自發(fā)性和非專業(yè)性,沒有專業(yè)技能的用戶也可以基于個人目的貢獻(xiàn)地理信息,協(xié)作完成空間數(shù)據(jù)處理。
近年來VGI急速發(fā)展,表1中列出了5種不同的VGI項(xiàng)目的比較,比較不包括一些廣泛使用的LBS平臺,如谷歌地圖,因?yàn)槠銿GI功能有限。VGI項(xiàng)目之間的主要區(qū)別在于數(shù)據(jù)許可證類型和信息可用性。
表1 VGI項(xiàng)目比較
OSM項(xiàng)目于2004年啟動,主要數(shù)據(jù)庫和網(wǎng)絡(luò)服務(wù)托管在倫敦大學(xué)的多個服務(wù)器。所有創(chuàng)建和共享OSM數(shù)據(jù)的服務(wù)器和接口主要由志愿者開發(fā)和管理。該項(xiàng)目的主要目標(biāo)是建立一個免費(fèi)的全球地理信息數(shù)據(jù)庫。貢獻(xiàn)數(shù)據(jù)前必須注冊并創(chuàng)建一個賬戶。新注冊的會員在注冊后就可以立即添加、修改或刪除OSM數(shù)據(jù)庫中的地理對象。而對于其他VGI項(xiàng)目,如Google Map Maker,新會員所作的編輯首先要通過審查。最初幾年,OSM地理信息收集大多是應(yīng)用GPS手持設(shè)備。2007—2011年間,雅虎地圖、微軟Bing Map均對其進(jìn)行影像數(shù)據(jù)支持,這對OSM新對象的收集有很大的影響。此外,一些地區(qū)通過導(dǎo)入商業(yè)或政府?dāng)?shù)據(jù)集獲取了大量數(shù)據(jù),如荷蘭、奧地利、美國、西班牙和法國。近年來,隨著OSM項(xiàng)目的蓬勃發(fā)展,一些公司全部或部分地將其地圖應(yīng)用轉(zhuǎn)換為OSM,如蘋果、Flickr和foursquare。
(1)路網(wǎng)評估
OSM質(zhì)量分析多為道路網(wǎng)絡(luò)評價,多數(shù)是將政府或商業(yè)數(shù)據(jù)集作為參考數(shù)據(jù)進(jìn)行對比。2008年Haklay[5]將英國的OSM數(shù)據(jù)與軍械測量局(OS)的數(shù)據(jù)集進(jìn)行了比較。結(jié)果表明,OSM覆蓋英國面積的29.3%。2009年重復(fù)了這項(xiàng)分析,覆蓋范圍提高到65%[6]。OSM在英國的數(shù)據(jù)質(zhì)量和覆蓋率顯示出明顯的區(qū)域差異,城市地區(qū)路網(wǎng)密度高,但缺少街道名稱等細(xì)節(jié),而有些農(nóng)村地區(qū)完全沒有數(shù)據(jù)。Girres等[7]對法國進(jìn)行了研究,重點(diǎn)為路網(wǎng),也包含其他要素,如興趣點(diǎn)、水系和海岸線。該研究表明,法國OSM數(shù)據(jù)集也具有類似的區(qū)域差異。對德國2007—2011年OSM數(shù)據(jù)集的綜合分析[8]表明,如果比較機(jī)動車路網(wǎng),OSM比專有數(shù)據(jù)少9%;如果包括人行道和小路時,OSM超過專有數(shù)據(jù)集27%,但專有數(shù)據(jù)集中包含的其他重要信息,如轉(zhuǎn)彎限制,在OSM數(shù)據(jù)集中常常缺失。
2011年,Zielstra等[9]將整個佛羅里達(dá)州(美國)OSM數(shù)據(jù)集與TomTom和Navteq的專有數(shù)據(jù)進(jìn)行了比較。與之前在歐洲的發(fā)現(xiàn)不同,在佛羅里達(dá)州農(nóng)村地區(qū),OSM具有較強(qiáng)的覆蓋,而在城市地區(qū)也比專有數(shù)據(jù)表現(xiàn)出更好的覆蓋。研究人員認(rèn)為這是由于2008/2009年美國TIGER/Line普查數(shù)據(jù)導(dǎo)入了OSM。
總體來看,OSM路網(wǎng)數(shù)據(jù)在不同區(qū)域質(zhì)量差別較大,城市優(yōu)于農(nóng)村,局部地區(qū)數(shù)據(jù)非常詳細(xì)。是否應(yīng)該使用OSM或其他VGI資源,需要針對興趣區(qū)域和項(xiàng)目目標(biāo)進(jìn)行評估。
(2)興趣點(diǎn)(POI)評估
導(dǎo)航過程中,將描述地點(diǎn)的地址或文本準(zhǔn)確轉(zhuǎn)換為一個地理位置非常重要,這個過程被稱為地理編碼。Amelunxen[10]將谷歌地圖的地理編碼功能與OSM進(jìn)行了比較,對于市政、街道、門牌號碼,OSM都沒有達(dá)到足夠的詳細(xì)程度來支持空間分析。Jackson等[11]將OSM與其他專有數(shù)據(jù)集的點(diǎn)要素地址信息比較,顯示出類似的結(jié)果。Mashhadi等[12]對倫敦(英國)和羅馬(意大利)來自專有數(shù)據(jù)集的POI數(shù)據(jù)與OSM進(jìn)行了比較,發(fā)現(xiàn)在地理位置精度方面基本一致。
OSM中志愿者收集的非傳統(tǒng)興趣點(diǎn)與專有數(shù)據(jù)庫有差別,詳細(xì)程度不足,位置精度基本一致。
(3)數(shù)據(jù)信任和人為破壞
為了簡化數(shù)據(jù)評估,建立某種形式的信任機(jī)制非常必要。一些研究人員提出將志愿者作為一種質(zhì)量測量參數(shù)。Bishr等[13]探討了基于社交網(wǎng)絡(luò)信任評級的解決方案。Kessler等[14]基于貢獻(xiàn)對象的歷史來確定信任值。
OSM項(xiàng)目的普及也帶來了一些需要注意的問題,特別是人為破壞。Coleman[15]總結(jié)了如何驗(yàn)證貢獻(xiàn)者及其空間信息的一些方法,Neis等[16]自動檢測人為破壞,在OSM數(shù)據(jù)庫中每天至少檢測到一起人為破壞,有的是故意破壞,有的是操作失誤。
VGI研究的第二大方向是項(xiàng)目貢獻(xiàn)者行為,可以將用戶分為普通用戶(使用數(shù)據(jù)或在線信息)、注冊會員(擁有VGI項(xiàng)目賬戶)和貢獻(xiàn)者(積極為VGI項(xiàng)目做貢獻(xiàn))[24]。普通用戶數(shù)量基本無法確定,注冊會員和貢獻(xiàn)者數(shù)量可以從OSM數(shù)據(jù)庫確定或分析。
(1)參與不均衡
參與不均衡的現(xiàn)象在開源項(xiàng)目或以在線社區(qū)為基礎(chǔ)的項(xiàng)目中往往類似。Nielsen[17]以90-9-1規(guī)則描述了這種現(xiàn)象,即90%的用戶從來沒有對項(xiàng)目作出貢獻(xiàn),只是充當(dāng)“潛水者”,9%的貢獻(xiàn)者不定期地增加信息,1%的貢獻(xiàn)者提供了項(xiàng)目收集到的幾乎所有的信息。OSM也有類似現(xiàn)象[18-19]。
2010年,注冊會員人數(shù)增至30萬,其中近5%(16 500)按月積極為項(xiàng)目做貢獻(xiàn),所有成員中僅占3.5%(12 000)的會員貢獻(xiàn)了占98%的數(shù)據(jù)量[8]。圖1表示了注冊會員的增長及其活動,可以看出注冊會員與活躍貢獻(xiàn)者在數(shù)量上的巨大差異。
Neis等[18]進(jìn)行的研究還按周和日分析了貢獻(xiàn)者的活動。結(jié)論為平日貢獻(xiàn)模式相似,周日數(shù)據(jù)編輯的人數(shù)略多,而下午和晚上是OSM一天的活動高峰期。
(2)區(qū)域分布
OSM貢獻(xiàn)者的區(qū)域分布表現(xiàn)出與前述數(shù)據(jù)質(zhì)量分析類似的區(qū)域差異。因?yàn)镺SM會員在項(xiàng)目注冊時不必提供位置信息,研究人員通過不同的方法確定會員的區(qū)域。Budhathoki[19]分析了貢獻(xiàn)者為不同國家加入注釋的數(shù)目,Neis等[18]關(guān)注貢獻(xiàn)者首次編輯或編輯最多的區(qū)域。這兩項(xiàng)研究顯示貢獻(xiàn)者中3/4位于歐洲,剩下的1/4分布在北美和亞洲,南美、非洲和大洋洲只有少量貢獻(xiàn)者?;钴S貢獻(xiàn)者在德國密度最高,德國OSM數(shù)據(jù)集也表現(xiàn)出了較高質(zhì)量。然而,OSM貢獻(xiàn)者并不只限定在自身區(qū)域收集數(shù)據(jù),少數(shù)非?;钴S的OSM會員在至少兩個或更多的國家收集數(shù)據(jù)[18-19]。
圖1 2005—2015年OSM會員增長
(3)貢獻(xiàn)者動機(jī)、行為和人口因素
貢獻(xiàn)動機(jī)是研究人員調(diào)查的主要內(nèi)容。Budhathoki[19]認(rèn)為對特定區(qū)域的個體認(rèn)知是最顯著的動機(jī),當(dāng)用戶看到他們所關(guān)心的領(lǐng)域信息空白或錯誤,往往會利用自己擁有的知識編輯數(shù)據(jù)。Coleman等[20]將VGI激勵因素分為積極和消極兩類。表2總結(jié)了上述研究中主要動機(jī)。
表2 VGI激勵因素
過去許多研究指出,VGI主要的貢獻(xiàn)者是非專家或未經(jīng)訓(xùn)練和不合格的志愿者[5]。但是,有調(diào)查顯示近50%的受訪者有相關(guān)學(xué)位或曾在地理、測繪、城市規(guī)劃或計算機(jī)/信息科學(xué)等領(lǐng)域工作,說明OSM社區(qū)并不像經(jīng)常猜測的那樣只有GIS愛好者[19]。Coleman等[20]將VGI項(xiàng)目成員分為新手、業(yè)余興趣、專業(yè)人士、專業(yè)專家和權(quán)威專家等。
對貢獻(xiàn)者人口因素也有詳細(xì)的分析,如項(xiàng)目參與者的年齡、性別或教育背景。研究表明,大多數(shù)OSM貢獻(xiàn)者(97%以上)為男性[21]。對于其他門戶網(wǎng)站,數(shù)據(jù)并沒有顯示出這種性別偏向,但引入地理信息時女性參與率大幅下降[22]。OSM大多數(shù)貢獻(xiàn)者(>60%)在20~40歲之間,大約20%為40歲以上[21-22]。63%—78%有大專、本科及以上學(xué)歷[21-22]。
VGI的優(yōu)勢源于其開放式數(shù)據(jù)收集方法,可以說VGI是最廉價的地理信息來源,往往也是唯一的來源。尤其是對于世界范圍而言,其豐富的數(shù)據(jù)內(nèi)容和形式,是對現(xiàn)有地理信息數(shù)據(jù)的一個很好的補(bǔ)充和完善。
OSM和其他VGI項(xiàng)目的另一潛力是危機(jī)及災(zāi)害等應(yīng)急響應(yīng)行動中的輔助決策支持功能。2011年海地地震期間,志愿者基于OSM最新衛(wèi)星影像和移動GPS設(shè)備采集道路及興趣點(diǎn)數(shù)據(jù),標(biāo)注救護(hù)站、帳篷和倒塌的大橋,在48 h內(nèi)構(gòu)建了最 完 整 的“Haiti OpenStreetMap”[23]。VGI在洪災(zāi)損失評估[25]、野生消防疏散[26]和其他重要的風(fēng)險及自然災(zāi)害管理和響應(yīng)[27-29]等方面也已顯示出很多潛力。
地理監(jiān)測工作量大,現(xiàn)勢性要求高。VGI用戶分布廣泛,貢獻(xiàn)的數(shù)據(jù)類型多樣(矢量數(shù)據(jù)、圖片、視頻等),客觀性和現(xiàn)勢性強(qiáng),獲取周期短,成本低,未來的地理國情監(jiān)測完全可以借助VGI手段。
近年來涌現(xiàn)出許多基于OSM的應(yīng)用程序、在線地圖及可打印地圖,志愿者協(xié)同收集地理信息,滿足特殊需求,如貨車、自行車、滑雪、輪椅、盲道及公共交通。如Wheelmap共享公共場所輪椅無障礙信息,OpenRouteService提供自行車和貨車路徑查詢功能。
隨著三維應(yīng)用的日益普及,研究人員測試了OSM對三維應(yīng)用程序或三維基于位置服務(wù)的適用性[30],有文獻(xiàn)探討如何將OSM數(shù)據(jù)轉(zhuǎn)換到規(guī)范的城市地理標(biāo)記語言(CityGML)模型[31]或室內(nèi)疏散模擬[32]。
本文首先介紹了VGI的概念和特征,比較了有代表性的幾個VGI平臺,重點(diǎn)介紹了其中影響最大的OSM;接著全面回顧了VGI研究熱點(diǎn),研究工作分為兩個主要領(lǐng)域:數(shù)據(jù)質(zhì)量和貢獻(xiàn)者分析,詳細(xì)討論了每個領(lǐng)域的最新文獻(xiàn)中闡述的各項(xiàng)研究的方法和結(jié)果;最后展望了VGI的應(yīng)用前景。
VGI的發(fā)展很快,但也存在許多亟需解決的問題:數(shù)據(jù)質(zhì)量不可預(yù)測,數(shù)據(jù)分布不均,連續(xù)性和一致性不能保證;沒有嚴(yán)格的數(shù)據(jù)規(guī)范或質(zhì)量標(biāo)準(zhǔn),如何有效地進(jìn)行數(shù)據(jù)質(zhì)量控制需要進(jìn)一步研究;VGI數(shù)據(jù)來源多樣,類型復(fù)雜,數(shù)據(jù)量大,如何管理這樣的海量多源數(shù)據(jù),需要設(shè)計簡單、高效、擴(kuò)展能力強(qiáng)的數(shù)據(jù)管理方案;如何基于數(shù)據(jù)集中的現(xiàn)有對象導(dǎo)出其他類型的地理要素,或是通過多源數(shù)據(jù)融合集成并豐富當(dāng)前的數(shù)據(jù)集,未來的研究都可以詳細(xì)探討。VGI數(shù)據(jù)可能會涉及個人隱私、知識產(chǎn)權(quán)與國家安全,需要出臺和完善相應(yīng)的法律法規(guī),以保證數(shù)據(jù)安全。VGI的持續(xù)性依賴于志愿者,相關(guān)部門也需要制定政策鼓勵志愿者加入。
現(xiàn)有的VGI系統(tǒng)主要集中在西方發(fā)達(dá)國家,對語言的支持也比較單一,大多數(shù)僅支持英語。其他地區(qū)服務(wù)穩(wěn)定性不高,用戶數(shù)量有限。與國外的研究相比,當(dāng)前國內(nèi)VGI的研究仍處于初始階段。但作為完全開放的免費(fèi)數(shù)據(jù)源,我們可以看到其巨大潛力,VGI這種日益普遍的新現(xiàn)象正在改變著地理信息數(shù)據(jù)獲取、傳遞和應(yīng)用的傳統(tǒng)模式。
[1] GOODCHILD M F.Citizens as Sensors:The World of Volunteered Geography[J].GeoJournal 2007,69(4):211-221.
[2] HEIPKE C.Crowdsourcing Geospatial Data[J].ISPRS Journal of Photogrammetry and Remote Sensing,2010,65(6):550-557.
[3] BISHR M,MANTELAS L.A Trust and Reputation Model for Filtering and Classifying Knowledge about Urban Growth[J]. GeoJournal,2008,72(3-4):229-237.
[4] 李德仁,錢新林.淺論自發(fā)地理信息的數(shù)據(jù)管理[J].武漢大學(xué)學(xué)報(信息科學(xué)版),2010,35(4):379-383.
[5] HAKLAY M.How Good is Volunteered Geographical Information?A Comparative Study of OpenStreetMap and Ordnance Survey Datasets[J].Environment and Planning.B,Planning&Design,2010,37(4):682.
[6] HAKLAY M,ELLUL C.Completeness in Volunteered Geographical Information-the Evolution of OpenStreetMap Coverage in England(2008-2009)[J].Journal of Spatial Information Science,2010.
[7] GIRRES J F,TOUYA G.Quality Assessment of the French OpenStreetMap Dataset[J].Transactions in GIS,2010,14(4):435-459.
[8] NEIS P,ZIELSTRA D,ZIPF A.The Street Network Evolution of Crowdsourced Maps:OpenStreetMap in Germany 2007—2011[J].Future Internet,2011,4(1):1-21.
[9] ZIELSTRA D,HOCHMAIR H H.Digital Street Data:Free Versus Proprietary[J].GIM Int,2011(25):29-33.
[10] AMELUNXEN C.An Approach to Geocoding Based on Volunteered Spatial Data[M]. Heidelberg:[s.n.],2010.
[11]JACKSON SP,MULLEN W,AGOURIS P,et al.Assessing Completeness and Spatial Error of Features in Volunteered Geographic Information[J].ISPRSInternational Journal of Geo-Information,2013,2(2):507-530.
[12]MASHHADI A,QUATTRONE G,CAPRA L,et al.On the Accuracy of Urban Crowd-sourcing for Maintaining Large-scale Geospatial Databases[C]∥Proceedings of the Eighth Annual International Symposium on Wikis and Open Collaboration.[S.l.]:ACM,2012:15.
[13] BISHR M,JANOWICZ K.Can We Trust Information?—the Case of Volunteered Geographic Information[C]∥Towards Digital Earth Search Discover and Share Geospatial Data Workshop at Future Internet Symposium.Vol-640,CEUR-WS,2010.
[14] KEBLER C,de GROOT R T A.Trust as a Proxy Measure for the Quality of Volunteered Geographic Information in the Case of OpenStreetMap[M].[S.l.]:Springer International Publishing,2013:21-37.
[15] Coleman D J.Volunteered Geographic Information in Spatial Data Infrastructure:An Early Look at Opportunities and Constraints[C]∥GSDI 12 World Conference.Singapore:[s.n.],2010.
[16] NEISP,GOETZ M,ZIPF A.Towards Automatic Vandalism Detection in OpenStreetMap[J].ISPRSInternational Journal of Geo-Information,2012,1(3):315-332.
[17] NIELSEN J.Participation Inequality:Encouraging More Users to Contribute[J].Jakob Nielsen’s Alertbox,2006(9):2006.
[18] NEISP,ZIPF A.Analyzing the Contributor Activity of a Volunteered Geographic Information Project—The Case of OpenStreetMap[J].ISPRS International Journal of Geo-Information,2012,1(2):146-165.
[19] BUDHATHOKI N R.Participants Motivations to Contribute Geographic Information in an Online Community[D].Urbana-Champaign:University of Illinois,2010.
[20]COLEMAN D J,GEORGIADOU Y,LABONTE J.Volunteered Geographic Information:The Nature and Motivation of Produsers[J].International Journal of Spatial Data Infrastructures Research,2009,4(1):332-358.
[21]BUDHATHOKI N R,HAYTHORNTHWAITE C.Motivation for Open Collaboration Crowd and Community Models and the Case of OpenStreetMap[J].American Behavioral Scientist,2013,57(5):548-575.
[22] STEPHENS M.Gender and the GeoWeb:Divisions in the Production of User-generated Cartographic Information[J].GeoJournal,2013,78(6):981-996.
[23] 張紅平,顧學(xué)云,熊萍,等.志愿者地理信息研究與應(yīng)用初探[J].地理信息世界,2012,8(4):67-70.
[24] NEIS P,ZIELSTRA D.Recent Developments and Future Trends in Volunteered Geographic Information Research:The Case of OpenStreetMap[J].Future Internet,2014,6(1):76-106.
[25] POSER K,DRANSCH D.Volunteered Geographic Information for Disaster Management with Application to Rapid Flood Damage Estimation[J].Geomatica,2010,64(1):89-98.
[26] PULTAR E,RAUBAL M,COVA T J,et al.Dynamic GISCase Studies:Wildfire Evacuation and Volunteered Geographic Information[J].Transactions in GIS,2009,13(S1):85-104.
[27] MANFRéL A,HIRATA E,SILVA J B,et al.An Analysis of Geospatial Technologies for Risk and Natural Disaster Management[J].ISPRSInternational Journal of Geo-Information,2012,1(2):166-185.
[28] HORITA F E A,De ALBUQUERQUE J P.An Approach to Support Decision-making in Disaster Management Based on Volunteer Geographic Information(VGI)and Spatial Decision Support Systems(SDSS)[C]∥Proceedings of the 10th International Conference on Information Systems for Crisis Response and Management.Baden-Baden.Germany:[s.n.],2013.
[29]GOODCHILD M F,GLENNON JA.Crowdsourcing Geographic Information for Disaster Response:A Research Frontier[J].International Journal of Digital Earth,2010,3(3):231-241.
[30] SCHILLING A,OVER M,NEUBAUER S,et al.Interoperable Location Based Services for 3D Cities on the Web Using User Generated Content from OpenStreetMap[C]∥Urban and Regional Data Management:UDMS Annual,2009.London:Taylor and Francis,75-84.
[31] GOETZ M,ZIPF A.Towards Defining a Framework for the Automatic Derivation of 3D CityGML Models from Volunteered Geographic Information[J].Internatio-nal Journal of 3-D Information Modeling(IJ3DIM),2012,1(2):1-16.
[32] GOETZ M,ZIPF A.Using Crowdsourced Geodata for Agent-Based Indoor Evacuation Simulations[J].ISPRS International Journal of Geo-Information,2012,1(2):186-208.