顏 芬,李 霖, 2,翁 敏
(1.武漢大學(xué) 資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079;2.武漢大學(xué) 地球空間信息技術(shù)協(xié)同創(chuàng)新中心,湖北 武漢 430079)
日常生活中,人們使用地名來描述位置和導(dǎo)航[1]。地名在地理信息查詢和信息交流中有重要的作用[2]。地名是人們賦予某一特定空間位置上自然或人文地理實(shí)體的專有名稱[3]。模糊地名是指代的地理實(shí)體沒有明確物理邊界的地名[4],如:中關(guān)村,模糊地名的空間范圍大多基于認(rèn)知,人們對這些地名的邊界難以達(dá)成一致[5],但在很多地理信息服務(wù)中需要模糊地名具有明確的空間界線[6]。
確定模糊地名的近似空間范圍的普遍做法是獲取帶有地名標(biāo)簽的位置點(diǎn),如簽到數(shù)據(jù)[7-8],興趣點(diǎn)[9],網(wǎng)絡(luò)文本[10]等,使用一些方法建模,如KDE[11],DBSCAN[12-13],SVM[14]等,獲得模糊地名的空間范圍。對于模糊地名,沒有真實(shí)的邊界可以用來做參考,因此難以評估建模得到的邊界[5]。
人認(rèn)知中的模糊地名空間范圍一定程度上可以為模糊地名的真實(shí)邊界提供參考。Montello讓測試者在地圖上畫出Santa Barbra的市中心范圍[15]。文獻(xiàn)[16]中,加利福尼亞州被劃分為多個(gè)六邊形,測試者評估每個(gè)六邊形隸屬于南加州/北加州的程度。
而對于使用帶有地名標(biāo)簽的位置點(diǎn)得到的模糊地名的估計(jì)范圍與人們的認(rèn)知中模糊地名的范圍之間的差異,相關(guān)研究較少。文獻(xiàn)[17]與文獻(xiàn)[16]研究同樣的模糊地名,但文獻(xiàn)[17]使用簽到數(shù)據(jù)進(jìn)行空間建模,得到的結(jié)果與文獻(xiàn)[16]的認(rèn)知實(shí)驗(yàn)結(jié)果不同,但文獻(xiàn)[17]未能詳細(xì)分析產(chǎn)生差異的原因。
本研究以武漢市內(nèi)的5個(gè)模糊地名為案例,獲取高德地圖興趣點(diǎn)數(shù)據(jù),使用DBSCAN算法對模糊地名進(jìn)行空間范圍估計(jì),并設(shè)計(jì)了問卷,調(diào)查人們認(rèn)知這些模糊地名的空間范圍,通過對比模糊地名的基于POI估計(jì)的空間范圍和認(rèn)知區(qū)域分析模糊地名的空間特性。
模糊地名空間范圍是基于認(rèn)知的,人們在給模糊地名劃定邊界時(shí)遵循一些標(biāo)準(zhǔn),這些標(biāo)準(zhǔn)的決定性因素有多種,包括物理設(shè)施邊界(如道路)、當(dāng)?shù)卦O(shè)施(如學(xué)校)、熟悉程度等[18]。
模糊地名是對空間位置上某地理實(shí)體的指代。地理區(qū)域本來沒有名稱,名稱是人們主觀賦予的,隨著社會生活的發(fā)展和地理環(huán)境的變遷,人的認(rèn)識也不斷地變化,因此模糊地名及其空間范圍不斷在變化[3]。一個(gè)地名的消失意味著該地名不再具有空間范圍。
模糊地名空間范圍受到規(guī)劃管理的影響。郝田[19]研究了北京舊城保留胡同地名的街道空間的變遷,消失的胡同地名不再具有空間范圍,胡同地名的合并或改變意味著其所指代的空間范圍發(fā)生改變。合肥市多以有文化內(nèi)涵的老地名為地鐵站命名[20],避免了一些老地名的消失。
模糊地名空間范圍受到經(jīng)濟(jì)活動(dòng)的影響。地名商品化是必然的趨勢[21]。在城市的翻新改造中,舊的街巷和居民區(qū)被拆建為新的住宅區(qū)和商業(yè)區(qū),開發(fā)商為了市場銷售和商業(yè)運(yùn)作而另起新名,舊地名的空間范圍在新地名的影響下發(fā)生改變[22]。政府將地鐵、文體場館等公共空間的命名權(quán)拍賣,企業(yè)為追求其帶來的商業(yè)機(jī)會而爭奪命名權(quán)[23],如“黃閣北站”被更改為“豐田汽車城”[24],這一改變必然影響黃閣地名的空間范圍。
模糊地名空間范圍受到地名借用的影響。地名借用指借用一個(gè)地名作為另一個(gè)區(qū)域的名稱。歷史地名具有一定的文化內(nèi)涵,往往會成為所在空間的文化原點(diǎn)及核心,通過地名詞源的擴(kuò)散成為道路、橋梁、住區(qū)的地名組成,如:武侯祠[25]。
本研究以武漢市5個(gè)比較有名的模糊地名為研究案例,分別是司門口、卓刀泉、閱馬場、丁字橋、落雁島。司門口在明清時(shí)是蛇山以北至藩司衙門大門口的街道,如今差不多包括了解放路的主要商業(yè)鬧市區(qū),并被作為地鐵站點(diǎn)名稱。卓刀泉地名與民間傳說有關(guān),泉井已被列為武漢市文物保護(hù)單位,如今大量地名都以卓刀泉命名,如學(xué)校,立交橋,道路等。閱馬場在清朝是練兵演武的校場,后經(jīng)歷過多個(gè)重大歷史事件,現(xiàn)成為歷史紀(jì)念廣場。橋名在武漢頗為常見,丁字橋原本只是一座橋,現(xiàn)發(fā)展為大片社區(qū),眾多地點(diǎn)都以丁字橋?yàn)槊?。落雁島位于國家5A級旅游景區(qū)——東湖風(fēng)景區(qū)內(nèi),因島上有眾多大雁棲息而得名,每年都有大量游客到景區(qū)內(nèi)觀賞美景。
興趣點(diǎn)數(shù)據(jù)來自于高德地圖,使用城市數(shù)據(jù)派的開源工具Geosharp獲取到名稱或地址中包含這5個(gè)地名的興趣點(diǎn)。DBSCAN是基于密度的聚類算法,DBSCAN將點(diǎn)劃分為不同的聚類群,若點(diǎn)與其他點(diǎn)不是充分的靠近,就會被識別為噪聲點(diǎn)。DBSCAN常被用于模糊地名空間范圍的估計(jì),原因是DBSCAN能識別不同形狀的簇,并且能較好地排除噪聲點(diǎn)。DBSCAN的實(shí)現(xiàn)需要設(shè)置兩個(gè)參數(shù)MinPts和Eps。本文的參數(shù)設(shè)定參見文獻(xiàn)[12]。本研究使用DBSCAN對每個(gè)模糊地名的數(shù)據(jù)集進(jìn)行聚類,保留包含最多興趣點(diǎn)的點(diǎn)群,并將該點(diǎn)群的最小凸包作為模糊地名的范圍邊界。除了最小凸包,其他為點(diǎn)群生成邊界的算法,如α-shape算法,也被學(xué)者[15]用于模糊地名空間范圍的估計(jì),但不是本文研究重點(diǎn)。
問卷調(diào)查的目的是了解人們的認(rèn)知中這5個(gè)模糊地名的空間范圍,所以需要參與問卷調(diào)查的測試者在武漢市待的時(shí)間較長。問卷可以獲取到測試者對5個(gè)地名的熟悉程度,熟悉程度分為完全不了解、了解一點(diǎn)、熟悉、比較熟悉和非常熟悉。根據(jù)問卷中的問題“請您在地圖中畫出××這個(gè)地名包含的范圍線”,測試者被要求在高德地圖上勾畫出模糊地名的空間范圍。66個(gè)待在武漢超過4年以上的測試者參與了問卷調(diào)查。
司門口和卓刀泉這2個(gè)地名基于POI估計(jì)的空間范圍與認(rèn)知區(qū)域相符,且道路對這2個(gè)地名的空間范圍影響較大。
司門口的空間范圍以地鐵站為中心。司門口基于POI估計(jì)的空間范圍與認(rèn)知區(qū)域相符,但形狀有較小差異,如圖1所示,估計(jì)的空間范圍是長條形,而認(rèn)知區(qū)域基本都是圓形。在整條解放路附近,大量的興趣點(diǎn)的地址都包含“司門口解放路”,人們認(rèn)知上的司門口區(qū)域并不包含解放路南端,道路的延伸使得在南北方向長度上估計(jì)的空間范圍略大于認(rèn)知區(qū)域。
卓刀泉地名基于POI估計(jì)的空間范圍與認(rèn)知區(qū)域相符,但形狀有較小差異,估計(jì)的空間范圍在南北方向的長度上略大于認(rèn)知區(qū)域,如圖2所示。大部分人認(rèn)知中卓刀泉的空間范圍以卓刀泉立交橋?yàn)橹行模康度⒔粯蚴亲康度下泛妥康度甭返姆纸琰c(diǎn)。在卓刀泉南路和卓刀泉北路附近,大量興趣點(diǎn)以“卓刀泉南路”或“卓刀泉北路”命名,但人們一般不認(rèn)為卓刀泉南路的最南端和卓刀泉北路的最北端屬于卓刀泉區(qū)域,道路的延伸使得在南北方向的長度上估計(jì)的空間范圍略大于認(rèn)知區(qū)域。
閱馬場的基于POI估計(jì)的空間范圍與認(rèn)知區(qū)域相符,如圖3所示。閱馬場的認(rèn)知區(qū)域受熟悉程度的影響大。由圖4可知,大部分測試者所勾畫的閱馬場的區(qū)域面積在0~2 km2,隨著熟悉程度的增加,區(qū)域面積的均值呈增加趨勢,且不同熟悉程度的測試者勾畫的閱馬場的區(qū)域面積差別很大。閱馬場是一片廣場,地圖上標(biāo)有“閱馬場”的地方非常少,熟悉閱馬場的人能確定整片廣場屬于閱馬場區(qū)域,而不熟悉閱馬場的人認(rèn)為閱馬場是包含“閱馬場”標(biāo)注的小區(qū)域。而大部分測試者所勾畫的丁字橋的區(qū)域面積在0~0.5 km2,隨著熟悉程度的增加,區(qū)域面積的均值呈減小趨勢,但總體上不同熟悉程度的測試者勾畫的丁字橋的區(qū)域面積差別不大。地圖上有眾多包含“丁字橋”地名的地點(diǎn),如“丁字橋路”,“丁字橋小學(xué)”等。熟悉丁字橋的人能快速確定丁字橋區(qū)域,不熟悉丁字橋的人在查找地圖的過程中看到這些地點(diǎn)后也能確定丁字橋范圍,大量的以“丁字橋”命名的地點(diǎn)為人們提供了確定地名空間范圍的依據(jù),這使得熟悉和不熟悉丁字橋的人畫出來的區(qū)域面積大小相近。
圖2 道路延伸對卓刀泉區(qū)域形態(tài)的影響
圖3 閱馬場的基于POI估計(jì)的空間范圍與認(rèn)知區(qū)
圖4 對地名有不同熟悉程度的人勾畫的地名區(qū)域的面積箱線圖
地名借用是借用一個(gè)地名用于指代另一個(gè)區(qū)域。卓刀泉的空間范圍內(nèi)就有大量地點(diǎn)借用卓刀泉來命名,如卓刀泉中學(xué),卓刀泉北路等。
地名借用會給基于POI數(shù)據(jù)的模糊地名空間范圍估計(jì)帶來一些問題。由圖5可看出,丁字橋的基于POI估計(jì)的空間范圍包含了丁字橋路和丁字橋南路附近區(qū)域。而人們認(rèn)知中“丁字橋南路”這條路借用了“丁字橋”來指代丁字橋南邊的路,丁字橋南路并不屬于丁字橋的區(qū)域。本研究在原始興趣點(diǎn)數(shù)據(jù)集中刪除名稱或地址中包含“丁字橋南路”的興趣點(diǎn),重新估計(jì)的空間范圍得到的丁字橋區(qū)域與認(rèn)知區(qū)域相符,如圖5所示。
由圖6可知,落雁島的基于POI估計(jì)的空間范圍與認(rèn)知區(qū)域相差較大,造成差異的主要原因是地名借用。落雁島是旅游景區(qū),地處偏僻,興趣點(diǎn)少且分散。去往落雁島景區(qū)的路上有一片社區(qū),社區(qū)中大量興趣點(diǎn)的地址中都包含“落雁島”。借用旅游景點(diǎn)地名來為興趣點(diǎn)命名可以帶來商業(yè)價(jià)值,這些興趣點(diǎn)影響了落雁島空間范圍的估計(jì),使之與認(rèn)知區(qū)域有較大差異。
圖5 排除“丁字橋南路”對“丁字橋”空間范圍估計(jì)的影響
圖6 地名借用對落雁島的空間范圍估計(jì)結(jié)果的影響
總的來說,使用POI數(shù)據(jù)對模糊地名空間范圍進(jìn)行估計(jì)是簡單有效的。相比于讓測試者在地圖上勾畫出模糊地名的空間范圍,基于POI的模糊地仍然需要解決的問題。
大多數(shù)非行政地名具有模糊的空間范圍,但一些地理信息服務(wù)需要模糊地名的確切邊界。使用帶有地名標(biāo)簽的位置點(diǎn)進(jìn)行空間范圍估計(jì)是較為普遍的確定模糊地名近似空間界線的方法,但由于真實(shí)的邊界不存在,無法評估空間范圍的估計(jì)結(jié)果,而人們認(rèn)知中模糊地名的空間范圍可以為空間范圍估計(jì)結(jié)果的評估提供參考。
地名及其空間范圍是不斷在變化的,模糊地名的空間范圍受到多種因素的影響。本研究對武漢市5個(gè)模糊地名進(jìn)行空間范圍估計(jì),并設(shè)計(jì)問卷調(diào)查這5個(gè)地名的認(rèn)知區(qū)域。通過比較模糊地名估計(jì)的空間范圍與認(rèn)知區(qū)域,發(fā)現(xiàn)影響模糊地名空間范圍的因素有道路、熟悉程度和地名借用?;赑OI估計(jì)的模糊地名空間范圍符合人們的認(rèn)知,但地名借用可能會給某些模糊地名的空間范圍的估計(jì)帶來問題,這是模糊地名空間范圍的估計(jì)仍然需要解決的問題。
[1] 魏勇,胡丹露,李響,等. 基于GeoNames和Solr的地名數(shù)據(jù)全文檢索[J]. 測繪工程,2016,25(2):28-32.
[2] 馮濤,李志剛,周巖,等. 地名數(shù)據(jù)生產(chǎn)與建庫監(jiān)理內(nèi)容與方法研究[J]. 測繪工程,2017,26(5):1-4.
[3] 蒲欣梅. 中國城市地名發(fā)展演化與規(guī)劃研究[D].蘭州:蘭州大學(xué),2009.
[4] 劉瑜,袁一泓,張毅. 基于認(rèn)知的模糊地理要素建模——以中關(guān)村為例[J]. 遙感學(xué)報(bào),2008(2):370-377.
[5] TWAROCH F A, JONES C B, ABDELMOTY A I. Acquisition of Vernacular Place Names from Web Sources[M]. Weaving Services and People on the World Wide Web. Springer Berlin Heidelberg, 2009:195-214.
[6] JONES C B, PURVES R S, CLOUGH P D, et al. Modelling vague places with knowledge from the Web[J]. International Journal of Geographical Information Science, 2008, 22(10):1045-1065.
[7] HU Y, GAO S, JANOWICZ K, et al. Extracting and understanding urban areas of interest using geotagged photos [J]. Computers Environment & Urban Systems, 2015, 54:240-254.
[8] HOLLENSTEIN L, PURVES R. Exploring place through user-generated content: Using Flickr to describe city cores [J]. Journal of Spatial Information Science, 2010, 1(1):21-48.
[9] 黃瀟瑩,李霖,顏芬. 基于多源興趣點(diǎn)的模糊地名空間范圍劃分方法[J]. 地理信息世界,2016,23(6):61-67+72.
[10] 王宇. 基于網(wǎng)絡(luò)文本的地名空間模糊建模[D].南京:南京師范大學(xué),2012.
[11] GROTHE C, SCHAAB J. Automated footprint generation from geotags with kernel density estimation and support vector machines [J]. Spatial Cognition & Computation, 2009, 9(3):195-211.
[12] PARKER J K, DOWNS J A. Footprint generation using fuzzy-neighborhood clustering [J]. Geoinformatica, 2013, 17(2):285-299.
[13] INTAGORN S, LERMAN K. Learning boundaries of vague places from noisy annotations[C]//ACM Sigspatial International Symposium on Advances in Geographic Information Systems, Acm-Gis 2011, November 1-4, 2011, Chicago, Il, Usa, Proceedings. DBLP, 2011:425-428.
[14] CUNHA E, MARTINS B. Using one-class classifiers and multiple kernel learning for defining imprecise geographic regions[J]. International Journal of Geographical Information Science, 2014, 28(11):2220-2241.
[15] MONTELLO D R, GOODCHILD M F, JONATHONG, et al. Where’s Downtown: Behavioral Methods for Determining Referents of Vague Spatial Queries[J]. Spatial Cognition & Computation, 2003, 3(2-3):185-204.
[16] MONTELLO D R, FRIEDMAN A, PHILLIPS D W. Vague cognitive regions in geography and geographic information science [J]. International Journal of Geographical Information Science, 2014, 28(9):1802-1820.
[17] GAO S, JANOWICZ K, MONTELLO D R, et al. A data-synthesis-driven method for detecting and extracting vague cognitive regions [J]. International Journal of Geographical Information Systems, 2017, 31(6):1245-1271.
[18] DAVIES C. Are Places Concepts Familarity and Expertise Effects in Neighborhood Cognition[M]Spatial Information Theory. Springer Berlin Heidelberg, 2009:36-50.
[19] 郝田. 北京舊城保留胡同地名的街道空間變遷研究[D].北京:清華大學(xué),2015.
[20] 合俊. 合肥市地鐵復(fù)活老地名[J]. 中國地名,2016(1):79.
[21] LIGHT D, YOUNG C. Toponymy as Commodity: Exploring the Economic Dimensions of Urban Place Names[J]. International Journal of Urban & Regional Research, 2014, 39(3).
[22] 李秋璞,陳金華,高偉雯. 基于GIS的歷史文化名城地名演變研究——以泉州城為例[J]. 樂山師范學(xué)院學(xué)報(bào),2016,31(4):55-60.
[23] 紀(jì)小美,王衛(wèi)平,陳潔,等. 批判轉(zhuǎn)向以來地名學(xué)研究回顧與展望[J]. 地理科學(xué)進(jìn)展,2016,35(7):910-919.
[24] 劉博,朱竑. 批判視角下廣州地鐵站命名與更名研究[J]. 地理科學(xué),2014,34(9):1139-1144.
[25] 羅君蘭. 地名與城市的形態(tài)[D].重慶:重慶大學(xué),2016.