劉美春,張 力,肖劍平
(1. 武漢市測繪研究院,湖北 武漢 430022; 2. 長江水利委員會,湖北 武漢 430010)
Study of Data Processing Technology of City Comprehensive
Atlas Compilation
LIU Meichun,ZHANG Li,XIAO Jianping
?
城市綜合性地圖集編制中數(shù)據(jù)處理技巧研究
劉美春1,張力2,肖劍平1
(1. 武漢市測繪研究院,湖北 武漢 430022; 2. 長江水利委員會,湖北 武漢 430010)
Study of Data Processing Technology of City Comprehensive
Atlas Compilation
LIU Meichun,ZHANG Li,XIAO Jianping
摘要:城市綜合性地圖集是綜合反映一個城市自然、經(jīng)濟(jì)、文化、歷史、發(fā)展?fàn)顩r的信息載體,是人們?nèi)媪私庠摮鞘凶钪庇^、最全面的信息工具,需要通過方方面面的信息進(jìn)行綜合與融合。本文以《武漢城市地圖集》為例,從城市綜合性地圖集的內(nèi)容、資料和數(shù)據(jù)情況分析和處理、數(shù)據(jù)挖掘技術(shù)應(yīng)用和知識表示效果等方面進(jìn)行展開,充分體現(xiàn)了數(shù)據(jù)處理技術(shù)在綜合性圖集編制中的重要性。
關(guān)鍵詞:資料收集;資料分析與評價;數(shù)據(jù)倉庫;數(shù)據(jù)挖掘;知識表示
隨著地理信息技術(shù)和計算機(jī)、網(wǎng)絡(luò)等技術(shù)的趨向成熟,所有文字、圖片、數(shù)據(jù)等有形和無形的信息都能與地圖掛鉤,都能通過圖文形式進(jìn)行有效表達(dá),可以說人類活動、自然界所發(fā)生的所有信息都可以在圖集中充分體現(xiàn)。城市綜合性地圖集是一定時期內(nèi)城市市容市貌及生產(chǎn)、生活信息的綜合體。資料的全面性、現(xiàn)勢性、權(quán)威性是地圖集實(shí)用性和綜合性的前提,圍繞圖集所要表達(dá)的內(nèi)容進(jìn)行資料分析和數(shù)據(jù)挖掘是關(guān)鍵所在,針對所挖掘的信息進(jìn)行知識的表達(dá),以及應(yīng)該如何表達(dá)、表達(dá)到什么程度是圖集研究的最終目的。
一、城市綜合性地圖集內(nèi)容構(gòu)成
1. 城市綜合性地圖集常見內(nèi)容形式
城市綜合性地圖集一般要反映城市的自然狀態(tài)、市政建設(shè)、人類活動、精神文化與城市管理等幾個基本方面,不僅包含資源環(huán)境地圖、人文地圖、經(jīng)濟(jì)地圖和歷史地圖等內(nèi)容,同時包含環(huán)境評價、區(qū)域規(guī)劃、預(yù)測預(yù)報等與經(jīng)濟(jì)建設(shè)和人類生活直接相關(guān)的選題。如《重慶市地圖集》內(nèi)容包含城市歷史、政區(qū)、地勢、交通、人口、資源、環(huán)境、經(jīng)濟(jì)與社會、區(qū)縣圖和規(guī)劃等;《北京城市地圖集》包含北京區(qū)位、地勢、政區(qū)、交通機(jī)中心城區(qū)詳圖等信息。
2. 《武漢城市地圖集》內(nèi)容情況介紹
《武漢城市地圖集》以武漢市主城區(qū)地圖數(shù)據(jù)為主,從區(qū)位、環(huán)境、資源、交通、地質(zhì)結(jié)構(gòu)、行政區(qū)劃6個方面著手,將武漢的地理位置、氣候、人口、行政區(qū)劃、面積、交通、人文、環(huán)境、歷史、發(fā)展、規(guī)劃等方面信息通過時間軸連接在一起,從時間和空間兩個方面,詳細(xì)反映一定時期城市的發(fā)展變化和人文、經(jīng)濟(jì)、管理狀況;通過歷史與現(xiàn)狀、現(xiàn)狀與規(guī)劃、地圖與文字、圖片與圖表、符號與數(shù)字等相結(jié)合的方式細(xì)細(xì)描繪,共同表示武漢的歷史久、城市大、發(fā)展速、規(guī)劃全等特點(diǎn),突出武漢市城市的特色及區(qū)位優(yōu)勢。內(nèi)容分以下4個圖組:
1) “極目楚天”圖組:突出武漢區(qū)位優(yōu)勢,表示武漢在全國的位置圖、武漢在湖北省的位置圖、武漢城市圈地圖、武漢市政區(qū)圖、武漢市中心城區(qū)圖和武漢市影像圖,從地理定位方面讓讀者對武漢有一個框架性的了解。
2) “巍巍江城”圖組:從環(huán)境、資源、交通及發(fā)展現(xiàn)狀4個方面詳細(xì)表示城市面貌。這是圖集的主體內(nèi)容,采取先整體后局部的形式,首先采用DEM與矢量相疊加的形式,突出武漢總的地貌特色;在此基礎(chǔ)上,結(jié)合歷年相關(guān)統(tǒng)計資料,用圖表、文字、專題圖等將武漢的氣候、地質(zhì)、人口、交通、醫(yī)療衛(wèi)生,以及各項自然和人文經(jīng)濟(jì)指標(biāo)進(jìn)行縱向和橫向比較;然后將中心城區(qū)采取矢量和影像對照的形式、以大比例尺1∶4000~1∶16 000的圖幅詳細(xì)表示。
3) “覽勝三鎮(zhèn)”圖組:從城市歷史變遷、楚風(fēng)漢韻、商貿(mào)重鎮(zhèn)、都市點(diǎn)睛等體現(xiàn)武漢發(fā)展歷程。通過歷史圖片、文字、效果圖、三維立體影像圖等對三鎮(zhèn)演變、城市擴(kuò)展、風(fēng)俗民情、風(fēng)味美食、文娛生活、體育特色、商業(yè)網(wǎng)點(diǎn)、主要經(jīng)濟(jì)開發(fā)區(qū)、示范生活小區(qū)、主要景點(diǎn)、景區(qū)等進(jìn)行特色描述。
4) “展望武漢”圖組:通過城市近期和中遠(yuǎn)期規(guī)劃圖件展示武漢未來發(fā)展方向。以規(guī)劃專題圖為主題,配合相應(yīng)的文字說明和圖片,通過都市發(fā)展組團(tuán)規(guī)劃、主城區(qū)特色景觀規(guī)劃等圖件和文字介紹的形式,展現(xiàn)若干年后武漢市的格局和面貌。
二、編圖資料與數(shù)據(jù)情況
城市綜合性地圖集所需資料和數(shù)據(jù)涵蓋城市發(fā)展過程中的方方面面,數(shù)據(jù)類型多種多樣,往往不是一個數(shù)據(jù)庫就能解決問題的,是基礎(chǔ)地理數(shù)據(jù)庫和各專題數(shù)據(jù)庫的集合體。從我國目前對于地理信息方面的管理模式來看,綜合性地圖集的編制少不了資料收集這一重要環(huán)節(jié),需從各相關(guān)單位獲取最現(xiàn)勢、最完善的第一手資料。在收集資料的過程中,設(shè)計者必須做到心中有數(shù)、有的放矢,只有明白自己需要什么樣的資料、大概在什么地方獲得,將所要的資料列出詳細(xì)清單,才能保證信息的完備性和權(quán)威性。
《武漢城市地圖集》的編制資料以武漢市“十五”以來連續(xù)3個五年規(guī)劃1∶2000地形數(shù)據(jù)庫、“十一五”以來1∶500~1∶10 000系列比例尺地形數(shù)據(jù)庫和時間跨度達(dá)幾十年的遙感影像數(shù)據(jù)為基礎(chǔ),并輔以各行各業(yè)文字、圖片、統(tǒng)計圖表等反映城市歷史、經(jīng)濟(jì)、現(xiàn)狀、發(fā)展、規(guī)劃等與城市發(fā)展相關(guān)的專題信息,其數(shù)據(jù)類型涵蓋面向?qū)ο髷?shù)據(jù)庫、空間數(shù)據(jù)庫、時間數(shù)據(jù)庫、文本數(shù)據(jù)庫、多媒體數(shù)據(jù)庫、專題數(shù)據(jù)庫和互聯(lián)網(wǎng)數(shù)據(jù)庫等。
三、資料分析與數(shù)據(jù)預(yù)處理
在圖集編制過程中,對資料的分析和數(shù)據(jù)處理是編輯制作的前期準(zhǔn)備工作,是設(shè)計內(nèi)容能否實(shí)現(xiàn)的關(guān)鍵。設(shè)計者首先從一堆雜亂無章的資料中將面向主題的信息篩選出來;然后對與時間相關(guān)的數(shù)據(jù)(如歷史數(shù)據(jù))按時間軸進(jìn)行整理,建立編制資料的信息庫;最后通過數(shù)據(jù)挖掘技術(shù)和制圖綜合技術(shù)將數(shù)據(jù)集成為成果圖集。圖集工作流程如圖1所示。
圖1 圖集工作流程
1. 資料的整理、分析與評價
(1) 資料的分類、分級整理
鑒于每類數(shù)據(jù)的來源和管理方式不同,不同的數(shù)據(jù)庫之間的數(shù)據(jù)存在穿插性,并且同類數(shù)據(jù)在不同數(shù)據(jù)庫中表現(xiàn)形式和時間段也存在偏差。為提高資料的使用效率,簡化作業(yè)流程,首先必須將收集到的資料進(jìn)行分類、分級整理,根據(jù)數(shù)據(jù)的表現(xiàn)形式可分為地圖資料、遙感影像資料、數(shù)據(jù)資料、文字資料、圖片資料等幾類,在此基礎(chǔ)上將每一類資料又分為基礎(chǔ)資料、補(bǔ)充資料、專題資料等不同級別。在數(shù)據(jù)管理上,緊密結(jié)合圖集內(nèi)容結(jié)構(gòu)進(jìn)行,基本上采取星形結(jié)構(gòu),在數(shù)據(jù)倉庫的統(tǒng)一集合下,將數(shù)據(jù)以圖組為單元建立數(shù)據(jù)庫,在各數(shù)據(jù)庫的基礎(chǔ)上再分專題逐級、逐層進(jìn)行管理。
(2) 編圖資料的分析與評價
從地圖編制、審核和使用幾個方面來說,城市地圖集編制資料必須具備政治性、科學(xué)性、完備性、現(xiàn)勢性等特性,因此對所收集到的資料首先進(jìn)行科學(xué)分析與評價,優(yōu)先使用具備這些基本特性的資料,將政治性和現(xiàn)勢性不強(qiáng)的資料剔除出來,從源頭消除地圖成果的質(zhì)量隱患。如對基礎(chǔ)地理數(shù)據(jù)進(jìn)行數(shù)據(jù)格式、數(shù)據(jù)坐標(biāo)系、數(shù)據(jù)質(zhì)量等分析;對環(huán)境監(jiān)測、氣候等動態(tài)變化的資料進(jìn)行時間性評價;對統(tǒng)計圖表進(jìn)行定位性、統(tǒng)一性等評價。
2. 數(shù)據(jù)預(yù)處理及數(shù)據(jù)倉庫的建立
從不同渠道收集到的資料經(jīng)常會存在完整性和規(guī)范性不一致等特點(diǎn)。要想實(shí)現(xiàn)資料的有效利用,簡化數(shù)據(jù)處理過程,提高最終成果質(zhì)量,在數(shù)據(jù)利用前必須進(jìn)行數(shù)據(jù)預(yù)處理,對資料進(jìn)行篩選,通過格式轉(zhuǎn)換、掃描、數(shù)字化等手段改變原有的分類、分級、規(guī)范表示方法,去除冗余數(shù)據(jù),根據(jù)時間序列和已知的變化規(guī)律補(bǔ)充不完全數(shù)據(jù)等。在此基礎(chǔ)上進(jìn)行數(shù)據(jù)集成和數(shù)據(jù)形式轉(zhuǎn)換,將數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的數(shù)據(jù)坐標(biāo)、投影方式及統(tǒng)一存儲在便于挖掘的數(shù)據(jù)平臺,把不同來源、格式、特點(diǎn)性質(zhì)的數(shù)據(jù)在邏輯上或物理上進(jìn)行有機(jī)集中,將數(shù)據(jù)由多個源統(tǒng)一到數(shù)據(jù)倉庫進(jìn)行存儲,在此基礎(chǔ)上分圖組、分專題進(jìn)行整理。數(shù)據(jù)處理流程如圖2所示。
圖2 圖集數(shù)據(jù)處理流程
四、數(shù)據(jù)處理技巧與表達(dá)效果分析
1. 數(shù)據(jù)挖掘技術(shù)應(yīng)用
任何一個數(shù)據(jù)都包含直觀表示的信息和潛在深層次的信息。直觀表現(xiàn)的信息在層面上一般讓人一目了然,這是一般讀者都能輕易獲取的信息;而潛在的信息往往容易被忽視,這些隱藏的、深層次的信息獲取一般需要有一定的數(shù)據(jù)庫作支撐,通過系列的專業(yè)技術(shù),從大量的信息源中經(jīng)過分析、對比、統(tǒng)計、歸納,提取隱藏于其中的、有效的信息和知識。所謂的的數(shù)據(jù)倉庫,實(shí)際上就是圖集所需資料數(shù)據(jù)的集合,包含基礎(chǔ)數(shù)據(jù)庫、統(tǒng)計圖表、文字信息,以及其他專題信息庫。在進(jìn)行數(shù)據(jù)挖掘之前,首先建立數(shù)據(jù)倉庫等數(shù)據(jù)集中管理模式,然后分析數(shù)據(jù),明確目標(biāo),確定需要挖掘什么樣的信息,根據(jù)信息源實(shí)際情況采取聚類分析、關(guān)聯(lián)分析、演變分析及統(tǒng)計等有效的方法,從各種非結(jié)構(gòu)化數(shù)據(jù)(如文本、圖形、圖像等數(shù)據(jù))中尋找最有用的數(shù)據(jù)。
在地圖集的編制過程中,使用頻率最多的是空間數(shù)據(jù)挖掘技術(shù)、文本挖掘技術(shù)、多媒體挖掘技術(shù)等,利用基礎(chǔ)地理數(shù)據(jù)庫編制地理底圖,在以研究范圍的地理底圖為背景的情況下,從各行各業(yè)的經(jīng)濟(jì)和建設(shè)專題數(shù)據(jù)庫中獲取城市發(fā)展歷程、發(fā)展現(xiàn)狀和城市發(fā)展規(guī)律的知識和信息。
《武漢城市地圖集》編制的數(shù)據(jù)源主要是現(xiàn)實(shí)性較強(qiáng)的基礎(chǔ)地形矢量數(shù)據(jù)、多個時間段的航空數(shù)碼影像數(shù)據(jù),以及各行各業(yè)、各專題的文字統(tǒng)計圖表等文本信息和圖像信息。從中獲取時空信息和統(tǒng)計信息是城市地圖集編制的目的之一。其中城市大比例尺基礎(chǔ)地形和影像數(shù)據(jù)中涵蓋現(xiàn)實(shí)世界一定時間段內(nèi)幾乎所有信息。以1∶2000地形圖為例,包含水系、居民地、交通、管線、境界、地貌、土質(zhì)與植被、注記8大類城市基礎(chǔ)地理信息資源及數(shù)據(jù)庫中各類經(jīng)濟(jì)指標(biāo)屬性信息,厘米級航攝影像圖中包含地表以上信息中除注記外的7大類信息。因此,數(shù)據(jù)源的信息挖掘空間很大,從中不僅可以獲取反映城市發(fā)展變化的時空信息,同時城市行政、建設(shè)、經(jīng)濟(jì)、交通、土地利用等詳細(xì)情況都能從中分析和統(tǒng)計出來,如圖3所示。
2. 知識表示效果分析
雖然基礎(chǔ)數(shù)據(jù)庫包含十分豐富的信息資源,從中探索并提煉出大量隱藏的信息并非易事,將這些潛在的信息轉(zhuǎn)化為人們可接受的表現(xiàn)形式可以說是難上加難。如何將這些來源復(fù)雜、形式多樣、時空跨度長達(dá)幾年甚至幾十年的且基本上不能直接使用的資料轉(zhuǎn)化為設(shè)計者所要表達(dá)的內(nèi)容形式,是地圖集設(shè)計過程中比較棘手的問題。
在數(shù)據(jù)挖掘過程中獲取圖集設(shè)計思路中所要表達(dá)的信息,通過制圖綜合和統(tǒng)計分析等方法進(jìn)行知識提取和轉(zhuǎn)化,通過地圖語言以通俗、直觀、實(shí)用的圖片、文字、圖表、符號等進(jìn)行特征化、可視化、模型化處理,從而實(shí)現(xiàn)知識合理及正確的表達(dá);然后將數(shù)據(jù)進(jìn)行整合、包裝和輸出成印刷圖件,完成資料—數(shù)據(jù)—數(shù)據(jù)庫—單幅圖—圖集的編制過程;最終形成圖幅信息的表示方式,以地圖集的形式展示給讀者。
圖3 專題信息挖掘
圖4 文本信息知識表示效果
在此過程中,將文本信息轉(zhuǎn)化為專題圖和統(tǒng)計圖表,以及時空信息的挖掘和表示難度較大,在很多情況下沒有確定的分界線和明確的分級指標(biāo),一般憑借人的知識積累和實(shí)踐常識來分析和評判。因此,在數(shù)據(jù)挖掘和知識表達(dá)的整個流程中,不僅需要計算機(jī)技術(shù)、多媒體技術(shù)、制圖綜合技術(shù),同時人工智能技術(shù)、模糊分析、時空分析和神經(jīng)網(wǎng)絡(luò)技術(shù)的使用也較多。以文本信息為例,同樣的信息內(nèi)容在不同的專題中可以表示成專題地圖、統(tǒng)計圖表、文字與圖片穿插等不同的表達(dá)方式,如圖4所示?!段錆h城市地圖集》將專題地圖、統(tǒng)計圖表、文字介紹、圖片信息等融合在一起,采取圖文并茂的形式進(jìn)行表示,在表達(dá)上突出藝術(shù)性,效果如圖5、圖6所示。
圖5 專題地圖與文字圖片結(jié)合表示效果
圖6 專題地圖與統(tǒng)計圖表結(jié)合表示效果
五、結(jié)束語
綜合性地圖集的編制是一項系統(tǒng)工程和精細(xì)工
程,數(shù)據(jù)挖掘和信息表達(dá)技術(shù)在其中表現(xiàn)得特別充分,廣大地圖編制工作者必須在長期的生產(chǎn)實(shí)踐中進(jìn)行積累,并與時俱進(jìn),利用先進(jìn)的技術(shù)理念和方法來指導(dǎo)實(shí)踐。在當(dāng)今的大數(shù)據(jù)時代,能充分利用和開發(fā)數(shù)據(jù),才能引領(lǐng)時代。地圖學(xué)是站在時代最前沿的學(xué)科之一,各行各業(yè)的信息化建設(shè)都離不開地圖這個載體,地圖也是利用數(shù)據(jù)最多、最全面的學(xué)科,從現(xiàn)實(shí)世界中挖掘知識是地圖學(xué)發(fā)展的精髓所在,數(shù)據(jù)挖掘技術(shù)必將在這個領(lǐng)域得到更好的發(fā)揮和延伸。
參考文獻(xiàn):
[1]HAN J,KAMBER M.數(shù)據(jù)挖掘概念與技術(shù)[M].范明,孟小峰,譯. 2版. 北京:機(jī)械工業(yè)出版社,2007.
[2]李新運(yùn).城市空間數(shù)據(jù)挖掘方法與應(yīng)用[M]. 山東:山東大學(xué)出版社,2005.
[3]呂曉玲.?dāng)?shù)據(jù)挖掘方法與應(yīng)用[M]. 北京:中國人民大學(xué)出版社,2009.
[4]汪前進(jìn).羅明堅編繪《中國地圖集》所依據(jù)中文原始資料新探[J]. 北京行政學(xué)院學(xué)報, 2013(3):120-123.
[5]唐靜,王貝,趙飛.城市專題地圖指標(biāo)內(nèi)容的分析和處理[J]. 地理信息世界, 2010(4),35-39.
[6]SOWA J F. 知識表示[M]. 北京:機(jī)械工業(yè)出版社,2003.
[7]龐玉華. 對地圖集總體設(shè)計的思考[J]. 測繪通報,2007(5):63-65.
[8]王秀斌. 區(qū)域綜合地圖集總體設(shè)計思路探討——《福建省情地圖集》總體方案設(shè)計研究[J]. 測繪通報,2008(1):59-61.
引文格式: 劉美春,張力,肖劍平. 城市綜合性地圖集編制中數(shù)據(jù)處理技巧研究[J].測繪通報,2016(1):128-131.DOI:10.13474/j.cnki.11-2246.2016.0032.
作者簡介:劉美春(1973—),女,高級工程師,主要從事地圖編研、數(shù)據(jù)處理等工作。E-mail: lmcwhkc@sohu.com
收稿日期:2014-10-17
中圖分類號:P283
文獻(xiàn)標(biāo)識碼:B
文章編號:0494-0911(2016)01-0128-04