林建美
【摘 要】不同格式數(shù)據(jù)之間的轉(zhuǎn)換一直是一個(gè)研究熱點(diǎn),如何在不同數(shù)據(jù)格式間進(jìn)行精準(zhǔn)轉(zhuǎn)換是長(zhǎng)期以來(lái)未能完美解決的一個(gè)問(wèn)題。由于CAD和GIS的數(shù)據(jù)模型之間存在極大的差異,導(dǎo)致它們對(duì)同一地理實(shí)體的描述方式不一致,使得實(shí)現(xiàn)這兩種格式數(shù)據(jù)之間的相互轉(zhuǎn)換存在較大的難度??梢暬D(zhuǎn)換模型可以在轉(zhuǎn)換效果和工作量之間找到平衡,使大部分人員均可實(shí)現(xiàn)理想的轉(zhuǎn)換結(jié)果。
【關(guān)鍵詞】GIS數(shù)據(jù);可CAD數(shù)據(jù);視化轉(zhuǎn)換
1.數(shù)據(jù)模型
1.1 CAD數(shù)據(jù)模型
CAD數(shù)據(jù)注重描述地理實(shí)體的空間位置和幾何形狀等信息,它以符號(hào)化的形式分層管理數(shù)據(jù)。CAD文件是由諸如顏色、線型、線寬、符號(hào)等靜態(tài)圖形特征組織后的圖層集合,實(shí)體或元素都包含在單一的文件中,屬性數(shù)據(jù)的主要描述依據(jù)圖層和注記。地理實(shí)體以線型、圖層、顏色、字體等幾何特性和空間位置數(shù)據(jù)記錄等方式表達(dá)。
1.2 GIS數(shù)據(jù)模型
GIS能夠?qū)⒌乩韺?shí)體的空間信息和屬性信息集成管理。地理實(shí)體的屬性信息是用來(lái)描述地理實(shí)體的屬性特征的信息,是一個(gè)屬性數(shù)據(jù)庫(kù)。更重要的是它包含了CAD所沒(méi)有的空間信息,如實(shí)體間的拓?fù)潢P(guān)系,與地理實(shí)體相對(duì)應(yīng)的空間坐標(biāo)系等空間信息。GIS地理實(shí)體的數(shù)據(jù)既包含CAD數(shù)據(jù)的空間位置和幾何形狀的信息,同時(shí)又包含地理實(shí)體的屬性信息,GIS根據(jù)這些信息才能實(shí)現(xiàn)空間分析、測(cè)量、分類、統(tǒng)計(jì)等功能。
1.3傳統(tǒng)數(shù)據(jù)轉(zhuǎn)換方法
在不同的系統(tǒng)數(shù)據(jù)格式中對(duì)同一實(shí)體對(duì)象的描述手段與組織方式不盡相同,如何實(shí)現(xiàn)不同系統(tǒng)間數(shù)據(jù)的轉(zhuǎn)換,最理想的狀態(tài)是對(duì)兩個(gè)系統(tǒng)間的所有語(yǔ)義建立一一對(duì)應(yīng)的映射關(guān)系表。但在實(shí)際實(shí)現(xiàn)過(guò)程中,不可能將所有的元素都建立這樣的關(guān)系,這樣就產(chǎn)生了信息傳遞過(guò)程中的語(yǔ)義變異與信息理解上的語(yǔ)義偏差。因此,可行的轉(zhuǎn)換模型就是建立一個(gè)兩種數(shù)據(jù)格式之間盡可能完備的映射關(guān)系表。傳統(tǒng)的數(shù)據(jù)轉(zhuǎn)換技術(shù)的是提供一個(gè)簡(jiǎn)單直接地訪問(wèn)外部數(shù)據(jù)的方法。此方法的基礎(chǔ)是對(duì)兩種數(shù)據(jù)結(jié)構(gòu)的有限支持。在某些情況下,他們僅處理特定的數(shù)據(jù)對(duì)象。這時(shí)映射關(guān)系表中的映射只是完備集命中的一個(gè)子集。還有一種常用數(shù)據(jù)轉(zhuǎn)換的方式是使用各個(gè)軟件中的公開數(shù)據(jù)格式。每個(gè)軟件為了與其他軟件進(jìn)行數(shù)據(jù)共享,通常都定義一種公開的數(shù)據(jù)格式,如DXF和E00格式。普通用戶可以直接讀寫這些公開的數(shù)據(jù)格式,實(shí)質(zhì)上它們起到了一個(gè)數(shù)據(jù)橋梁的作用,通過(guò)這個(gè)橋梁可以實(shí)現(xiàn)軟件之間的數(shù)據(jù)轉(zhuǎn)換。但是這種方式僅僅是簡(jiǎn)化了直接讀取源數(shù)據(jù)的難度,因?yàn)檫@些公開的交換格式又是由各軟件廠商自己定義,所包含的內(nèi)容和表達(dá)方式不盡相同,并沒(méi)有從根本上解決構(gòu)建一一對(duì)應(yīng)的映射關(guān)系表的問(wèn)題。
2.可視化轉(zhuǎn)換模型
ESRI公司的ArcGIS是使用最普遍的GIS應(yīng)用軟件,最新版本中增加了數(shù)據(jù)互操作擴(kuò)展模塊,其內(nèi)核是基于加拿大公 司 提 供 的 要 素 操 作 引 擎(FME)技術(shù)。互操作模塊提供了空間數(shù)據(jù)提取,轉(zhuǎn)換和加載(ETL)功能,使用戶可以使用多種數(shù)據(jù)格式工作。FME基于語(yǔ)義轉(zhuǎn)換技術(shù)進(jìn)行數(shù)據(jù)共享,允許用戶在數(shù)據(jù)轉(zhuǎn)換過(guò)程中重新構(gòu)造數(shù)據(jù),這些重新構(gòu)造的數(shù)據(jù)對(duì)用戶可能是“灰箱”甚至“黑箱”。FME使用戶可以根據(jù)特殊需求,提取相同數(shù)據(jù)源的不同內(nèi)容,而不是以單一格式輸入和輸出數(shù)據(jù)。當(dāng)在系統(tǒng)間數(shù)據(jù)模型的存在極大的語(yǔ)義異構(gòu)時(shí),例如CAD系統(tǒng)和GIS系統(tǒng),這一技術(shù)顯得特別實(shí)用。在ArcGIS中,數(shù)據(jù)互操作擴(kuò)展模塊在結(jié)構(gòu)上進(jìn)行了更新,使用戶可以用可視化的方式導(dǎo)入導(dǎo)出大部分?jǐn)?shù)據(jù)格式,并且該擴(kuò)展可以基于屬性值輸出多個(gè)數(shù)據(jù)集。
2.1可視化轉(zhuǎn)換模型理論基礎(chǔ)
FME進(jìn)行轉(zhuǎn)換使用了與傳統(tǒng)轉(zhuǎn)換不同的技術(shù),它實(shí)現(xiàn)了“語(yǔ)義轉(zhuǎn)換”。語(yǔ)義轉(zhuǎn)換提供了一個(gè)引擎,能夠分別對(duì)輸入或輸出數(shù)據(jù)重新進(jìn)行定義。支持這個(gè)引擎的是FME所提供的一個(gè)非常豐富的數(shù)據(jù)模型,它比各種專用格式所支持的數(shù)據(jù)模型要更豐富,并且具有內(nèi)部一致性和可擴(kuò)展性,從而實(shí)現(xiàn)很高程度的數(shù)據(jù)重新定義。它不是簡(jiǎn)單的從一種格式到另一種格式的轉(zhuǎn)換,而是完全在一種通用格式上工作,并且注重提供各種模塊來(lái)幫助用戶操縱數(shù)據(jù)并轉(zhuǎn)換為需要的形式,其中格式的改變只是數(shù)據(jù)轉(zhuǎn)換過(guò)程中的一小部分工作。FME通過(guò)其內(nèi)置的“函數(shù)”和“分類機(jī)”提供了一系列的數(shù)據(jù)處理功能。這些功能可以用于在數(shù)據(jù)轉(zhuǎn)換的過(guò)程中進(jìn)行圖形數(shù)據(jù)的操作(如構(gòu)面或連線),或生成新的屬性(如長(zhǎng)度或面積)。
FME語(yǔ)義映射通過(guò)構(gòu)造語(yǔ)義映射文件來(lái)實(shí)現(xiàn),它應(yīng)用的是一種宏語(yǔ)言,很多映射文件要引用輸入數(shù)據(jù)集、輸出數(shù)據(jù)集,或者其他映射文件。語(yǔ)義映射文件的內(nèi)容一般包括:讀寫器定義及其配置、要素表、函數(shù)、要素動(dòng)態(tài)生成器4部分,其中最靈活的是要素表。用戶可以根據(jù)目標(biāo)數(shù)據(jù)的要求選擇不同的分類器,軟件將在調(diào)用映射文件時(shí)按照要素表選用的函數(shù)順序執(zhí)行轉(zhuǎn)換。Feature表是用來(lái)描述要素類特征和控制要素類行為的,是按照目標(biāo)數(shù)據(jù)的格式設(shè)計(jì)的控制文件。Feature表包括兩部分內(nèi)容:一部分用于描述要素類特征,具備這些特征的都屬于同一要素類;另一部分是附加部分,例如在進(jìn)行數(shù)據(jù)轉(zhuǎn)換時(shí),需要調(diào)入地理信息系統(tǒng)的目標(biāo)數(shù)據(jù)所需的某些屬性在源數(shù)據(jù)中沒(méi)有體現(xiàn),那么就要在轉(zhuǎn)換前在語(yǔ)義映射文件中添加。
2.2可視化轉(zhuǎn)換模型構(gòu)造
可視化轉(zhuǎn)換模型構(gòu)造的特點(diǎn)就是在工作臺(tái)中以可視化的方式構(gòu)造映射文件。可視化轉(zhuǎn)換模型構(gòu)造流程首先,需要?jiǎng)?chuàng)建空間ETL工具,一旦工具被創(chuàng)建,工作臺(tái)將呈現(xiàn),這是用于可視化數(shù)據(jù)轉(zhuǎn)換建模的工作環(huán)境。模型構(gòu)建的第一步是選擇源數(shù)據(jù)及其格式。對(duì)AutoCAD,系統(tǒng)支持DXF、DWG、DWF以及SDL格式,在數(shù)據(jù)類別選擇中的搜索文本框中輸入“auto”,這將在列表過(guò)濾CAD的相關(guān)數(shù)據(jù)格式。通常使用的文件格式是DXF和DWG。其次是選擇目標(biāo)數(shù)據(jù)和格式。在ArcGIS的該擴(kuò)展模塊中,基本支持ESRI公司的所有數(shù)據(jù)格式,包括SHP、EOO、ADF、MDB、GEN,以及網(wǎng)絡(luò)數(shù)據(jù)庫(kù)ARCSDE格式。源數(shù)據(jù)和目的數(shù)據(jù)確定后,即進(jìn)入可視化操作平臺(tái)(workbench),該平臺(tái)提供了數(shù)據(jù)庫(kù)、屬性、列表等12類近270個(gè)轉(zhuǎn)換模型,這些模型可以通過(guò)WINDOWS中典型的“拖”和“拉”的方式將源數(shù)據(jù)和目標(biāo)數(shù)據(jù)連接起來(lái),它們即可以“并聯(lián)”使用,也可以“串聯(lián)”使用,也不限于單一的源或目標(biāo)數(shù)據(jù)。平臺(tái)模型構(gòu)造完成后,可以在平臺(tái)內(nèi)直接運(yùn)行模型,并以圖形的方式察看轉(zhuǎn)換結(jié)果,針對(duì)結(jié)果調(diào)整數(shù)據(jù)流動(dòng)的過(guò)程和模型的參數(shù),最后達(dá)到轉(zhuǎn)換的目標(biāo)。
3.結(jié)束語(yǔ)
ArcGIS數(shù)據(jù)互操作擴(kuò)展模塊幫助用戶在各種類型的數(shù)據(jù)間建立了橋梁,通過(guò)新的空間ETL工具,讓我們可以進(jìn)行復(fù)雜的數(shù)據(jù)轉(zhuǎn)換。其可視化的操作平臺(tái)簡(jiǎn)化了數(shù)據(jù)轉(zhuǎn)換的難度,提高了轉(zhuǎn)換的效率和精確度,是CAD數(shù)據(jù)和GIS數(shù)據(jù)進(jìn)行轉(zhuǎn)換的理想方法。從更長(zhǎng)遠(yuǎn)的目標(biāo)看,不同數(shù)據(jù)格式之間的無(wú)縫共享是最終的解決方法,這時(shí)數(shù)據(jù)格式的問(wèn)題不再是用戶需要考慮的對(duì)象,無(wú)論什么格式的數(shù)據(jù)都可以在單一軟件內(nèi)進(jìn)行無(wú)縫的互操作,就如同操作原生格式一樣。
【參考文獻(xiàn)】
[1]陳年松.基于FME的CAD與GIS數(shù)據(jù)共享研究[D].南京:南京師范大學(xué),2008.
[2]陳影,程耀東,閆浩文.利用FME進(jìn)行GIS數(shù)據(jù)的無(wú)損轉(zhuǎn)換[J].測(cè)繪科學(xué),2007(2).
[3]徐昌榮,沈晶,施魁元.基于FME的GIS互操作探討[J].江西理工大學(xué)學(xué)報(bào),2006(3).