徐少坤,宋國(guó)民,王海葳,陳令羽
(1.信息工程大學(xué) 地理空間信息學(xué)院,河南 鄭州 450052;2.75719部隊(duì),湖北 武漢 430074)
地理空間元數(shù)據(jù)有助于用戶從海量數(shù)據(jù)中快速、準(zhǔn)確地發(fā)現(xiàn)、訪問(wèn)、獲取和使用所需的數(shù)據(jù)。元數(shù)據(jù)的自動(dòng)搜索方法可以提高數(shù)據(jù)的使用效率,但也存在以下不足:搜索的結(jié)果通常以列表的形式顯示,用戶還要在搜索結(jié)果中進(jìn)行“二次檢索”;當(dāng)用戶不能準(zhǔn)確描述所需信息時(shí),無(wú)法獲得數(shù)據(jù)的整體概況。提高元數(shù)據(jù)搜索的可用性和有效性已成為一個(gè)突出問(wèn)題。
信息可視化將元數(shù)據(jù)集的空間、屬性和時(shí)間的外部形式和內(nèi)部特征等抽象數(shù)據(jù),以人能感知的形式表現(xiàn)出來(lái)。用戶可以選擇合適的元數(shù)據(jù)要素來(lái)探索和比較不同的數(shù)據(jù)集,同時(shí)改變參數(shù)來(lái)瀏覽所有可用的元數(shù)據(jù)資源,提高檢索效率。
信息可視化(Information Visualization)是將抽象數(shù)據(jù)用可視的形式表示出來(lái),用于揭示抽象信息之間的關(guān)系和信息中隱藏的特征[1]。Card等人提出了信息可視化的參考模型(見(jiàn)圖1),將可視化概括為從數(shù)據(jù)到可視化形式再到人的感知系統(tǒng)可調(diào)節(jié)的映射[2]。數(shù)據(jù)檢索是信息可視化的核心,目的在于形象化地表達(dá)信息,發(fā)現(xiàn)新的知識(shí),識(shí)別信息在結(jié)構(gòu)、模式、非規(guī)則、趨勢(shì)等方面的規(guī)律。
圖1 信息可視化參考模型
信息可視化作為可視化研究的新領(lǐng)域,廣泛應(yīng)用于知識(shí)發(fā)現(xiàn)、信息檢索、數(shù)字圖書館和信息理解等方面。綜合起來(lái),其研究主要集中在以下幾個(gè)方面。
1)層次信息可視化。層次信息可視化最直觀的形式是樹(shù)型結(jié)構(gòu)。其研究重點(diǎn)在于既要獲得整體層次結(jié)構(gòu),又要便于快速查找所需節(jié)點(diǎn),并用更多的可視空間來(lái)顯示用戶關(guān)注的信息。應(yīng)用廣泛的有圓錐樹(shù)、雙曲線樹(shù)、圓形嵌套[3]等。
2)多維信息可視化。將多維度、多屬性的信息映射為直觀的形式是信息可視化的重要目標(biāo)。特別是在數(shù)據(jù)倉(cāng)庫(kù)和信息挖掘中,一般采用坐標(biāo)變換、嵌套以及多視圖等技術(shù)將多維信息映射到二維平面或三維空間中[4]。代表性的有散點(diǎn)圖、平行坐標(biāo)和自組織映射[5]等。
3)文本信息可視化。利用可視化技術(shù)快速地從海量文本信息中獲取所需的內(nèi)容和知識(shí),也是信息可視化關(guān)注的目標(biāo)。根據(jù)文本內(nèi)容的大小,文本信息可視化分為單文檔可視化和大型文檔集合可視化。
4)Web可視化。Web信息空間呈網(wǎng)狀結(jié)構(gòu),Web可視化的研究?jī)?nèi)容包括信息搜索的可視界面、網(wǎng)頁(yè)導(dǎo)航和布局以及網(wǎng)絡(luò)節(jié)點(diǎn)的動(dòng)態(tài)顯示和交互控制[6]。根據(jù)網(wǎng)站的規(guī)模,Web可視化可分為單網(wǎng)站可視化和網(wǎng)站集合可視化。清華大學(xué)網(wǎng)站可視圖是比較典型的Web可視化例子[7]。
地理空間元數(shù)據(jù)是指地理空間數(shù)據(jù)集和相關(guān)信息資源的描述信息,是對(duì)空間特征的概括和抽?。?]。許多國(guó)家、研究機(jī)構(gòu)都制定了相關(guān)的元數(shù)據(jù)標(biāo)準(zhǔn),代表性的有美國(guó)聯(lián)邦數(shù)據(jù)委員會(huì)起草的CSDGM和國(guó)際標(biāo)準(zhǔn)化組織制定的ISO/FDIS 19115。
大部分的元數(shù)據(jù)服務(wù)僅作為一個(gè)功能模塊集成在各種GIS平臺(tái)上,只提供簡(jiǎn)單的數(shù)據(jù)查詢與顯示服務(wù)。將可視化應(yīng)用于地理空間元數(shù)據(jù)服務(wù)是一個(gè)新思路,國(guó)內(nèi)在這方面的研究較少。應(yīng)用成熟的有“香港賽馬會(huì)滑坡防治與咨詢中心”項(xiàng)目,該項(xiàng)目將元數(shù)據(jù)信息以圖的形式表達(dá)出來(lái),使用戶提前知道所需數(shù)據(jù)的存在狀況[9]。
國(guó)外的地理空間元數(shù)據(jù)服務(wù)發(fā)展比較成熟,在理論模型、可視化技術(shù)和應(yīng)用工具等方面已進(jìn)行深入研究。Card等人認(rèn)為:“元數(shù)據(jù)與其他知識(shí)結(jié)構(gòu)中的復(fù)雜數(shù)據(jù),都是高維多變量的,信息可視化技術(shù)可以輔助其發(fā)現(xiàn)規(guī)律”[10]。Kraak和Ormeling提出地理空間元數(shù)據(jù)的可視化環(huán)境體現(xiàn)在3個(gè)方面:地理可視化、多元可視化及設(shè)計(jì)以人為中心的可視化[11]。Yang,Ward和Rundensteiner等提出交互式層次顯示技術(shù)將是海量數(shù)據(jù)顯示的有效工具[12]。
在地理空間元數(shù)據(jù)可視化設(shè)計(jì)過(guò)程中,任務(wù)需求、用戶和元數(shù)據(jù)規(guī)格參數(shù)是影響數(shù)據(jù)搜索的3大因素[13]。
1)地理空間元數(shù)據(jù)可視化的任務(wù)需求。用戶不同的任務(wù)需求,對(duì)元數(shù)據(jù)的關(guān)注點(diǎn)和要素的選擇也不盡相同。在元數(shù)據(jù)的搜索過(guò)程中,這會(huì)影響可視化表現(xiàn)形式、可視化應(yīng)用模式和搜索精度。用戶在評(píng)價(jià)某一數(shù)據(jù)集是否滿足需求時(shí),需要權(quán)衡多個(gè)準(zhǔn)則進(jìn)行判斷,不同的任務(wù)需求,決定因素和要素的權(quán)重值也各不相同[14]。比如,以研究分析為目的,會(huì)注重于數(shù)據(jù)的現(xiàn)勢(shì)性和真實(shí)性;以量測(cè)為目的,會(huì)注重于數(shù)據(jù)精度和空間準(zhǔn)確性;數(shù)據(jù)的管理則更關(guān)注管理成本和用戶權(quán)限。
2)地理空間元數(shù)據(jù)服務(wù)的用戶。大部分的元數(shù)據(jù)用戶也是GIS應(yīng)用程序的用戶,這些用戶涵蓋從商業(yè)程序的最終用戶到新環(huán)境、新語(yǔ)言的研究者。另外,程序和軟件開(kāi)發(fā)者、數(shù)據(jù)管理者、數(shù)據(jù)生產(chǎn)商也會(huì)使用元數(shù)據(jù)。針對(duì)各種類型的用戶,分析其需求和關(guān)注點(diǎn),以滿足其不同層次、不同階段的服務(wù)需求。
3)地理空間元數(shù)據(jù)的規(guī)格參數(shù)。為滿足廣泛的應(yīng)用需求,地理空間元數(shù)據(jù)標(biāo)準(zhǔn)制定了詳細(xì)的元數(shù)據(jù)要素。但并不是所有要素都有明確的意義,都值得用戶去關(guān)注。要根據(jù)用戶類型和任務(wù)需求,結(jié)合元數(shù)據(jù)的規(guī)格參數(shù),分析用戶可能關(guān)注的元數(shù)據(jù)要素,并提供相似的要素滿足其潛在的需求。
地理空間元數(shù)據(jù)的可視化技術(shù),根據(jù)元數(shù)據(jù)要素的個(gè)數(shù)可分為單要素可視化和多要素可視化。
2.2.1 單要素可視化技術(shù)
地理空間元數(shù)據(jù)單要素的可視化,可以采用傳統(tǒng)的信息可視化方法,如條形統(tǒng)計(jì)圖、柱狀圖、折線圖、餅圖、散點(diǎn)圖、顏色編碼等。
對(duì)于簡(jiǎn)單的二維數(shù)據(jù),散點(diǎn)圖(scatterplot)是比較常見(jiàn)的可視化方法。例如,2個(gè)元數(shù)據(jù)要素,可以映射為二維坐標(biāo)上的一系列點(diǎn),進(jìn)而獲得數(shù)據(jù)的整體趨勢(shì)。柱狀圖是數(shù)據(jù)比較的有效形式,能直觀地顯示單一要素的分布情況,不同顏色的柱狀更利于數(shù)據(jù)的快速選擇和整體趨勢(shì)的有效反映。
單要素可視化形式多樣,結(jié)構(gòu)簡(jiǎn)單。可通過(guò)分析各種形式的特點(diǎn),對(duì)元數(shù)據(jù)單要素采用合適的表現(xiàn)形式;同時(shí)可將多種可視化形式組合起來(lái),為用戶提供潛在的、相關(guān)的信息。
2.2.2 多要素可視化技術(shù)
地理空間元數(shù)據(jù)多要素可視化一般是指3個(gè)或3個(gè)以上元數(shù)據(jù)要素的可視化,其表現(xiàn)形式要求既能清晰地反映大數(shù)據(jù)集的整體趨勢(shì),又能快速查找所需的元數(shù)據(jù)??蓱?yīng)用于地理空間元數(shù)據(jù)可視化的技術(shù)主要有以下幾種:
2.2.2.1 多維可視化技術(shù)
1)散點(diǎn)圖矩陣。對(duì)散點(diǎn)圖進(jìn)行適當(dāng)?shù)母倪M(jìn),可用于元數(shù)據(jù)多要素的可視化表達(dá)。其中一種方法是把元數(shù)據(jù)的每個(gè)要素,用不同的圖形、顏色、紋理等表示在二維坐標(biāo)上。
散點(diǎn)圖矩陣(見(jiàn)圖2)也是一種有效的可視化方式。它將元數(shù)據(jù)多個(gè)要素兩兩組合作為矩陣中的一個(gè)元素,在每一矩陣中繪制相應(yīng)要素的散點(diǎn)圖,從各個(gè)要素屬性的兩兩比較中得到隱含的信息。散點(diǎn)圖矩陣是區(qū)別元數(shù)據(jù)整體趨勢(shì)和局部特征的簡(jiǎn)單方法,能直觀地解釋所有任意2個(gè)要素之間的關(guān)系,而不受數(shù)據(jù)集大小和要素個(gè)數(shù)的限制[5]。
圖2 散點(diǎn)圖矩陣
2)平行坐標(biāo)。平行坐標(biāo)(見(jiàn)圖3)是在二維空間中采用等距離、豎直多條平行坐標(biāo)軸表示多維空間,坐標(biāo)軸取值范圍從相應(yīng)數(shù)據(jù)維屬性的最小值到最大值均勻分布。平行坐標(biāo)中數(shù)據(jù)關(guān)系的表達(dá)直觀,易于理解,有助于發(fā)現(xiàn)大規(guī)模數(shù)據(jù)之間復(fù)雜關(guān)系。
圖3 平行坐標(biāo)
平行坐標(biāo)將用戶搜索的元數(shù)據(jù)要素映射為平行坐標(biāo)軸,根據(jù)關(guān)鍵詞的重要性設(shè)置相應(yīng)的坐標(biāo)軸順序。搜索結(jié)果以各個(gè)軸之間的連線顯示,用戶可交互式地添加或刪除要素。當(dāng)數(shù)據(jù)量比較大時(shí),坐標(biāo)軸之間的線可能比較多,要素間的關(guān)系會(huì)模糊不清,可對(duì)線進(jìn)行半透明化處理[15],其顏色的深淺反映元數(shù)據(jù)的趨勢(shì)特征;當(dāng)數(shù)據(jù)量較少時(shí),平行坐標(biāo)有利于用戶快速查找所需的結(jié)果。
散點(diǎn)圖和平行坐標(biāo)的結(jié)合可以獲得整體趨勢(shì)和局部特征的優(yōu)化形式。在平行坐標(biāo)軸之間顯示散點(diǎn)圖,軸之間的直線變成穿過(guò)散點(diǎn)圖的曲線,這樣既保持了平行坐標(biāo)里的連接關(guān)系,又能用散點(diǎn)圖表示平行坐標(biāo)里無(wú)法表現(xiàn)的數(shù)據(jù)趨勢(shì)[16]。
2.2.2.2 圖標(biāo)顯示技術(shù)
基本思路是用多個(gè)可視特征圖標(biāo)來(lái)表示多維信息,圖標(biāo)每一個(gè)可視特征表示多維信息中一維,該方法適合為數(shù)不多并且在二維平面上具有良好展開(kāi)特性的數(shù)據(jù)集[5]。常用的圖標(biāo)顯示技術(shù)有Chernoff面法和星繪法。Chernoff面法中面部表情不適合量化分析,并且容易干擾用戶對(duì)數(shù)據(jù)的理解,所以Chernoff面法在元數(shù)據(jù)可視化方面應(yīng)用較少。
1)星繪法。星繪法(見(jiàn)圖4)是從一點(diǎn)向外等角度地繪制發(fā)散的線段,線段的長(zhǎng)度表示要素屬性值的大小,連接各條線段的終點(diǎn)形成星狀的圖形。元數(shù)據(jù)多要素可視化時(shí),將要素的屬性值對(duì)應(yīng)為輻條的長(zhǎng)度,數(shù)據(jù)集以相應(yīng)的星狀圖表示。星狀圖越完整,形狀越大,表示數(shù)據(jù)越符合設(shè)定的需求。
圖4 星繪法
Elena,F(xiàn)anea等提出了Parallel-Glyphs方法[17],將星繪法與平行坐標(biāo)結(jié)合起來(lái),取得了較好的可視效果。
2.2.2.3 層次可視化技術(shù)
對(duì)于海量數(shù)據(jù)的表達(dá),層次可視化技術(shù)是顯示不同層次、大規(guī)模數(shù)據(jù)的有效工具。層次可視化技術(shù)可以為某個(gè)主題的要素屬性提供相關(guān)信息的整體概覽,并將更多的可視空間分配給用戶關(guān)注的部分分支。應(yīng)用比較廣泛的有空間樹(shù)和雙曲線樹(shù)。
1)空間樹(shù)。空間樹(shù)(見(jiàn)圖5)是采用點(diǎn)—線形式和收縮—展開(kāi)方法來(lái)實(shí)現(xiàn)層次結(jié)構(gòu)的可視化技術(shù)[3]。當(dāng)用戶點(diǎn)擊相應(yīng)分支時(shí),就展開(kāi)下一級(jí)分支信息,可用顏色和形狀標(biāo)記焦點(diǎn)和根節(jié)點(diǎn)之間路徑。
圖5 空間樹(shù)
2)雙曲線樹(shù)。雙曲線樹(shù)(見(jiàn)圖6)是一種利用雙曲平面布局和“焦點(diǎn)+上下文”的可視化技術(shù),將用戶關(guān)注的細(xì)節(jié)顯示在平面中心,保證整個(gè)層次結(jié)構(gòu)的完全顯示。例如,對(duì)“延坪島炮擊事件”進(jìn)行可視化,可將延坪島作為根節(jié)點(diǎn),其海島地理位置、地形狀況和周邊海域水文狀況等都可以作為其子節(jié)點(diǎn),子節(jié)點(diǎn)可繼續(xù)擴(kuò)展到軍事設(shè)施分布、數(shù)據(jù)更新時(shí)間、數(shù)據(jù)來(lái)源等下一層次信息。用戶點(diǎn)擊相應(yīng)節(jié)點(diǎn)可使其顯示在中心位置,獲得放大的局部信息。
圖6 雙曲線樹(shù)
地理空間元數(shù)據(jù)可視化應(yīng)用流程可以描述為“先總體瀏覽,再移動(dòng)和過(guò)濾,最后放大所需信息”。如圖7所示,圖7中a表示用戶在使用地理空間元數(shù)據(jù)庫(kù)時(shí),首先會(huì)限定搜索范圍,如用戶輸入感興趣區(qū)域的名稱或在地圖上選擇特定的位置或范圍。在搜索結(jié)果中,用戶可根據(jù)需要在界面上選擇關(guān)鍵的元數(shù)據(jù)要素,確定優(yōu)先考慮的選項(xiàng)(見(jiàn)圖7中b)。系統(tǒng)會(huì)根據(jù)用戶選擇的要素,繪制所需元數(shù)據(jù)要素的可視化視圖,其中圖7中c顯示了星繪法和平行坐標(biāo)法2種可視化形式。用戶可以交互式地刷新和選擇元數(shù)據(jù)視圖,也可以根據(jù)需要打開(kāi)或關(guān)閉不同的可視化視圖,直到找到合適的數(shù)據(jù)集,并在地圖上研究其地理內(nèi)容。數(shù)據(jù)集的內(nèi)容以圖像和文本元數(shù)據(jù)的形式提供給用戶,圖7中d顯示了地圖和元數(shù)據(jù)要素列表兩種形式。
圖7 地理空間元數(shù)據(jù)可視化應(yīng)用流程[13]
隨著測(cè)控技術(shù)和互聯(lián)網(wǎng)絡(luò)的發(fā)展,人類獲取的空間信息數(shù)量呈幾何級(jí)增長(zhǎng),豐富的空間信息資源促進(jìn)基礎(chǔ)地理信息建設(shè)和元數(shù)據(jù)服務(wù)的日益完善。因此,面對(duì)海量數(shù)據(jù),高效、準(zhǔn)確的空間數(shù)據(jù)檢索將是影響數(shù)據(jù)服務(wù)和信息共享的重要因素。
信息可視化技術(shù)作為揭示抽象信息之間關(guān)系和特征的有力工具,有助于提高元數(shù)據(jù)服務(wù)的有效性和可用性。元數(shù)據(jù)服務(wù)的發(fā)展趨勢(shì)將以信息可視化技術(shù)為基礎(chǔ),結(jié)合地理空間元數(shù)據(jù)的特點(diǎn),分析元數(shù)據(jù)可視化的影響因素和應(yīng)用流程,為不同類型、不同需求的用戶,提供高效可靠的解決方案。
[1]馮藝東,汪國(guó)平,董士海.信息可視化[J].工程圖學(xué)學(xué)報(bào),2001(2):324-329.
[2]Card S,Mackinlay J,Shneiderman B.Readings in information visualization:using vision to think[R].San Francisco:Morgan Kaufmann,1999.
[3]肖衛(wèi)東,孫揚(yáng).層次信息可視化技術(shù)研究綜述[J].小型微型計(jì)算機(jī)系統(tǒng),2011(1):137-146.
[4]程時(shí)偉,孫守遷.信息可視化研究綜述[J].中國(guó)科技論文在線.http://www.paper.edu.cn
[5]孫揚(yáng),封孝生,唐九陽(yáng),等.多維可視化技術(shù)綜述[J].計(jì)算機(jī)科學(xué),2008,35(11):1-7,59.
[6]張馳,羅鐵堅(jiān),王相根.基于Web的信息可視化系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2009(12):324-329.
[7]周寧,吳佳鑫,張少龍.基于圖的Web信息可視化探析[J].情報(bào)學(xué)報(bào),2008,27(5):714-720.
[8]汪小林,羅英偉,叢升日,等.空間元數(shù)據(jù)研究及應(yīng)用[J].計(jì)算機(jī)研究與發(fā)展,2001,38(3):321-326.
[9]李軍.地球空間元數(shù)據(jù)的使用研究[J].地球信息科學(xué),2000(9):8-13.
[10]Lbertoni,R,Bertone.Knowledge extraction by visual data mining of metadata in site planning[C].Proceedings of Ninth Scandinavian Research Conference on Geographical Information Siences,Espoo:5-166.
[11]Aula Ahonen-Rainio.Visalization of geospatial metadata for selecting geographic datasets[D].Helsinki University of Technology,2005.
[12]Yang,J,Ward,M O.Rundenstein.Interactive hierarchical displays:ageneral framework for visualization and exploration of large multivariate data sets[J].Computers&Geosciences,2003(27):265-283.
[13]J Dykes,A M MacEachren,M J Kraak.Towards Multivariate Visualization of Metadata Describing Geographic Information[M].Exploring Geovisualization,2005.
[14]Potjo Tsoene.Visualizations of metadata in a GDI environment[D].International Institute for Geo-information Science and Earth Observation.2004.
[15]Chad Jones,et al.An Integrated Exploration Approach to Visualizing Multivariate Particle Data[J].Computing in Science &Engineering,2008,10(4):20-29.
[16]Xiaoru Yuan,et al.Scattering Points in Parallel Coordinates[J].IEEE Transactions on Visualzation and Computer Graphics.2009,15(6).
[17]Fanea E.An Interactive 3D Integration of Parallel Coordinates and Star Glyphs[R].IEEE Symposium on Information Visualization 2005.