王遠(yuǎn)帆 張世良
摘要:大數(shù)據(jù)時(shí)代的到來以及網(wǎng)絡(luò)科學(xué)的發(fā)展,使得空間交互研究成為目前信息科學(xué)領(lǐng)域的研究熱點(diǎn)。以往的研究和分析方法已經(jīng)不是那么適用于基于大數(shù)據(jù)的所得到的空間交互數(shù)據(jù)。本文針對(duì)空間交互可視化、距離衰減方法、粒子群優(yōu)化算法及BGLL算法等進(jìn)行研究和實(shí)現(xiàn)??臻g交互可視化的研究對(duì)于認(rèn)識(shí)許多社會(huì)經(jīng)濟(jì)現(xiàn)象,理解空間在其中發(fā)揮的作用是十分重要的。
關(guān)鍵詞:空間交互;距離衰減;BGLL算法;可視化
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)19-0008-02
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
空間交互的研究對(duì)于人們認(rèn)識(shí)許多社會(huì)經(jīng)濟(jì)現(xiàn)象,理解空間在其中發(fā)揮的作用是十分重要的。由于大數(shù)據(jù)時(shí)代所帶來的便利,我們現(xiàn)在可以輕松地獲取不同尺度上的空間交互數(shù)據(jù)。但是同樣由于大數(shù)據(jù)的大量、高速、多樣化等特點(diǎn),我們獲取到的空間交互數(shù)據(jù)也往往是海量的、多樣化的。以往的研究和分析方法已經(jīng)不是那么適用于基于大數(shù)據(jù)的所得到的空間交互數(shù)據(jù)。那么為了能更好地利用大數(shù)據(jù)時(shí)代提供給我們的便利,更好地進(jìn)行關(guān)于空間交互作用的研究,如何研究和分析這種包含了“大數(shù)據(jù)”特點(diǎn)的空間交互數(shù)據(jù),是目前十分重要且亟待解決的問題[1]。本文從可視化、距離影響、社區(qū)發(fā)現(xiàn)等方面出發(fā),總結(jié)目前基于大數(shù)據(jù)的空間交互研究,應(yīng)用實(shí)際數(shù)據(jù)進(jìn)行了相關(guān)的空間交互研究并對(duì)結(jié)果進(jìn)行評(píng)價(jià)。
數(shù)據(jù)可視化技術(shù)指的是運(yùn)用計(jì)算機(jī)圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換為圖形或圖像在屏幕上顯示出來,并進(jìn)行交互處理的理論、方法和技術(shù)。它涉及計(jì)算機(jī)圖形學(xué)、圖像處理、計(jì)算機(jī)輔助設(shè)計(jì)、計(jì)算機(jī)視覺及人機(jī)交互等多個(gè)領(lǐng)域[2]??臻g交互數(shù)據(jù)的可視化主要關(guān)注數(shù)據(jù)的顯示方面,而流地圖則是表現(xiàn)空間交互數(shù)據(jù)的一種最常用的表現(xiàn)形式。流地圖中的點(diǎn)是根據(jù)實(shí)際地理位置固定的,代表實(shí)際的地點(diǎn);流地圖中使用直線或者曲線來連接起點(diǎn)和終點(diǎn),代表起點(diǎn)和終點(diǎn)之間的流。流地圖能夠使人清晰、快速地理解所要表達(dá)的流的含義、大小、方向等,能夠直觀地展示出流的空間模式。但是隨著數(shù)據(jù)規(guī)模的增大,大量的線之間的交叉以及覆蓋使得流地圖很快的失去它的有效性。
1 算法分析
1.1 距離衰減方法
空間交互的三大基礎(chǔ):互補(bǔ)性、可轉(zhuǎn)移性和干擾機(jī)會(huì)[3]。其中可轉(zhuǎn)移性和干擾機(jī)會(huì)都是與距離相關(guān)的,可見距離對(duì)于空間交互的影響應(yīng)該是十分巨大的,而這種影響就是距離衰減。在空間交互中,隨著距離的增長,交互強(qiáng)度相應(yīng)減弱,這種現(xiàn)象稱為距離衰減。距離衰減有宏觀和微觀兩個(gè)層面的表現(xiàn)形式:宏觀層面上,由于距離衰減,兩個(gè)地理實(shí)體之間的交互總量在其他變量相對(duì)穩(wěn)定的情況下,與距離表現(xiàn)為負(fù)關(guān)系;微觀層面上,在不考慮其他影響因素下,由于距離衰減,單個(gè)目標(biāo)移動(dòng)到不同目的地的概率與距離呈負(fù)相關(guān)。距離衰減的形成可以從與之相關(guān)的空間交互的兩個(gè)基礎(chǔ)上找原因。首先,根據(jù)可轉(zhuǎn)移性,空間移動(dòng)的成本與距離成正相關(guān),為了最小化成本,需要降低長距離交互的強(qiáng)度;其次,在交互目的地的選擇過程中,由于干擾機(jī)會(huì)的存在,降低了長距離交互的概率。目前根據(jù)實(shí)際交互強(qiáng)度來求解距離衰減系數(shù)的方法主要可以分為兩種,根據(jù)實(shí)際交互強(qiáng)度來求解距離衰減系數(shù)的方法主要可以分為兩種;一是通過公式推導(dǎo)或問題轉(zhuǎn)換的方法來計(jì)算出距離衰減系數(shù)解析值,稱為解析法;另一種是通過給定的假設(shè)條件,由計(jì)算機(jī)給定的假設(shè)條件,由計(jì)算機(jī)模擬大量的重復(fù)實(shí)驗(yàn),得到符合條件的距離衰減函數(shù)值,稱模擬法。
1.2粒子群優(yōu)化算法
PSO算法求解重力模型也是基于逆重力模型的,思路是把估算節(jié)點(diǎn)規(guī)模的問題轉(zhuǎn)化為優(yōu)化問題[4]。對(duì)于包含n個(gè)節(jié)點(diǎn)的空間交互網(wǎng)絡(luò),粒子Xi被定義為Xi={PI,P2,-Pn},□□是每個(gè)節(jié)點(diǎn)的規(guī)模。初始化一群粒子后,給定距離衰減系數(shù)B,并求出相應(yīng)的規(guī)模估算結(jié)果。在給定不同的B得到的結(jié)果中,選取估算結(jié)果最優(yōu)的p值。粒子群優(yōu)化算法( Particle Swarm Optimi-zation,PSO)是KennedY等(Kennedy et al.,1995)受鳥群捕食行為的啟發(fā),提出的一種隨機(jī)搜索算法。它將優(yōu)化問題的每一個(gè)解看作一個(gè)粒子,初始時(shí)每個(gè)粒子都獲得一個(gè)隨機(jī)的位置和初始速度。下一時(shí)刻的位置由當(dāng)前位置和速度決定,而速度則是與所有粒子中最優(yōu)的那個(gè)粒子有關(guān)。粒子通過不停迭代直到找到滿足給定的擬合優(yōu)度的最佳位置,即最優(yōu)解。
算法描述如下:
a)相關(guān)定義:首先,我們進(jìn)行如下定義:粒子Xi={P1,P2,-Pn},其中Pi是每個(gè)節(jié)點(diǎn)的規(guī)模;粒子速度Vi={VI,V2,…Vn};實(shí)際觀測(cè)到的交互流量{T},其中每一個(gè)Tij是實(shí)際觀測(cè)到的節(jié)點(diǎn)i、j之間的交互流量;計(jì)算得到的交互流量{T'),其中每一個(gè)Tij是根據(jù)當(dāng)前粒子中的節(jié)點(diǎn)規(guī)模,由重力模型算出來i、j之間的交互流量;
b)擬合優(yōu)度(fitness value)評(píng)價(jià)函數(shù)fv0,輸入實(shí)際交互流量{T}和由粒子Xi計(jì)算得到的交互流量{T'},返回兩者之間的相似度,作為評(píng)價(jià)粒子Xi的指標(biāo)。實(shí)質(zhì)是一個(gè)求皮爾遜相關(guān)系數(shù)的函數(shù);第i個(gè)粒子所找到的最優(yōu)解pBesti_ {P1,P2,…,Pn),其中pi是每個(gè)節(jié)點(diǎn)的規(guī)模;第i個(gè)粒子所找到的最優(yōu)解的擬合優(yōu)度pBestFVi,記錄pBesti的擬合優(yōu)度值;整個(gè)粒子群所找到的最優(yōu)解gBest=(P1,P2 -,Pn},其中Pi是每個(gè)節(jié)點(diǎn)的規(guī)模;第i個(gè)粒子所找到的最優(yōu)解的擬合優(yōu)度gBestFV,記錄gBest的擬合優(yōu)度值。
1.3 BGLL算法
BGLL算法是Blondel、Guillaume、Lambiotte和Lefebvre提出的一種基于模塊度優(yōu)化的社區(qū)發(fā)現(xiàn)的算法。它的運(yùn)行效率極高,即使是大型的復(fù)雜網(wǎng)絡(luò),也能很快得出結(jié)果;與此同時(shí),結(jié)果的模塊度也往往較高[5]。在計(jì)算結(jié)果與實(shí)際情況的對(duì)比中發(fā)現(xiàn),該算法發(fā)現(xiàn)的社區(qū)的準(zhǔn)確度也是極高的。更值得一提的是,該算法的結(jié)果是一個(gè)分層級(jí)的社區(qū)集合序列,可以得到不同空間尺度上的社區(qū)發(fā)現(xiàn)結(jié)果。
該算法分為兩個(gè)部分:
第一部分的步驟如下:
1)給定一個(gè)N個(gè)頂點(diǎn)的帶權(quán)圖,首先把每一個(gè)頂點(diǎn)都標(biāo)記為不同的社區(qū),即一共有N個(gè)社區(qū);
2)對(duì)于每一個(gè)頂點(diǎn)i,我們考慮與i相鄰的每一個(gè)頂點(diǎn)j。計(jì)算把i從i的社區(qū)中刪除并加入j的社區(qū)所帶來的模塊度的變化。如果存在一個(gè)最大的模塊度的增加,那么就把i加入那個(gè)j的社區(qū);如果結(jié)果都是模塊度減少,那么i就仍在原社區(qū)中:
3)重復(fù)步驟2)直到模塊度不再增加,第一部分結(jié)束。
至此,我們達(dá)到了一個(gè)局部上的最優(yōu),單個(gè)頂點(diǎn)的變動(dòng)已經(jīng)不能再使模塊度增加。
進(jìn)行第二部分:
1)將第一部分得到結(jié)果中的社區(qū)轉(zhuǎn)變?yōu)轫旤c(diǎn)。新的頂點(diǎn)之間邊的權(quán)重是對(duì)應(yīng)的兩個(gè)社區(qū)之間邊的權(quán)重的和,社區(qū)內(nèi)部的邊變?yōu)樾马旤c(diǎn)上的自環(huán)。
2)對(duì)1)得到的結(jié)果進(jìn)行第一部分的操作。我們發(fā)現(xiàn)BGLL算法實(shí)質(zhì)上是一個(gè)從下而上的聚合算法,每進(jìn)行一次聚合,都能得到一個(gè)尺度上的社區(qū)發(fā)現(xiàn)的結(jié)果。最后我們得到結(jié)果是一系列從下到上的社區(qū)集合,空間尺度由小變大,社區(qū)數(shù)量由多變少。算法示意圖如圖1所示。
2 交互實(shí)現(xiàn)過程
數(shù)據(jù)預(yù)處理將采集來的信息進(jìn)行預(yù)處理和加工,使其便于理解,易于被輸入顯示可視化模塊。預(yù)處理內(nèi)容包括數(shù)據(jù)格式及其標(biāo)準(zhǔn)化、數(shù)據(jù)變換技術(shù)、數(shù)據(jù)壓縮和解壓縮等[6-7]。有些數(shù)據(jù)也需要做異常值檢出、聚類、降維等處理,繪制的功能是完成數(shù)據(jù)到幾何圖像的轉(zhuǎn)換。一個(gè)完整的圖形描述需要在考慮用戶需求的基礎(chǔ)上綜合應(yīng)用各類可視化繪制技術(shù)。顯示和交互顯示的功能是將繪制模塊生成的圖像數(shù)據(jù),按用戶指定的要求進(jìn)行輸出。除了完成圖像信息輸出功能外,還需要把用戶的反饋信息傳送到軟件層中,以實(shí)現(xiàn)人機(jī)交互。針對(duì)可視化的主要任務(wù),即總覽、縮放、過濾、詳細(xì)查看、關(guān)聯(lián)等,交互技術(shù)主要包括動(dòng)態(tài)過濾、全局+詳細(xì)、平移+縮放、焦點(diǎn)+上下文及變形、多視圖關(guān)聯(lián)協(xié)調(diào)等技術(shù)。其可視化實(shí)現(xiàn)過程如圖2所示。
3 結(jié)論
可視化是人通過視覺觀察在頭腦中形成客觀事物印象的過程,以人類慣于接受的圖形、圖像為媒介,并輔以信息處理技術(shù),將客觀事物及其內(nèi)在聯(lián)系表現(xiàn)出來。其不僅是客觀現(xiàn)實(shí)的形象再現(xiàn),也是客觀規(guī)律、知識(shí)和信息的有機(jī)融合,同時(shí)還提高了人對(duì)復(fù)雜事物的觀察能力及整體概念的理解.可視化在空間數(shù)據(jù)分析和認(rèn)知中起重要作用,其直觀形象地展示了空間數(shù)據(jù)的結(jié)構(gòu)特征和復(fù)雜關(guān)系,是對(duì)知識(shí)更高層次的抽象概括,被廣泛應(yīng)用于空間數(shù)據(jù)的分析和理解、信息的提取和表達(dá)、知識(shí)的發(fā)現(xiàn)和決策中??臻g交互是從一個(gè)地理實(shí)體到另一個(gè)地理實(shí)體的流過程,這個(gè)過程中的流可以是人口的流動(dòng),可以是貨物的運(yùn)輸,也可以是信息的傳播,抑或是金錢的投資。研究空間交互,對(duì)于人們認(rèn)識(shí)許多社會(huì)經(jīng)濟(jì)現(xiàn)象,理解空間在其中發(fā)揮的作用是十分重要的。隨著大數(shù)據(jù)時(shí)代的到來,我們現(xiàn)在能夠容易地從多種渠道獲取各種各樣的空間交互數(shù)據(jù),比如基于手機(jī)和GPS可以得到海量個(gè)體的移動(dòng)軌跡數(shù)據(jù),通過社交媒體提供的API可以得到帶有位置標(biāo)記的社交媒體簽到數(shù)據(jù)等等。這些數(shù)據(jù)為我們研究不同類型的空間交互作用提供了極大的便利。但是這些數(shù)據(jù)帶有大數(shù)據(jù)時(shí)代海量、多樣化的特點(diǎn),我們需要不同于以往的、有針對(duì)性的方法來對(duì)這些數(shù)據(jù)進(jìn)行處理和研究,才能更好地幫助我們理解空間交互。
參考文獻(xiàn):
[1]劉智慧,張泉靈.大數(shù)據(jù)技術(shù)研究綜述饑.浙江大學(xué)學(xué)報(bào)(工學(xué)版),2014,48(6):957-972.
[2]宋樹華,程承旗,關(guān)麗,等.全球空間數(shù)據(jù)剖分模型分析[J].地理與地理信息科學(xué),2008,24(4):11- 15.
[3]劉錫鈴,張世良.空間高維數(shù)據(jù)可視化方法研究[J].許昌學(xué)院學(xué)報(bào),2013,32(5):59-63.
[4]劉錫鈴,張世良.自然災(zāi)害智能化應(yīng)急救援信息系統(tǒng)關(guān)鍵技術(shù)研究[Jl‘韶關(guān)學(xué)院學(xué)報(bào),2018,39(9):32-37.
[5]張世良,王遠(yuǎn)帆,劉錫鈴,基于Slice-Oriented算法的寧德市森林健康分類研究[J].中國管理信息化,2019,22(21):170-171.
[6]張世良,基于Android的寧德茶葉電商平臺(tái)研究[Jl,信息與電腦,2018(15):67-68,71.
[7]周亞男.遙感云環(huán)境下影像數(shù)據(jù)產(chǎn)品生成與可視化服務(wù)研究[D].北京:中國科學(xué)院大學(xué),2014.
【通聯(lián)編輯:梁書】
基金項(xiàng)目:福建省自然科學(xué)基金計(jì)劃項(xiàng)目(2018J01579);福建省中青年教師教育科研項(xiàng)目(JAT170652);寧德師范學(xué)院創(chuàng)新團(tuán)隊(duì)項(xiàng)目(2017T05)
作者簡介:張世艮(1973-),男,碩士,副教授,通訊作者,主要研究方向?yàn)榭臻g信息科學(xué)與信息工程。