劉 黎,胡海波,楊 濤
(重慶大學(xué)大數(shù)據(jù)與軟件學(xué)院,重慶 400044)
隨著我國綜合經(jīng)濟實力的不斷提高,會展業(yè)得到了飛速的發(fā)展,出現(xiàn)了各種類型的會展,促進(jìn)了各行業(yè)領(lǐng)域的交流與發(fā)展?,F(xiàn)代會展內(nèi)容涵蓋多個組成部分,會場由多個不同功能的場館組成,參會人員數(shù)量龐大且有著不同類型。比如2019中國可視化與可視分析大會[1]內(nèi)容涵蓋各種報告、海報、展覽、專題研討、挑戰(zhàn)賽,主要場館包含主會場(共3個廳)、兩個分會場、展廳、海報區(qū),參會人員的類型包括國內(nèi)外知名學(xué)術(shù)學(xué)者專家、普通會員、參展商、工作人員、媒體及志愿者等。因此,在會展環(huán)境下產(chǎn)生的時空數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)附加信息復(fù)雜等特點。而數(shù)據(jù)采集設(shè)備、系統(tǒng)誤差及采集方式也會對數(shù)據(jù)質(zhì)量產(chǎn)生諸多影響。
一般情況下,用戶不僅關(guān)注整體的規(guī)律,也關(guān)注細(xì)節(jié)的變化;不僅關(guān)注軌跡,也關(guān)注軌跡的屬性。有效地處理這種需求對于傳統(tǒng)的數(shù)據(jù)分析系統(tǒng)來說是一項具有挑戰(zhàn)性的任務(wù)??梢暬荚谝钥衫斫獾男问匠尸F(xiàn)復(fù)雜的數(shù)據(jù),幫助用戶提高理解能力[2]。對于有效地分析時空數(shù)據(jù),可視分析是一個有價值和經(jīng)過驗證的方法[3-4]。我國重點專項2018年度申報指南提出“研究大數(shù)據(jù)的可視化技術(shù),開發(fā)面向領(lǐng)域和大眾的可視化工具庫”[5]。因此,本文設(shè)計了一個可視分析系統(tǒng)(Visual Analysis system for Spatio-Temporal Exhibition Data,VASTED)來實現(xiàn)對會展時空數(shù)據(jù)的探索與分析。本文工作主要貢獻(xiàn)如下:
1)集成了一個可視分析系統(tǒng),結(jié)合豐富的交互,幫助用戶從整體的角度分析參會人員的類型及移動規(guī)律,從細(xì)節(jié)層面發(fā)現(xiàn)可能的異常事件。
2)利用并改進(jìn)了三維地圖和甘特圖。三維地圖用于表示參會人員空間位置分布及軌跡線,甘特圖用于表示時間、語義位置和速度屬性。
現(xiàn)代運動跟蹤技術(shù),如GPS(Global Positioning System)、RFID(Radio Frequency IDentification)等,允許大規(guī)模的時空數(shù)據(jù)被采集。所采集的時空數(shù)據(jù)涉及到諸多領(lǐng)域,如運輸管理、軍事監(jiān)視[6]、商業(yè)選址[7]等。近年來,在學(xué)界有很多關(guān)于時空數(shù)據(jù)可視分析應(yīng)用與研究的工作。在具體應(yīng)用方面,李致昊等[8]針對基站軌跡時空數(shù)據(jù),設(shè)計了一個可視分析系統(tǒng)從時空的角度來探索城市區(qū)域功能和用戶行為的關(guān)系。Liu等[7]設(shè)計了一個交互式的可視化分析系統(tǒng),用于處理大規(guī)模出租車軌跡數(shù)據(jù),以解決廣告牌的選址問題,但該工作更多的注意力集中在了整體層面的分布、聚集,缺少對細(xì)節(jié)方面的探索。Orellana 等[9]結(jié)合時間、空間信息,可視化游客在公園的集體空間行為,顯示整體、局部以及個體層面的流動情況,為公園更好的管理提供決策支持。Bast等[10]提出了一種可擴展的實時公共交通數(shù)據(jù)可視化方法,顯示公共汽車、地鐵、火車和渡輪的實時移動,來對相關(guān)交通信息進(jìn)行統(tǒng)計,對路線做出規(guī)劃。在研究方面,Wang 等[11]研究了用時間線(甘特圖技術(shù)的一種實現(xiàn)形式)及其擴展形式對軌跡進(jìn)行可視分析,但重點是時間屬性。Murray等[12]提出一種基于星型坐標(biāo)的交互式技術(shù),專門用來探索多維時空軌跡數(shù)據(jù)。Tominski 等[13]設(shè)計軌跡墻整合了時間、空間和屬性,軌跡墻是一個三維視圖,由水平二維地圖和在垂直方向堆疊的軌跡帶組成。但軌跡墻比較適合可視化具有相似軌跡的軌跡群[14]。交互式時空立方體[15-16]經(jīng)常被用來研究時空數(shù)據(jù)的三維可視化,但顯示多個軌跡時,容易出現(xiàn)遮擋及空間的扭曲。Cibulski等[17]的工作研究了從時間、空間、事件本身3 個不同層次分析時空數(shù)據(jù)的事件序列,并設(shè)計了一個多視圖關(guān)聯(lián)分析系統(tǒng)。
“網(wǎng)格型”數(shù)據(jù)是一種比較常見的移動數(shù)據(jù)。比如Shoval[18]將“迷你以色列”公園劃分為多個2 m×2 m 的網(wǎng)格,然后統(tǒng)計每個單元格的訪客數(shù)。IEEE VAST 2015 Challenge[19]將游樂場劃分為多個5 m×5 m 的網(wǎng)格,然后對每個網(wǎng)格的游客進(jìn)行跟蹤。本文所使用的文獻(xiàn)[20]挑戰(zhàn)1(后文簡稱“挑戰(zhàn)1”)數(shù)據(jù)中,會場被看成由多個8 m×8 m 的網(wǎng)格組成的區(qū)域,記錄每個網(wǎng)格的參會人員時空信息。
針對“網(wǎng)格型”移動數(shù)據(jù),本文利用“中心位置替代”的方法來處理網(wǎng)格內(nèi)部的位置變化。假設(shè)人員M0在T0時刻進(jìn)入網(wǎng)格S0(S0映射網(wǎng)格中心位置)范圍內(nèi)的P0點,在T1時刻移動到P1點。由于移動是由時間和空間合成,網(wǎng)格內(nèi)具體位置的變化可以轉(zhuǎn)移到時間的累積,并且網(wǎng)格的尺寸較小,人員在網(wǎng)格內(nèi)的具體位置變化對網(wǎng)格人數(shù)統(tǒng)計、人員整體運動分析的影響可以忽略不計。因此將人員在網(wǎng)格內(nèi)部的任意位置近似認(rèn)為所處網(wǎng)格的中心位置,來對數(shù)據(jù)進(jìn)行平滑處理,如圖1(a)所示。隨著記錄的增加,就可以根據(jù)時間T和網(wǎng)格中心位置S擬合出人員的近似軌跡,如圖1(b)所示。
圖1 通過網(wǎng)格中心位置模擬參會人員的移動軌跡Fig.1 Movement trajectory simulation of participants based on grid center
數(shù)據(jù)補全 根據(jù)挑戰(zhàn)1 數(shù)據(jù)的描述,每個網(wǎng)格中心安裝一個傳感器,可以接收其所處網(wǎng)格內(nèi)參會人員佩戴信號發(fā)射器發(fā)出的信號。傳感器日志數(shù)據(jù)分3 d 給出,共計1 879 488行,未壓縮約32 MB,記錄了人員ID、人員進(jìn)入傳感器所在網(wǎng)格的時間及傳感器編號(sid),sid映射該網(wǎng)格的中心位置。原始數(shù)據(jù)記錄不完整,記錄的人員具體位置信息比較模糊,具有不確定性;并且數(shù)據(jù)離散程度相對較高,數(shù)據(jù)質(zhì)量低,無法利用此類數(shù)據(jù)進(jìn)行有效的分析。因此,對傳感器日志數(shù)據(jù)進(jìn)行補全:1)對原始數(shù)據(jù)按人員ID 升序排序。2)利用插值法補全數(shù)據(jù)。
假設(shè)人員M0某一天的軌跡有n個離散時空數(shù)據(jù)點TPk=(Tk,Pk),其中k=1,2,…,n,Tk為當(dāng)前時間,Pk為當(dāng)前位置(圖2(a))。對于TPK-1與TPk,某人在Tk-1時刻進(jìn)入Pk-1位置,在Tk時刻離開Pk-1進(jìn)入Pk位置。由于人員在該網(wǎng)格內(nèi)任意位置點均可表示為該網(wǎng)格中心位置,因此在時間區(qū)間[Tk-1,Tk),TPi=(Ti,Pk-1),其中0≤i≤Tk-Tk-1,Tk-1≤Ti≤Tk。按此算法對每個人的數(shù)據(jù)進(jìn)行插值補全(圖2(b)),補全后的數(shù)據(jù)約3.2 GB。
圖2 位置P與時間T的函數(shù)Fig.2 Function of position P and time T
數(shù)據(jù)采樣 補全后的數(shù)據(jù)量過大,存在一定冗余,考慮到性能及盡可能保留關(guān)鍵時空信息,設(shè)定一個基準(zhǔn)時間,利用系統(tǒng)采樣的方式,每隔一段時間對每個人的數(shù)據(jù)進(jìn)行采樣。正常情況下,人在會議場館中位置變化頻率較低,且相鄰網(wǎng)格之間距離較小,設(shè)定基準(zhǔn)時間為25 200 s(07:00:00),每隔60 s,即1 min采樣一次,如圖3所示。
圖3 數(shù)據(jù)采樣后位置P與時間T的函數(shù)Fig.3 Function of position P and time T after data sampling
本文希望通過結(jié)合時間、空間、速度等屬性來分析參會人員的類型和行為模式,以及可能的異常事件,來幫助會展主辦方更輕松有效地回顧會展的整體狀況,洞察參會人員空間行為,發(fā)現(xiàn)相關(guān)不足,提升以后的管理水平。因此,本文在設(shè)計視圖時主要遵守以下兩個原則:
1)視圖準(zhǔn)確展示數(shù)據(jù)所包含的復(fù)雜信息。
2)視圖表達(dá)清晰、直觀,減輕用戶對數(shù)據(jù)的理解負(fù)擔(dān)和認(rèn)知負(fù)擔(dān)。
該系統(tǒng)主要由全局態(tài)勢地圖、軌跡回放地圖、軌跡甘特圖、速度甘特圖、時長甘特圖、控制面板以及人數(shù)變化折線圖組成。圖4 僅展示了系統(tǒng)部分視圖,其中(c)、(e)、(f)、(g)默認(rèn)展示room6 第一天的數(shù)據(jù)。(a)為時間切換按鈕組,(b)為全局態(tài)勢地圖,(c)為速度甘特圖,(d)為控制面板,(e)為人數(shù)變化折線圖,(f)為時長甘特圖,(g)為軌跡甘特圖。
圖4 可視化界面Fig.4 Visual interfaces
3.1.1 三維地圖
對于時空數(shù)據(jù)的分析,地圖經(jīng)常作為“視覺吸引”集中著用戶的注意力,給予用戶對環(huán)境最直觀的洞察,因此本文提供一個地圖視圖。根據(jù)挑戰(zhàn)1 中傳感器布置圖,本文場景為具有兩層高度的封閉式會議場館。利用Esmap 進(jìn)行建模,三維還原會議場館,因為認(rèn)為三維立體顯示兩層樓比二維平鋪顯示兩層樓更直觀,空間利用率更高。但三維場景也面臨著很多問題,例如可能造成空間的扭曲或遮擋,容易使人對高度和尺寸的感知產(chǎn)生誤差[21],給用戶帶來不必要的視覺干擾等。因此,給地圖增加平移、旋轉(zhuǎn)和縮放功能,利用鼠標(biāo)右鍵和滾輪操作實現(xiàn)。這樣就可以從不同視角觀察地圖,降低三維地圖帶來的影響。
全局態(tài)勢地圖 全局態(tài)勢地圖在三維地圖上添加了兩個功能層,即網(wǎng)格坐標(biāo)層和散點圖。
網(wǎng)格坐標(biāo)可以把地圖網(wǎng)格化、坐標(biāo)化,將地圖本身的墨卡托坐標(biāo)系轉(zhuǎn)化為普通坐標(biāo)系。這樣地圖上的標(biāo)記點位置得以更精確、易懂地描繪。
散點圖由不同位置、不同顏色、形象具體的人形圖標(biāo)組成。每個圖標(biāo)的位置由x,y坐標(biāo)確定,顏色由該點的人數(shù)N確定。本文中,設(shè)定4 個人數(shù)區(qū)間,(0,16],(16,32],(32,64],(64,+∞),并采用常用的預(yù)警級別顏色來編碼每個區(qū)間,即藍(lán)、黃、橙、紅。例如圖4(b)中,標(biāo)注紅色圖標(biāo)的區(qū)域人數(shù)N>64,說明這些8 m×8 m 的網(wǎng)格區(qū)域此刻出現(xiàn)了擁堵,應(yīng)做好相關(guān)措施,預(yù)防擁堵帶來的相關(guān)影響。Buschmann 等[21]研究了動畫的有效性,他們的實驗結(jié)果表明動畫為表現(xiàn)、分析、理解時間和空間提供了有效的手段。因此,散點圖結(jié)合地圖并以動畫播放的形式呈現(xiàn)會場整體態(tài)勢,展示參會人員位置的動態(tài)變化情況。動畫播放的一種方式是為用戶提供一個交互式的時間滑塊[22],Amini 等[3]認(rèn)為,用戶可以通過控制滑塊的滑動速度,選擇性地把注意力留在感興趣的時間段,從而更快地瀏覽數(shù)據(jù)并找到有價值的信息。但時間滑塊通常在跳轉(zhuǎn)到某一具體時刻上表現(xiàn)不佳,缺少一定的靈活性,本系統(tǒng)以另一種形式實現(xiàn)時間滑塊。利用模擬計時器的方式自動播放動畫,可在輸入框輸入時間跳轉(zhuǎn)到指定時間,也可點擊“前進(jìn)”或者“后退”按鈕查看前一幀或后一幀(動畫地圖所綁定數(shù)據(jù)為采樣后的數(shù)據(jù),一幀代表1 min)。
此外,視圖右上角設(shè)計一組功能按鈕,分別綁定“單層/雙層顯示”“聚焦樓層1”“聚焦樓層2”“2D/3D 切換”功能。“2D/3D 切換”可以充分利用二維地圖和三維地圖的優(yōu)點,提高用戶體驗。
軌跡回放地圖 全局態(tài)勢地圖從全局的角度動態(tài)還原真實場景,幫助用戶實時感知會場態(tài)勢;軌跡甘特圖以靜態(tài)的方式展示了所選人員一天的移動規(guī)律,但用戶卻不能洞察位置之間的距離,也看不到位置之間的軌跡形狀[23],并且容易隱藏時間極短的細(xì)節(jié)。因此本文設(shè)計軌跡回放地圖,如圖5 所示,幫助用戶探索感興趣的少量人員的移動細(xì)節(jié)。軌跡回放地圖類似于全局態(tài)勢地圖,將散點圖替換為軌跡線,軌跡線上用白色的箭頭表示移動的方向。由于采樣之后的數(shù)據(jù)丟失了一部分信息,因此,面向細(xì)節(jié)的軌跡回放地圖采用補全之后的數(shù)據(jù),每一幀動畫代表1 s。當(dāng)用戶想忽略重疊交叉的軌跡線,只關(guān)注所選人員詳細(xì)的位置變化時,可以取消選擇“顯示軌跡”。
圖5 軌跡回放地圖Fig.5 Trajectory playback map
3.1.2 甘特圖
3.1.1 節(jié)中,全局態(tài)勢地圖結(jié)合時間和空間從全局的角度溯源場景,但沒有結(jié)合數(shù)據(jù)屬性對單個或者一組人員進(jìn)行分析。對于屬性的表示,希望設(shè)計的視圖能夠滿足以下需求:
1)很容易地看到某種屬性隨時間的變化,因此視圖應(yīng)該有一個時間軸。
2)以人為中心,可以對一組人員的該屬性進(jìn)行比較,這就要求視圖簡單和能按某種方式排序?qū)R。
甘特圖橫軸自然表示時間,可以一次查看時間、對象ID和屬性3 個變量,具有按行顯示、可以對行進(jìn)行排序?qū)R、易于發(fā)現(xiàn)和比較模式的變化等特點。Gupta 等[23]專門討論了甘特圖的多種形式,其中以人為中心的甘特圖具有兩種形式,如圖6所示,并選擇了最合適的一種用來表示人員ID、時間和位置3 個屬性。圖6(a)中位置不需要顏色編碼,但更占用垂直空間。圖6(b)位置雖然需要顏色編碼,但在必要時可以用文本標(biāo)簽標(biāo)識屬性。本文使用的數(shù)據(jù)集包含的人員遠(yuǎn)多于位置,位置垂直排列不能很好地擴展,因此選擇圖6(b)作為視圖之一。同樣,位置可以被其他屬性(如速度、訪問頻率等)代替。
圖6 以人為中心的甘特圖Fig.6 Person-centric Gantt chart
軌跡甘特圖 軌跡甘特圖不同色條映射不同的區(qū)域,色條寬度代表在該位置的持續(xù)時間。每一行包含一個人員的移動信息,包括訪問過的離散位置、訪問它們的順序等。甘特圖通常適用于數(shù)據(jù)較少的情況,數(shù)據(jù)量變大就會出現(xiàn)雜亂和隱藏信息。但是,很難找到一種可視化技術(shù)既能完全地清晰地展示數(shù)據(jù)信息,又適應(yīng)大數(shù)據(jù)量,又不損失空間上下文。所以,對甘特圖做出一些改進(jìn),如圖7所示。
1)一般情況下,要想知道某個色條對應(yīng)的區(qū)域,需要將該色條顏色與“顏色-區(qū)域”對照表聯(lián)系起來,確定了對應(yīng)的區(qū)域后,再將視覺移回該色條上。如果顏色變多,用戶的視覺在來回轉(zhuǎn)移之中容易產(chǎn)生疲勞,造成“顏色-區(qū)域”對應(yīng)錯位。將空間位置轉(zhuǎn)換為語義位置,然后標(biāo)注給寬度合適的色條,減少用戶的視覺轉(zhuǎn)移,降低用戶的視覺負(fù)擔(dān),提升用戶對視圖的瀏覽質(zhì)量。
2)空間位置轉(zhuǎn)變?yōu)檎Z義位置或者顏色映射到甘特圖,會淡化真實的空間信息。當(dāng)鼠標(biāo)移入色條時,彈出一個文本框,文本框包含區(qū)域名稱、位置坐標(biāo)、到達(dá)/離開時間。將坐標(biāo)與時間映射到地圖,就可以在地圖中溯源該位置的相關(guān)場景。這類似于文獻(xiàn)[24]中使用的嵌入地圖。
3)會場的空間布局為兩層樓,每層樓可以看成是一個獨立的區(qū)域。而每層樓又包含多個場館,這些場館可以看成是由通道連接起來的獨立的子區(qū)域。增加表示二樓場館的色條高度,用戶就能輕松看出軌跡的樓層變化。同樣,根據(jù)經(jīng)驗人為地忽略那些停留時間不超過1 min的過道位置,給其對應(yīng)的色條設(shè)置為透明。這樣就可以降低多余顏色對用戶視覺的干擾,從而向用戶呈現(xiàn)“斷開”的、更為清晰的場館序列。
4)根據(jù)會場關(guān)鍵位置的訪問順序,以及人員進(jìn)入會場時間的早晚對行進(jìn)行排序,使行為特征相似的人員呈現(xiàn)聚類狀態(tài),便于進(jìn)行比較,發(fā)現(xiàn)相同模式。
5)由于視圖窗口的限制,給視圖橫軸和縱軸增加縮放功能。橫軸縮放可以查看因?qū)挾忍《浑[藏的色條信息;縱軸縮放可以根據(jù)情況改變視圖窗口顯示的行數(shù),改善空間上下文的損失;通過橫軸局部刷取功能放大某個時間段而不用拖動橫軸縮放條,這是對橫軸縮放的一個改進(jìn)。
圖7 原始甘特圖與改進(jìn)之后的甘特圖對比Fig.7 Original Gantt chart and improved Gantt chart
速度甘特圖 會展環(huán)境下,人的空間狀態(tài)只有兩種,要不靜止(開會、處于工作崗位、休息等),要不就是以不超過正常步行速度(通常認(rèn)為成人的步行速度為60~100 m/min)的速度移動(海報區(qū)、展廳參觀,茶歇等),如果在某時刻出現(xiàn)速度偏大,那么就有可能是該人員發(fā)生了異常情況。因此,對速度的分析有助于探索隱藏的異常信息。
如圖4(c)所示,速度甘特圖從軌跡甘特圖移植過來,色條的顏色由速度大小speed決定。本文設(shè)定4個速度區(qū)間(單位:m/s),[0,0.5),[0.5,1),[1,1.67],(1.67,+∞),分別映射藍(lán)、黃、橙、紅四種預(yù)警級別顏色。當(dāng)色條為紅色,即速度大于1.67 m/s 時,定義為異常速度。傳感器的位置記錄在空間上前后相鄰,相鄰兩點距離間隔較小,可以近似地認(rèn)為相鄰點之間的運動為勻速直線運動,因此可以很容易地計算出相鄰點間的距離(distance)和時間間隔(duration),從而得到移動速度(speed)。
如圖8 所示,假設(shè)某人在T1時刻進(jìn)入傳感器P1(x1,y1)檢測區(qū)域,在T2時刻進(jìn)入傳感器P2(x2,y2)檢測區(qū)域,那么P1和P2之間的距離distance為:
從P1到P2所經(jīng)歷的時間duration為:
則P1與P2兩點間的速度speed為:
圖8 P1與P2之間的距離Fig.8 Distance between P1 and P2
通過上述計算,可以得到某人一天的速度變化情況。當(dāng)速度甘特圖的視圖窗口要顯示很多行速度時,用戶可能要通過縮放、移動縮放條等操作去發(fā)現(xiàn)隱藏的異常速度,這樣就比較耗時,會加重用戶視覺負(fù)擔(dān)。本視圖提供“只顯示異?!惫δ埽催x該選擇框,視圖窗口就只顯示具有異常速度的行,這樣用戶就可以更輕松地獲取細(xì)節(jié)的信息。
停留時長甘特圖 為了查看某區(qū)域一天的人員進(jìn)出情況,本文設(shè)計了停留時長甘特圖(圖4(f))。停留時長甘特圖的每一行顯示了一天中何人在何時進(jìn)入了該區(qū)域,何時離開該區(qū)域,進(jìn)入該區(qū)域的次數(shù),每次在該區(qū)域的持續(xù)時間。
3.1.3 控制面板
根據(jù)分析的目標(biāo),用戶可能會對某一場館一天的人員出入情況,或者人員一天的活動情況感興趣。為了支持用戶查詢需求,更靈活地更新局部視圖,本文結(jié)合數(shù)據(jù)背景,考慮了時空數(shù)據(jù)的不同組成部分——時間(when)、空間(where)、對象(who)以及隱性屬性速度(speed)、人數(shù)(count),提出了兩個查詢模型:
1)when+where →who+when+count。指定一個日期和一個位置,查詢將返回在該日期訪問過該位置的對象,這些對象何時進(jìn)入該位置,何時離開該位置,以及每個時刻該位置對應(yīng)的人數(shù)。
2)when+who →where+speed。指定一個日期和一組或一個對象,查詢將返回對象在該日期內(nèi)的位置變化和速度變化。
如圖4(d)所示,通過下拉框選擇查詢條件,點擊“查詢”,執(zhí)行查詢1);通過接收“甘特圖”選中的ID 或者“添加”感興趣的ID,點擊“確定”,執(zhí)行查詢2)。
3.1.4 人數(shù)變化折線圖
場館每個時刻的人數(shù)及人數(shù)變化趨勢反映了場館相關(guān)活動的開展情況。本文利用標(biāo)準(zhǔn)視圖-折線圖(圖4(e)),來清晰展示各場館的人數(shù)變化,推測各場館的議程安排。折線圖橫軸縮放功能用于探索更細(xì)節(jié)的時刻。當(dāng)鼠標(biāo)在折線視圖上移動時,鼠標(biāo)位置會出現(xiàn)一條豎線,豎線與折線的交點高亮顯示,交點旁會彈出一個文本框,用于標(biāo)注該點對應(yīng)的時刻及人數(shù)。另外,該視圖還提供一個下拉框,便于用戶選擇感興趣的場館,對比多個場館的人數(shù)變化趨勢。
由于數(shù)據(jù)的復(fù)雜性,單純依靠機器處理數(shù)據(jù)直接顯示結(jié)果很難滿足用戶需求,因此多視圖的關(guān)聯(lián)分析是有必要的,豐富的交互也可以讓用戶享受探索的樂趣。本節(jié)主要介紹系統(tǒng)的交互流程,如何利用系統(tǒng)去關(guān)聯(lián)分析。系統(tǒng)提供兩個交互入口,即全局態(tài)勢地圖和控制面板。
地圖:
1)點擊“播放”按鈕,幫助用戶動態(tài)感知全局態(tài)勢。
2)暫停動畫播放,在地圖上選擇感興趣的目標(biāo)點,接著執(zhí)行步驟3)~7)或步驟8)。
3)在“停留時長甘特圖”顯示該天進(jìn)入目標(biāo)點(一個或多個點,或者一個區(qū)域)的人員在該目標(biāo)點的停留時長。
4)選擇“停留時長甘特圖”上感興趣的ID,控制面板將顯示這些選中的ID。
5)執(zhí)行when+who →where+speed 查詢,在“速度甘特圖”與“軌跡甘特圖”顯示所選ID 的速度與軌跡,接著執(zhí)行步驟6)或步驟7)。
6)反饋感興趣的坐標(biāo)點及時間到地圖。
7)選擇“軌跡甘特圖”感興趣的ID,在“軌跡回放地圖”動態(tài)回放其軌跡。
8)控制面板顯示該目標(biāo)點此刻的ID,接著執(zhí)行步驟5)~7)。
控制面板:
9)執(zhí)行when+where →who+when查詢。
10)在“人數(shù)變化折線圖”顯示所選場館人數(shù)與時間的變化關(guān)系。
11)重復(fù)步驟3)~7)。
12)在控制面板輸入感興趣的人員ID。
13)重復(fù)步驟5)~7)。
實驗平臺為一臺Intel Core i7-6700 3.4 GHz 的臺式機,配置16 GB 內(nèi)存。本文的重點是VASTED 的可視分析及推理,因此主要演示部分案例。
本案例研究探索了如何分析參會人員的類型及移動規(guī)律。由于room1~room6 這6 個房間用途在數(shù)據(jù)描述中未詳細(xì)說明,因此在對參會人員進(jìn)行分析之前,先對各房間的用途進(jìn)行分析。圖9以第一天的數(shù)據(jù)及room2為例演示了分析過程。
1)對于一個不知用途的房間,首先關(guān)注房間內(nèi)的人數(shù)如何變化,人數(shù)變化與其他場館有何關(guān)系。執(zhí)行分析流程9)~10),查詢room2 的人數(shù)變化折線圖,并在折線圖下拉框選中幾個主要會場,對其人數(shù)變化情況進(jìn)行對比,如圖9(a)所示??梢钥闯霎?dāng)各會場處于工作狀態(tài)時,room2 內(nèi)人數(shù)較少;其余時間人數(shù)較多,峰值達(dá)到150人。
2)了解了人數(shù)變化情況之后,分析該房間人員對各個場館的訪問情況。執(zhí)行分析流程3)~5),查看該房間人員的軌跡序列。從圖9(b)可以看出,這些人員上午主要在主會場活動,中午前往餐廳就餐,下午主要在4 個分會場活動,一天內(nèi)多次前往room2等。
3)軌跡甘特圖展示了人員所訪問的場館序列,但對人員在某個場館內(nèi)具體位置點的變化表現(xiàn)不佳。執(zhí)行分析流程7)查看room2 人員的軌跡回放。圖9(c)顯示,在主會場處于工作狀態(tài)期間,room2 內(nèi)人員大多處于主會場前排位置,也有人位于講席臺??梢酝茰yroom2 為講者嘉賓的休息室,其人員為講者嘉賓(VIP)。
4)確定room2人員類型為VIP之后,還可以分析出相關(guān)的報告嘉賓。根據(jù)圖9(a),選擇分會場A處于工作狀態(tài)(人數(shù)處于波峰狀態(tài))的一個時刻,比如14:10。圖9(d)中,選中分會場A 講席區(qū)域的兩個網(wǎng)格(矩形框選處),得到講席區(qū)域的人員停留時長。圖9(e)矩形框選ID 顯示這5名人員在分會場A會議進(jìn)行時分3 個時間段位于講席處。而這3 個時間段恰好與圖9(a)中分會場A 人數(shù)最多的3個時間段相符,故推測這5名人員為分會場A的報告嘉賓。圖9(f)顯示,這5名人員都多次前往room2,證實了推測結(jié)果。
5)對于VIP的移動規(guī)律,圖9(g)(h)是對圖9(b)的橫軸縮放??梢钥闯鯲IP 是從入口4 進(jìn)入會場,且不需要簽到;進(jìn)入會場后,首先進(jìn)入room2 稍做準(zhǔn)備,會議開始時進(jìn)入主會場;并且只從出口4 離開會場。圖9(i)的動畫顯示了軌跡甘特圖不易發(fā)現(xiàn)的規(guī)律(矩形框選處),VIP 可以從主會場后面的專用通道離開會場,前往二樓也只經(jīng)過扶梯2。
通過步驟1)~3)可以推測相關(guān)的人員類型及移動規(guī)律,步驟4)可以推測這類型人員中的具體角色人員,步驟5)可以總結(jié)每一類人員的大致移動規(guī)律。按此步驟,結(jié)合挑戰(zhàn)1 的題目背景,可以對剩余五個房間做如下推測。
room1 為下午的茶歇間,時間為16:10—16:30;room3 為上午的茶歇間,時間為10:30—10:50。
room4 為媒體室。媒體記者從普通入口(入口1~3)進(jìn)入會場,簽到后進(jìn)入room4 稍做準(zhǔn)備。接著根據(jù)工作安排去相關(guān)區(qū)域進(jìn)行采訪、直播等,并且不定時進(jìn)入room4。工作結(jié)束后從普通出口(出口1~3)離開會場。
room5 為黑客大賽場地。參賽人員從普通入口進(jìn)入會場后先簽到,9:00 左右進(jìn)入賽場。中午12:00 集體前往食堂就餐,然后返回賽場。下午15:00 左右第一批人員被淘汰,16:15左右進(jìn)行第二批淘汰。然后從普通出口離開會場。
room6 為工作人員休息室。工作人員從普通入口進(jìn)入會場,前往room6 稍做準(zhǔn)備后提前到各自的崗位就位,并且位置長期保持不變。部分崗位工作人員采取輪流午餐制,包括簽到處、出入口(1 樓通道)、服務(wù)臺、簽到處,room5 第一批工作人員就餐時間為11:40—12:10,第二批12:10—12:40,如圖7(b)所示。工作結(jié)束后從普通出口離開會場。
圖9 分析room2人員類型及移動規(guī)律Fig.9 Analyzing types and movement rules of people in room2
對于某些類型人員的分析,可能不需要以上那樣復(fù)雜的步驟。圖10(a)重現(xiàn)了第一天從普通入口進(jìn)入會場的所有人的軌跡??梢园l(fā)現(xiàn)有部分人在上午9:30 開始陸續(xù)進(jìn)入會場,簽到后在會場自由活動,11:00 前后陸續(xù)離開會場。結(jié)合圖10(b)發(fā)現(xiàn)這類人主要在海報區(qū)和展廳活動,不去參加會議。在第一天下午15:00—16:00 及第二天相同時間段也出現(xiàn)類似情況,其移動規(guī)律相似。故推測為團(tuán)體參觀人員。
本節(jié)案例以第一天數(shù)據(jù)為例,主要結(jié)合時間和空間屬性,利用三維地圖和甘特圖,關(guān)聯(lián)分析了參會人員的類型及行為模式,并可以細(xì)化某些人員類型中的具體角色。因此,該案例可以為類似場景的人員行為模式分析提供參考。
圖10 分析團(tuán)體參觀人員移動規(guī)律Fig.10 Analyzing movement rules of group visitors
4.2.1 人員越權(quán)事件
4.1 節(jié)確定了room2 中的人員為VIP,其第一天的軌跡甘特圖顯示人員11201 和16473 在簽到處和room4 停留,而VIP不經(jīng)過簽到處及room4。在后面兩天,兩人未出現(xiàn)在room2,卻都出現(xiàn)在了room4。將兩人3天的軌跡序列進(jìn)行對比,結(jié)合媒體記者的移動規(guī)律,確認(rèn)兩人為媒體記者。因此推測兩人在第1 天越權(quán)進(jìn)入room2 違規(guī)采訪。人員11201 進(jìn)入會場時首先在簽到處停留簽到,09:06:31—09:19:49 在room2 停留;人員16473 進(jìn)入會場時同樣在簽到處簽到,10:30:03—10:50:59在room2停留。如圖11所示。
圖11 11201和16473三天的軌跡對比Fig.11 Trajectory comparison of three days of 11201 and 16473
4.2.2 電子胸牌同號事件
會議第一天,VIP 的速度甘特圖顯示ID 為16632 的人員速度序列中出現(xiàn)了比較明顯的紅色異常區(qū)間,對該區(qū)間進(jìn)行局部縮放。如圖12(a)所示,在此區(qū)間,速度達(dá)到幾米、十幾米每秒,甚至更快。16632 的軌跡序列(圖12(b))顯示,在08:34:40該人員從入口4進(jìn)入會場,隨后一直在主會場活動。但在09:44:40 該人員突然出現(xiàn)在入口4,然后停留在room2,并于10:48:24從出口4離開會場,訪問的位置出現(xiàn)明顯跳動?;谏鲜霰憩F(xiàn),推測人員P 復(fù)制了16632 的電子胸牌,在09:44:40 進(jìn)入會場,隨后一直停留在room2,尋找合適時機盜取重要資料或者物品,行竊成功后于10:48:24 從出口4 離開會場。
圖12 第一天16632異常行為Fig.12 Abnormal behaviors of 16632 on day1
4.2.3 物品丟失事件
會議第一天,room2的“人員停留時長”圖顯示ID為11260的人員在12:28—14:00 期間頻繁進(jìn)入room2,如圖13(a)所示。從圖13(b))可以看出,此期間該人員在room2、服務(wù)臺及其他公共區(qū)域之間頻繁往來,并短暫停留。結(jié)合4.2.2 節(jié)提到的可能的盜竊行為,推測人員P 盜取了11260 的相關(guān)物品,11260在10:44進(jìn)入room2,人員P擔(dān)心暴露,于10:48:24從出口4 逃離會場。11260 在12:28 回到room2 時發(fā)現(xiàn)物品丟失,然后頻繁前往服務(wù)臺咨詢,并多次在room2、room3、展廳、海報區(qū)等區(qū)域?qū)ふ以撐锲贰?/p>
4.2.4 人員異常會和事件
第一天黑客大賽人員的軌跡甘特圖顯示,參賽人員10409 在上午11:01:11—11:20:19 一直處于2 樓過道某位置(圖14(a)),而此時間段其他參賽人員均在賽場比賽,且周圍人員較少。將該位置坐標(biāo)和時間段映射到“全局態(tài)勢地圖”(圖14(b)),發(fā)現(xiàn)從11:08分起,該位置有兩人,包括媒體人員13612(圖14(c))。兩人的軌跡回放清楚地呈現(xiàn)了異常會和的全過程(圖14(d))。媒體人員13612 從一樓到二樓,于11:08:08 在room5 門口(2 樓,10,06)位置與10409 會和,大約12 min之后,二人會和完畢,于11:20:19相繼離開。
結(jié)合上述,兩人異常會和可能涉及到比賽方面的不公開信息。推測兩人事先已經(jīng)約定好時間和地點,并且10409 提前到約定地點等待,兩人會和交接完畢之后,10409 返回賽場,13612則回到媒體間整理相關(guān)信息。
圖13 第一天11260異常行為Fig.13 Abnormal behaviors of 11260 on day1
圖14 第一天13612與10409 異常會和Fig.14 Abnormal meeting of 13612 and 10409 on day1
通過本節(jié)案例,相對容易地從一組時間、空間或者速度屬性的序列中發(fā)現(xiàn)具有細(xì)節(jié)差異的離群個體,然后以此為基礎(chǔ)結(jié)合其他視圖,繼續(xù)向下發(fā)掘出可能的異常事件。
本節(jié)選取了文獻(xiàn)中兩個常見的時空數(shù)據(jù)可視化案例,進(jìn)行差異對比。
如圖15(a)所示,文獻(xiàn)[13]利用軌跡墻在一個視圖中整合了空間、時間和速度屬性,軌跡沿著z軸垂直排列,速度屬性通過不同的顏色沿著軌跡編碼。此外可以過濾掉不關(guān)注的屬性范圍,來縮小顯示無關(guān)數(shù)據(jù)的位置的軌跡帶,突出了重點數(shù)據(jù),減少了視覺遮擋。該方法比較適合沿著道路產(chǎn)生的具有相似形狀的軌跡。但對于本文,比如同為媒體人員,但他們分布在會場不同方向不同位置,空間軌跡雜亂,使用該方法很難避免軌跡的交叉和視覺的遮擋。
文獻(xiàn)[15]中通過對齊軌跡開始/結(jié)束的時間,來擴展時空立方體技術(shù),從而優(yōu)化時空立方體的視覺混亂問題,提高分析質(zhì)量和分析效率。圖15(b)對齊了軌跡的開始時間,意思就是以某一軌跡開始時間為基準(zhǔn),其余軌跡全部垂直平移,使其開始時間與基準(zhǔn)時間重合。該圖顯示了軌跡的開始一段時間,可以看出在該時間段內(nèi),所有軌跡明顯成一簇。但是如果要顯示所有時間段的軌跡,該方法就會失效。比如對于本文的VIP,使用該方法,在入口4到room2這段開始的時間會有比較好的軌跡聚類效果。但對于后面的時間,每位VIP的路線具有隨機性,因此該方法還是不能很好地解決軌跡雜亂遮擋問題。
圖15 不同的時空數(shù)據(jù)可視化案例Fig.15 Different visualization cases of spatio-temporal data
本文將空間位置轉(zhuǎn)換為語義位置,將軌跡沿著時間軸水平排列。語義位置可以將很多空間位置點聚類,使軌跡序列更為平整。比如主會場有一段空間軌跡,形狀彎折復(fù)雜,但轉(zhuǎn)為語義位置后就只有“主會場”這個標(biāo)記。因此,利用甘特圖可視化時空數(shù)據(jù)可以很容易對齊,按行進(jìn)行比較,減少不必要的視覺干擾。再結(jié)合其他視圖,就可以進(jìn)行更深入的探索。
本文提出了VASTED,該系統(tǒng)結(jié)合具體案例,有效地探索會展環(huán)境下的時空數(shù)據(jù),分析出了參會人員的類型和行為模式,以及可能的異常事件,可以在以后類似場景下為相關(guān)用戶提供決策支持、幫助管理人員合理調(diào)動資源、更好地管理會場、響應(yīng)和處理各類突發(fā)事件。此外,利用該系統(tǒng)還可以進(jìn)行很多有趣的細(xì)節(jié)探索。比如確定各場館的日程安排;通過日程安排找到相關(guān)人員可能的遲到、早退或者缺席現(xiàn)象;通過人員移動的軌跡線與場館墻體的交叉點確定各場館的出入口;通過全局態(tài)勢地圖發(fā)現(xiàn)相關(guān)擁堵情況等。
在數(shù)據(jù)預(yù)處理方面,原始數(shù)據(jù)未給出人員在每個網(wǎng)格內(nèi)的具體位置信息,本文將每個人的實時位置近似處理為其所處網(wǎng)格的中心位置,因此在人物的精確移動分析方面還存在不足,這需要用更多數(shù)據(jù)集來進(jìn)行實驗和探索。由于數(shù)據(jù)集的復(fù)雜性及視圖窗口的限制,在視圖設(shè)計方面,用甘特圖來表示軌跡,容易隱藏持續(xù)時間較短的移動信息和損失一部分空間上下文;軌跡訪問的區(qū)域過多,也會對色條的色彩搭配設(shè)計形成挑戰(zhàn)。
在未來的研究中,將對甘特圖的算法設(shè)計和視圖設(shè)計進(jìn)行更加深入的探索,以期在保留甘特圖獨特優(yōu)勢的前提下,更好地適應(yīng)大而復(fù)雜的軌跡時空數(shù)據(jù)集,幫助用戶快速地洞察關(guān)鍵信息,發(fā)現(xiàn)問題。