楊笑笑,單桂華,田 東,余敏櫧
1(中國科學(xué)院 計(jì)算機(jī)網(wǎng)絡(luò)信息中心,北京 100190)
2(中國科學(xué)院大學(xué),北京 100049)
隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,網(wǎng)絡(luò)已成為日常生活中的重要組成部分,網(wǎng)絡(luò)購物已成為趨勢.各種購物平臺(tái)每天都在進(jìn)行交易,進(jìn)而不可避免地產(chǎn)生龐大的數(shù)據(jù),這些數(shù)據(jù)復(fù)雜多維,并與時(shí)間有緊密聯(lián)系.通過對(duì)這些數(shù)據(jù)的可視化分析,可以了解消費(fèi)者的購買性格,購物偏愛等喜好.目前已有較多研究人員針對(duì)系統(tǒng)應(yīng)用數(shù)據(jù)分析工作提出了多種文本分析、挖掘等研究工作[1-3],但對(duì)分析結(jié)果的可視化展示仍存在不足.
本文呈現(xiàn)一種實(shí)現(xiàn)多維層次數(shù)據(jù)在時(shí)序上信息可視化的設(shè)計(jì)思想,主要貢獻(xiàn)如下:
(1)基于商品引力將商品與消費(fèi)者之間的聯(lián)系以分層的可視化形式展現(xiàn)出來,細(xì)化商品類別屬性與消費(fèi)者消費(fèi)行為,提出體現(xiàn)層級(jí)結(jié)構(gòu)數(shù)據(jù)的方法.
(2)挖掘消費(fèi)者購買商品的過程與時(shí)間之間的聯(lián)系,提出體現(xiàn)時(shí)序數(shù)據(jù)的方法.
目前已經(jīng)有很多針對(duì)層級(jí)結(jié)構(gòu)的可視化研究,針對(duì)網(wǎng)絡(luò)數(shù)據(jù),可采用聚集點(diǎn)、線,設(shè)置閾值,或者省略某些細(xì)節(jié)信息的手段來簡化數(shù)據(jù),以線圖、節(jié)點(diǎn)圖、矩陣圖來展示[4].大多研究表現(xiàn)的是樹形結(jié)構(gòu),也就是說,他們經(jīng)常將樹結(jié)構(gòu)表示成大量的節(jié)點(diǎn)以及連接父節(jié)點(diǎn)與子節(jié)點(diǎn)的邊,例如節(jié)點(diǎn)-連線和空間填充.根樹描述的是一種父節(jié)點(diǎn)、子節(jié)點(diǎn)以及連線連接多個(gè)節(jié)點(diǎn)之間的關(guān)系[5].雷達(dá)樹是一種根據(jù)眾多節(jié)點(diǎn)在樹中的深度,來把它們都放在同心圓中的布局.氣球樹是一種表達(dá)將所有節(jié)點(diǎn)包含在圓圈中的并連接到父節(jié)點(diǎn)的節(jié)點(diǎn)與線的表現(xiàn)關(guān)系.樹圖表達(dá)的是一種通過圈畫的外殼展現(xiàn)大樹的空間填充布局[6].
針對(duì)時(shí)序數(shù)據(jù),在ODSP流程中,基于信息熵的流量特征來有效度量網(wǎng)絡(luò)活動(dòng)的隨機(jī)特征,過濾符合條件的IP地址與端口,提取有意義的時(shí)序數(shù)據(jù)[7].直方圖的條狀也可以很明顯地展現(xiàn)出來,人們根據(jù)時(shí)間從左邊到右邊流動(dòng)的圖表來描述時(shí)序數(shù)據(jù).在堆疊流圖中采用堆疊基準(zhǔn)函數(shù)和堆疊序列函數(shù)將時(shí)序數(shù)據(jù)進(jìn)行分析,并綜合比例、曲線方法、排序、著色和標(biāo)簽布局構(gòu)建可視化效果[8].還有一些其他的方式,像螺旋圖,基于像素的技術(shù)等.
商品數(shù)據(jù)是同時(shí)具有多層結(jié)構(gòu)與時(shí)序的數(shù)據(jù),它是復(fù)雜且多維的,與時(shí)間有很強(qiáng)的關(guān)聯(lián)性[9].理解并細(xì)分消費(fèi)者的購買行為是眾多電商及分析人員的研究熱點(diǎn).在目前多數(shù)的購物網(wǎng)站中,在消費(fèi)者的角度下,所能查看的以往訂單與購物車中的商品大多以表格的形式呈現(xiàn),其中對(duì)商品的展示分類不甚明顯,這樣容易造成人的視覺疲勞.然而,針對(duì)層級(jí)結(jié)構(gòu)與時(shí)序數(shù)據(jù)的結(jié)合的商品購物的研究仍不多,如Keim主要分析時(shí)變的規(guī)律與異常的購買行為[10]等.
本章主要介紹的是基于商品引力的網(wǎng)絡(luò)購物可視化系統(tǒng)交易日志數(shù)據(jù)的描述和分析.
消費(fèi)者通過網(wǎng)絡(luò)進(jìn)行購物,在這個(gè)過程中所產(chǎn)生的數(shù)據(jù)復(fù)雜多變,包括消費(fèi)者信息、與消費(fèi)者相關(guān)聯(lián)的商品屬性、消費(fèi)者的購物行為,以及它們與時(shí)間的關(guān)聯(lián)[11].本文重點(diǎn)研究商品在結(jié)構(gòu)層次上的分類,并與時(shí)間、消費(fèi)行為的關(guān)聯(lián)可視化展示以及以消費(fèi)者個(gè)體為中心的研究[12,13].
在此之前,需要把得到的樣本數(shù)據(jù)進(jìn)行預(yù)處理.這些數(shù)據(jù)的主要屬性特征如下:
(1)商品:商品數(shù)據(jù)具有顯著的層次結(jié)構(gòu),本文主要將其分為了三個(gè)層級(jí),它們是商品分類、分類細(xì)化、商品型號(hào).舉個(gè)例子,某位消費(fèi)者可能會(huì)購買食物,具體的分類下(即分類細(xì)化)的水果,然后該件商品是十公斤重的富士蘋果.
(2)時(shí)間:研究時(shí)間上的三個(gè)層級(jí)劃分的數(shù)據(jù),時(shí)間粒度分別是月、日、時(shí).
(3)消費(fèi)者的購物行為:根據(jù)實(shí)際經(jīng)驗(yàn),在本文中將消費(fèi)者的購物行為細(xì)化為五種,它們分別是瀏覽商品,將商品加入到購物車中,將商品從購物車中刪除、購買商品、將商品退貨.
本章主要介紹網(wǎng)絡(luò)購物可視分析系統(tǒng)的設(shè)計(jì)思想,系統(tǒng)主要研究基于商品引力的商品層級(jí)分類與消費(fèi)者的消費(fèi)行為之間的聯(lián)系,展示一系列相互關(guān)聯(lián)的可視化視圖,并且提供豐富的交互手段.
系統(tǒng)根據(jù)數(shù)據(jù)的特點(diǎn),聯(lián)系了消費(fèi)者消費(fèi)行為與時(shí)間兩個(gè)重要因素,使分析者能夠從多維度對(duì)購物主題進(jìn)行全面的分析.
該系統(tǒng)的整體界面如圖1所示,系統(tǒng)主要包含5個(gè)視圖:(1)購物主視圖;(2)商品分類及消費(fèi)行為視圖;(3)用戶信息及行為細(xì)節(jié)視圖;(4)消費(fèi)月歷視圖;(5)消費(fèi)時(shí)段視圖.
本節(jié)將會(huì)重點(diǎn)介紹系統(tǒng)中各個(gè)視圖的設(shè)計(jì)思想.
商品的種類多種多樣,例如電子類、服裝類、食品類,等.并且,在每一類的商品下,都有更加細(xì)化的分類,例如,電子類下細(xì)分電腦、手機(jī)、手表等,而電腦下還可以細(xì)分具體的品牌和型號(hào),因此把有關(guān)商品的節(jié)點(diǎn)劃為三個(gè)層級(jí):商品分類、分類細(xì)化、商品型號(hào),它們分別對(duì)應(yīng)視圖中的第二、三、四層節(jié)點(diǎn),而第一層級(jí)節(jié)點(diǎn)代表消費(fèi)者節(jié)點(diǎn),即不同層級(jí)的節(jié)點(diǎn)代表以上不同的隱喻.
購物主視圖是本系統(tǒng)的核心,首先定義消費(fèi)者坐標(biāo),如式(1),其中H是主視圖高,W是主視圖寬.
consumer_x和consumer_y是根據(jù)主視圖視口大小定位的初始化坐標(biāo).之后,根據(jù)圓的極坐標(biāo)表達(dá)式定位第二層節(jié)點(diǎn),如式(2).
圖1 系統(tǒng)概覽
以此類推,后級(jí)層次節(jié)點(diǎn)坐標(biāo)為:
center_x和center_y是上一層父節(jié)點(diǎn)的橫縱坐標(biāo);R取主視圖寬W的1/6,可以調(diào)整不同層級(jí)節(jié)點(diǎn)間的距離;angle控制后層節(jié)點(diǎn)圍繞前層節(jié)點(diǎn)的角度,取每層級(jí)節(jié)點(diǎn)個(gè)數(shù)平分15度角的值;trim為同等級(jí)節(jié)點(diǎn)的不同下標(biāo)加1,以此判斷不同的角度.圖2描述了各層級(jí)節(jié)點(diǎn)之間的初始化的關(guān)系,例如節(jié)點(diǎn)1處于第一層級(jí);節(jié)點(diǎn)2、3處于第二層級(jí);節(jié)點(diǎn)4、5是節(jié)點(diǎn)2的子節(jié)點(diǎn),處于第三層級(jí);節(jié)點(diǎn)6、7是節(jié)點(diǎn)5的子節(jié)點(diǎn),處于第四層級(jí).
圖2 各層級(jí)節(jié)點(diǎn)初始化定位示意圖
在物理上,有一條眾人皆知的定律——萬有引力定律,它表述的是物體間相互作用的一條定律,任何物體之間都有相互的吸引力,這個(gè)力與物體間的質(zhì)量成正比,與它們之間的距離成反比.
引申到本文的購物系統(tǒng)當(dāng)中來,每相鄰兩個(gè)層級(jí)節(jié)點(diǎn)之間也有彼此之間的吸引力——商品引力K.同一層級(jí)的節(jié)點(diǎn),當(dāng)K值越大,則與父層級(jí)節(jié)點(diǎn)的距離越遠(yuǎn);反之,距離越近.在圖3的示意圖中,節(jié)點(diǎn)4、5都處于第三層級(jí),它們的父層級(jí)節(jié)點(diǎn)是處于第二層級(jí)的節(jié)點(diǎn)2,針對(duì)第三層級(jí)的節(jié)點(diǎn)來說,當(dāng)該層級(jí)的K接近于0時(shí),層級(jí)中的節(jié)點(diǎn)越趨近于虛線b(如節(jié)點(diǎn)4),當(dāng)K接近于1時(shí),該層級(jí)上的節(jié)點(diǎn)越趨近于虛線c(如節(jié)點(diǎn)5),K值的范圍是0到1之間,這樣可保證節(jié)點(diǎn)4、5始終處于第三層級(jí)中.
如圖4,受商品引力K值的影響,根據(jù)式(3)定位的處于第n+1層級(jí)的節(jié)點(diǎn)A,橫縱坐標(biāo)同時(shí)乘以K值之后,變成B點(diǎn)的定位,于是,該節(jié)點(diǎn)距離處于父層級(jí)(第n層級(jí))的父節(jié)點(diǎn)的距離跟隨K值的變化而變化.
各節(jié)點(diǎn)基于商品引力K的重定位公式如下:
A點(diǎn)坐標(biāo)的(x',y'),在K的作用下,重定位到點(diǎn)B(x,y).
圖3 各層級(jí)節(jié)點(diǎn)在商品引力K作用下的定位示意圖
圖4 商品引力K的原理圖
如圖5所示,第二層級(jí)上的節(jié)點(diǎn)代表的消費(fèi)額數(shù)據(jù)是處于第三層級(jí)上的所有子節(jié)點(diǎn)代表消費(fèi)額數(shù)據(jù)之和;同理,第三層級(jí)上的節(jié)點(diǎn)代表的消費(fèi)額數(shù)據(jù)是處于第四層級(jí)上的所有子節(jié)點(diǎn)代表消費(fèi)額數(shù)據(jù)之和;每個(gè)節(jié)點(diǎn)的商品引力K值與該節(jié)點(diǎn)所隱喻的消費(fèi)額數(shù)據(jù)成正比.在第四層節(jié)點(diǎn)上,即具體的商品型號(hào)的隱喻描述,規(guī)定了5種顏色(該5種顏色與圖6中的商品分類及消費(fèi)行為視圖、圖8中的用戶信息及行為細(xì)節(jié)視圖的動(dòng)作數(shù)據(jù)的圖例顏色相吻合),依次對(duì)應(yīng)該件商品的最后動(dòng)作:瀏覽、加入購物車、從購物車中刪除、購買、退貨.例如,針對(duì)小米5S這件商品,消費(fèi)者瀏覽了5次,加入購物車1件并購買了這一件,所以對(duì)這件商品的最后動(dòng)作,消費(fèi)者停留在了“購買”,這也意味著消費(fèi)者購買了一件小米5S之后,并無退貨意愿.
圖5 第四層節(jié)點(diǎn)顏色隱喻商品的最后行為
本文的商品數(shù)據(jù)類別為5個(gè)大類,分別是:食品類、服裝類、電子類、生活日用品類和其他.
如圖6所示,右側(cè)可視化圖表的縱軸顯示商品分類,各個(gè)商品的分類彼此之間是相互獨(dú)立的,橫軸表示該年的時(shí)間軸.每個(gè)面積圖分別針對(duì)相應(yīng)商品類別,來統(tǒng)計(jì)橫坐標(biāo)所選擇時(shí)間段下的消費(fèi)額.左側(cè)的可視化圖表和右側(cè)的可視化圖表共用一個(gè)商品分類坐標(biāo)軸和時(shí)間軸,其橫坐標(biāo)軸對(duì)應(yīng)每類商品下五種消費(fèi)行為(瀏覽、加入購物車、從購物車中刪除、購買、退貨)的數(shù)據(jù)統(tǒng)計(jì),橫軸上的數(shù)值是由左向右依次變大的,其展示的數(shù)據(jù)隨右側(cè)可視化圖表下的時(shí)間軸中選擇的連續(xù)時(shí)間段的變化而變化,隱喻所選連續(xù)時(shí)間段中對(duì)應(yīng)商品類別的五種消費(fèi)行為的數(shù)據(jù)累積統(tǒng)計(jì).比如說,在6月到11月之間,圖6中的左側(cè)可視化圖表顯示該消費(fèi)者對(duì)服裝類的購買數(shù)最多,右側(cè)可視化圖表則表明在這個(gè)時(shí)間段下,這位消費(fèi)者主要集中在6月和11月購買服裝,而9月和10月購買較少.
圖6 商品分類及消費(fèi)行為視圖
該視圖中可以根據(jù)操作展現(xiàn)四種不同的可視圖形:消費(fèi)者對(duì)應(yīng)的信息列表和3種環(huán)形圖.
消費(fèi)者的購物行為是時(shí)常變化的.比如一位消費(fèi)者瀏覽了某件商品3次,然后將該件商品加入了購物車,但是這位消費(fèi)者又很快地將該件商品從購物車中刪除,在這個(gè)過程中便會(huì)產(chǎn)生很多數(shù)據(jù).為了更細(xì)化地表現(xiàn)消費(fèi)者的消費(fèi)行為,系統(tǒng)為購物主視圖中的各個(gè)節(jié)點(diǎn)加入了點(diǎn)擊查看的功能.例如,點(diǎn)擊圖5代表的主視圖中的消費(fèi)者節(jié)點(diǎn),在圖7所展示的用戶信息及行為細(xì)節(jié)視圖中會(huì)顯示消費(fèi)者相關(guān)的細(xì)節(jié)信息,其中包含了消費(fèi)者在本系統(tǒng)中的序號(hào)、消費(fèi)者的年齡段以及年消費(fèi)總額;點(diǎn)擊圖5中的第四層節(jié)點(diǎn),則在用戶信息及行為細(xì)節(jié)視圖中顯示三環(huán)圖,針對(duì)該點(diǎn)擊節(jié)點(diǎn)所代表的型號(hào)商品的五種購物行為進(jìn)行數(shù)據(jù)統(tǒng)計(jì),如圖8所示;相應(yīng)的,點(diǎn)擊圖5的第二、三層節(jié)點(diǎn)時(shí),用戶信息及行為細(xì)節(jié)視圖中顯示對(duì)應(yīng)的單環(huán)圖和雙環(huán)圖,如圖9所示,為單環(huán)圖.
圖7 點(diǎn)擊主視圖第一層節(jié)點(diǎn)后對(duì)應(yīng)的細(xì)節(jié)可視視圖
圖8 點(diǎn)擊主視圖第四層節(jié)點(diǎn)后對(duì)應(yīng)的細(xì)節(jié)可視視圖
多環(huán)圖隱喻是由外向內(nèi)依次展現(xiàn)主視圖的第二、三、四層節(jié)點(diǎn)所代表商品類或型號(hào)的五種消費(fèi)行為的數(shù)據(jù)統(tǒng)計(jì).在這里需要強(qiáng)調(diào)的是,其中外層的節(jié)點(diǎn)對(duì)里層相應(yīng)節(jié)點(diǎn)的數(shù)據(jù)具有包含關(guān)系,也就是說,外層節(jié)點(diǎn)的數(shù)據(jù)包含了內(nèi)層節(jié)點(diǎn)的數(shù)據(jù).例如,某位消費(fèi)者購買的第三層節(jié)點(diǎn)如電腦類下的所有商品的購物數(shù)據(jù)都被統(tǒng)計(jì)到了該電腦類節(jié)點(diǎn)中.
圖9 點(diǎn)擊主視圖第二層節(jié)點(diǎn)后對(duì)應(yīng)的細(xì)節(jié)可視視圖
消費(fèi)月歷視圖:聯(lián)系商品分類及消費(fèi)行為視圖(圖6)中的時(shí)間軸,此視圖顯示該時(shí)間軸上的選擇時(shí)間段內(nèi)的所有日期,并按行從上到下顯示,每月數(shù)據(jù)顯示一行、每個(gè)月的數(shù)據(jù)從左到右均勻排列[14],如圖10所示.消費(fèi)月歷視圖中的每個(gè)日期模塊都渲染一定的顏色,該顏色根據(jù)所表示日期中該消費(fèi)者的消費(fèi)額映射得來,右上角配以顏色表圖例,白色代表日消費(fèi)額為零,藍(lán)色代表日消費(fèi)額較低,紅色代表日消費(fèi)額較高,這樣可以使選擇時(shí)間段下的日消費(fèi)額情況一目了然.
圖10 消費(fèi)月歷視圖
消費(fèi)時(shí)段視圖:聯(lián)系上面的消費(fèi)月歷視圖,選擇圖10中某一天,則可在消費(fèi)時(shí)段視圖中將該天都細(xì)化為24小時(shí),以小時(shí)為時(shí)間粒度,將這24小時(shí)劃分為夜間休息時(shí)間段與其他時(shí)間段,觀察該日下的消費(fèi)額所發(fā)生的時(shí)間段,數(shù)據(jù)為該小時(shí)下的消費(fèi)額.如圖11所示,凌晨開始到一點(diǎn)的時(shí)間段內(nèi),顏色填充最多,代表這一天中該消費(fèi)者在這個(gè)小時(shí)內(nèi)消費(fèi)額最多,大部分時(shí)間段下顏色填充區(qū)域全為灰白色,代表這些時(shí)間段下沒有發(fā)生消費(fèi).
圖11 消費(fèi)時(shí)段視圖
可視化并非僅僅只是靜態(tài)的形式,交互式可視化可以挖掘出更多的數(shù)據(jù)細(xì)節(jié),便于分析者主動(dòng)地去探索與分析數(shù)據(jù),發(fā)揮人的主觀能動(dòng)性.因此本系統(tǒng)也提供了豐富的交互式操作.
在購物主視圖中,如果鼠標(biāo)在任意節(jié)點(diǎn)上點(diǎn)擊,即會(huì)在用戶信息及行為細(xì)節(jié)視圖上顯示細(xì)節(jié)信息.如點(diǎn)擊消費(fèi)者節(jié)點(diǎn),即第一層節(jié)點(diǎn)后,會(huì)顯示該消費(fèi)者在本系統(tǒng)中的序號(hào)、消費(fèi)者的年齡段以及年消費(fèi)總額,如圖7;點(diǎn)擊第四層節(jié)點(diǎn)后,會(huì)顯示該節(jié)點(diǎn)代表的具體商品型號(hào)為中心的三環(huán)圖,如圖8.
如果鼠標(biāo)懸浮在某節(jié)點(diǎn)上,即可高亮顯示與該節(jié)點(diǎn)直接相連的節(jié)點(diǎn)與連接線,并在提示框中顯示被懸浮節(jié)點(diǎn)的相關(guān)信息;在連線上懸浮,則高亮顯示該連接線,且連線的提示框顯示兩端連接節(jié)點(diǎn)的名稱.圖12所表示的是鼠標(biāo)懸浮在第四層節(jié)點(diǎn)上,出現(xiàn)提示框顯示該節(jié)點(diǎn)代表商品魅藍(lán)note2,五種購物動(dòng)作的數(shù)據(jù)代表該消費(fèi)者針對(duì)這件商品,曾經(jīng)在眾多的網(wǎng)絡(luò)購物平臺(tái)中瀏覽過5次、加入購物車2次,之后并沒有從購物車中刪除,但是購買過1次,并將其退貨.
本系統(tǒng)的數(shù)據(jù)是基于商品引力,以消費(fèi)者為中心,在某位消費(fèi)者的前提下挖掘其購物信息的.因此首先需要在消費(fèi)者人群下拉框中(在主視圖左上角)選擇所要研究的消費(fèi)者對(duì)象.
之后在主視圖中即可顯示該消費(fèi)者默認(rèn)時(shí)間段下的購物信息.點(diǎn)擊不同的節(jié)點(diǎn),在用戶信息及行為細(xì)節(jié)視圖中顯示相應(yīng)的表格或環(huán)圖.
圖12 鼠標(biāo)懸浮在某第四層節(jié)點(diǎn)上
在商品分類及消費(fèi)行為視圖中,選擇不同的時(shí)間段,該視圖中的眾多商品分類面積圖、消費(fèi)行為折線圖、主視圖以及消費(fèi)月歷視圖都會(huì)產(chǎn)生隨之變化的互動(dòng)展示,可以表示該消費(fèi)者在此選定的時(shí)間段內(nèi)的購物行為及購物量.
消費(fèi)者的購物數(shù)據(jù)具有強(qiáng)烈的時(shí)間屬性,包含所研究年份下的月、日、時(shí).在商品分類及消費(fèi)行為視圖中,主要選擇的是“月”,經(jīng)過濾后,在消費(fèi)月歷視圖中,顯示的是特定的日期,通過點(diǎn)擊消費(fèi)月歷視圖的日期模塊,在消費(fèi)時(shí)段視圖中顯示某日下24小時(shí)下的消費(fèi)額情況.
在購物主視圖中,為了使分析者更加清晰地挖掘數(shù)據(jù),系統(tǒng)提供了對(duì)主視圖的縮放功能.將鼠標(biāo)移至到主視圖上,鼠標(biāo)滑輪上下滾動(dòng)即可實(shí)現(xiàn)對(duì)視圖的放大與縮小.
如圖1所示,這是一個(gè)九零后的網(wǎng)上購物數(shù)據(jù)的展示.不難看出,這位消費(fèi)者基本上在每月都有消費(fèi),大多數(shù)是隔一周左右進(jìn)行一次購物.
研究6月到11月共半年的時(shí)間段,在月歷視圖下,11月份的某一天(雙十一)消費(fèi)額較為偏大.鼠標(biāo)點(diǎn)擊該天,在關(guān)于消費(fèi)時(shí)段視圖中,可以看到,該消費(fèi)者主要在這一天的凌晨一點(diǎn)購物量最大,上午八九點(diǎn)和晚上八點(diǎn)也有一些消費(fèi)額產(chǎn)生.聯(lián)系實(shí)際情況,通常各大主流購物網(wǎng)站上,步入雙十一這一天的凌晨開始,所有促銷活動(dòng)開放,人們習(xí)慣于雙十一之前將欲購買的商品提前放入購物車,在雙十一凌晨付款,所以在凌晨一點(diǎn)鐘的消費(fèi)額非常大.
在商品分類及消費(fèi)行為視圖中,右邊的面積圖與左側(cè)的折線圖綜合顯示,該消費(fèi)者偶爾購買電子商品,對(duì)食品類和生活用品類商品的需求量也不大,對(duì)服裝類商品購買量較為偏多.但是,商品引力K值與節(jié)點(diǎn)隱喻的消費(fèi)額成正比,第二、三層節(jié)點(diǎn)距離各自父層節(jié)點(diǎn)大體一致,可見各節(jié)點(diǎn)的K值大小十分接近,由此可推斷出該消費(fèi)者對(duì)服裝類的購買量較大且平均單價(jià)不高,其他產(chǎn)品類購買量少但平均單價(jià)較高,例如購買過的電腦及配件等價(jià)格較為昂貴的電子類產(chǎn)品.在購買商品之前,該消費(fèi)者習(xí)慣多次瀏覽,且退貨量較少,也可體現(xiàn)出該消費(fèi)者購物沉著謹(jǐn)慎.
圖13展示的是一位80后消費(fèi)者的網(wǎng)絡(luò)購物情況,同樣重點(diǎn)分析其在6月至11月的消費(fèi)情況,該消費(fèi)者對(duì)商品的瀏覽數(shù)和購買數(shù)基本保持一致,可見其購物習(xí)慣是干脆利落型,且購物偏好為電子類商品和食品類,經(jīng)常連續(xù)性小額度購物.同樣,在雙十一的時(shí)候,重點(diǎn)在步入凌晨至一點(diǎn)的時(shí)間段中,大量下單成交商品,雙十一的消費(fèi)致使11月的消費(fèi)額加大.
圖13 一位80后消費(fèi)者網(wǎng)絡(luò)購物情況
消費(fèi)者的購物行為復(fù)雜多變,商品信息也具有多層次結(jié)構(gòu),由此綜合的數(shù)據(jù)既多維又具時(shí)序性.
本文基于商品引力將商品的信息按層次結(jié)構(gòu)進(jìn)行可視化分析,并對(duì)以消費(fèi)者個(gè)體為中心的購物行為的時(shí)序數(shù)據(jù)進(jìn)行了研究,同時(shí)挖掘出商品層次結(jié)構(gòu)數(shù)據(jù)與消費(fèi)者行為的時(shí)序數(shù)據(jù)之間的聯(lián)系.因此,基于本系統(tǒng)的設(shè)計(jì)思想,可以使分析者更方便地觀察每位消費(fèi)者的消費(fèi)行為,從而得到他們的購物特點(diǎn).
不同的消費(fèi)者會(huì)有不同的購物習(xí)慣與偏好,在未來的工作中,將重點(diǎn)研究消費(fèi)者之間的消費(fèi)行為差異,以消費(fèi)者特征碼的形式表現(xiàn)在購物主視圖上.
1Chen CC,Warren J,Evans J.‘Qualities’ not ‘quality’—text analysis methods to classify consumer health websites.Electronic Journal of Health Informatics,2009,4(1):1-7.
2Chen CC,Warren J,Riddle P.Semantic space models for classification of consumer webpages on metadata attributes.Journal of Biomedical Informatics,2010,43(5):725-735.[doi:10.1016/j.jbi.2010.06.005]
3Tausczik YR,Pennebaker JW.The psychological meaning of words:LIWC and computerized text analysis methods.Journal of Language and Social Psychology,2010,29(1):24-54.[doi:10.1177/0261927X09351676]
4Becker RA,Eick SG,Wilks AR.Visualizing network data.IEEE Transactions on Visualization and Computer Graphics,1995,1(1):16-28.[doi:10.1109/2945.468391]
5Itoh T,Yamashita F.Visualization of multi-dimensional data of bioactive chemicals using a hierarchical data visualization technique “Heiankyo view”.Proceedings of the 2006 Asia-Pacific Symposium on Information Visualisation.Tokyo,Japan.2006.23-29.
6Herman I,Melancon G,Marshall MS.Graph visualization and navigation in information visualization:A survey.IEEE Transactions on Visualization and Computer Graphics,2000,6(1):24-43.[doi:10.1109/2945.841119]
7趙穎,王權(quán),黃葉子,等.多視圖合作的網(wǎng)絡(luò)流量時(shí)序數(shù)據(jù)可視分析.軟件學(xué)報(bào),2016,27(5):1188-1198.[doi:10.13328/j.cnki.jos.004960]
8趙穎,樊曉平,周芳芳,等.多源網(wǎng)絡(luò)安全數(shù)據(jù)時(shí)序可視分析方法研究.小型微型計(jì)算機(jī)系統(tǒng),2014,35(4):906-910.
9Shneiderman B.Tree visualization with tree-maps:2-d space-filling approach.ACM Transactions on Graphics,1992,11(1):92-99.[doi:10.1145/102377.115768]
10Keim DA,Hao MC,Dayal U,et al.Value-cell bar charts for visualizing large transaction data sets.IEEE Transactions on Visualization and Computer Graphics,2007,13(4):822-833.[doi:10.1109/TVCG.2007.1023]
11Chen SM,Chen S,Wang ZH,et al.D-Map:Visual analysis of ego-centric information diffusion patterns in social media.Proceedings of 2016 IEEE Conference on Visual Analytics Science and Technology.Baltimore,MD,USA.2016.41-50.
12Liu QS,Hu YF,Shi L,et al.EgoNetCloud:Event-based egocentric dynamic network visualization.Proceedings of 2015 IEEE Conference on Visual Analytics Science and Technology.Chicago,IL,USA.2015.65-72.
13Fisher D.Using egocentric networks to understand communication.IEEE Internet Computing,2005,9(5):20-28.[doi:10.1109/MIC.2005.114]
14廖志芳,彭燕妮,李永,等.AirVis:一個(gè)基于Web的空氣質(zhì)量數(shù)據(jù)可視分析系統(tǒng).計(jì)算機(jī)工程與應(yīng)用,2015,51(15):174-178.[doi:10.3778/j.issn.1002-8331.1308-0203]