摘 要:隨著互聯(lián)網(wǎng)發(fā)展,在線交易成為了一種新興的電子商務(wù)模式,在我國(guó)也有越來(lái)越多企業(yè)認(rèn)識(shí)到這一新型商業(yè)模式所帶來(lái)的巨大經(jīng)濟(jì)效益。在線交易行為產(chǎn)生了大量交易數(shù)據(jù),其中包括的一種比較典型的數(shù)據(jù)類型就是用戶購(gòu)買行為數(shù)據(jù)。用戶購(gòu)買行為數(shù)據(jù)中包含了眾多人在購(gòu)物時(shí)的行為規(guī)模和購(gòu)買偏好等信息,對(duì)相關(guān)研究乃至商業(yè)的個(gè)性化推薦等方面都具有一定的推動(dòng)作用。本文基于阿里天池的淘寶用戶行為數(shù)據(jù),采用可視化分析的手段,從時(shí)間維度、用戶行為、商品分析方面對(duì)數(shù)據(jù)進(jìn)行了多維度的分析,從中發(fā)現(xiàn)了一些有價(jià)值的用戶消費(fèi)行為模式和偏好,比如淘寶用戶在購(gòu)物時(shí)的消費(fèi)習(xí)慣、消費(fèi)偏好習(xí)慣等,對(duì)行為研究、個(gè)性化推薦等方面的研究與應(yīng)用具有一定的意義。
關(guān)鍵詞:電商;行為數(shù)據(jù);可視分析
一、引言
人類在日常的行為和生產(chǎn)活動(dòng)中產(chǎn)生了大量的行為數(shù)據(jù)。這類數(shù)據(jù)中包含了用戶在網(wǎng)絡(luò)平臺(tái)進(jìn)行各項(xiàng)操作的行為偏好和規(guī)律等。在行為數(shù)據(jù)中,一種很典型的數(shù)據(jù)就是用戶在電商平臺(tái)購(gòu)買物品過(guò)程產(chǎn)生的行為數(shù)據(jù),也可以稱之為電商用戶行為數(shù)據(jù),它反映了網(wǎng)絡(luò)用戶的購(gòu)物傾向,以及商品的銷售規(guī)律等信息,對(duì)電商用戶行為數(shù)據(jù)進(jìn)行分析有很大的價(jià)值。
對(duì)這種行為數(shù)據(jù)進(jìn)行分析與可視化,可以挖掘數(shù)據(jù)背后潛在的人類的行為模式,從而推動(dòng)行為研究、行為分析等領(lǐng)域的研究與發(fā)展。目前針對(duì)于電商行為數(shù)據(jù)的可視分析研究中很多是針對(duì)銷售數(shù)據(jù)進(jìn)行研究和處理,如劉珊運(yùn)用B2B交易平臺(tái)的交易數(shù)據(jù)對(duì)商品進(jìn)行分析;ZorattiS在社會(huì)化媒體時(shí)代企業(yè)傳播實(shí)戰(zhàn)寶典中利用數(shù)據(jù)挖掘事物間的關(guān)聯(lián)性到精準(zhǔn)營(yíng)銷中;陳燁等人運(yùn)用社會(huì)網(wǎng)絡(luò)分析構(gòu)建不同類型用戶社交網(wǎng)絡(luò)有效挖掘用戶行為特征;KennedyDS從移動(dòng)互聯(lián)網(wǎng)的角度提出用戶行為畫像的具體實(shí)施方法;Mueller等人基于Twitter 會(huì)員的相關(guān)數(shù)據(jù)集,創(chuàng)立了NamChar名稱分類器,通過(guò)預(yù)測(cè)用戶性別構(gòu)建用戶畫像。但是,針對(duì)此類數(shù)據(jù)的分析研究中,大多數(shù)都是從單一的角度入手進(jìn)行分析,這就會(huì)導(dǎo)致分析結(jié)果存在一定的局限性。尤其針對(duì)行為數(shù)據(jù)時(shí),從單一的視角很難觀察到人類復(fù)雜的行為特征。
基于上述研究現(xiàn)狀,在本文中采用阿里天池的淘寶用戶行為數(shù)據(jù),應(yīng)用可視分析的手段,從多維度對(duì)數(shù)據(jù)進(jìn)行分析,主要包括時(shí)間維度、用戶操作行為維度、商品分析。從而從多個(gè)視角了解用戶在不同維度下的各類操作的規(guī)模、模式,還能綜合多維度的分析結(jié)果,還原人類復(fù)雜的購(gòu)物行為。經(jīng)過(guò)分析,本文提出的方法能夠挖掘時(shí)間段內(nèi)用戶的時(shí)間行為偏好、購(gòu)買商品偏好、購(gòu)買習(xí)慣偏好,有助于發(fā)掘行為規(guī)律,推動(dòng)相關(guān)研究發(fā)展。
二、數(shù)據(jù)與可視分析任務(wù)描述
1.數(shù)據(jù)描述與預(yù)處理
本文的樣本數(shù)據(jù)來(lái)源于天池阿里云提供的淘寶用戶行為數(shù)據(jù)集。該數(shù)據(jù)集描述了淘寶用戶在2014年11月-2014年12月內(nèi)在淘寶App中的一系列操作行為數(shù)據(jù)。該數(shù)據(jù)集的原始規(guī)模有8.90MB,包含用戶編號(hào)、商品編號(hào)、行為類型、用戶地理位置、商品種類、行為發(fā)生時(shí)間六個(gè)字段。對(duì)數(shù)據(jù)進(jìn)行處理后,共包括1048575條記錄,時(shí)間跨度48天,涉及到8477位用戶和701610件商品,7095類商品。
2.可視分析任務(wù)
本文總結(jié)了在電商用戶行為中行為用戶操作類型與具體操作行為數(shù)據(jù)中應(yīng)當(dāng)核心關(guān)注的內(nèi)容,從而指導(dǎo)本文中可視分析任務(wù)的設(shè)計(jì),主要有以下內(nèi)容。
T1:分析群體與個(gè)體操作行為的時(shí)間偏好規(guī)律。即不同時(shí)間粒度下不同用戶的操作行為。
T2:分析群體與個(gè)體進(jìn)行購(gòu)買行為的數(shù)量偏好。即用戶短期內(nèi)購(gòu)買商品的頻次分析。
T3:分析群體在線上購(gòu)物的總體行為偏好。如各項(xiàng)操作的頻率與購(gòu)買偏好。
T4:分析商品的瀏覽、銷售等規(guī)律。各操作與商品之間的分析。
三、電商數(shù)據(jù)的用戶行為可視分析
基于處理后的數(shù)據(jù)集以及分析任務(wù),本文設(shè)計(jì)用戶行為可視分析方法,從不同時(shí)間粒度進(jìn)行用戶活躍度分析、用戶操作行為分析、商品分析等。
1.不同時(shí)間粒度的用戶活躍度分析
本節(jié)分別選取了2014年11月-12月,一天中所有用戶的操作行為數(shù)量的總和,并按照天進(jìn)行統(tǒng)計(jì)與展示;選取了整個(gè)時(shí)間段中,一天內(nèi)所有用戶的操作行為數(shù)量的總和,并按照小時(shí)進(jìn)行統(tǒng)計(jì)與展示。本文將上述不同時(shí)間粒度下用戶的操作行為定義為“用戶活躍度”。
2014年11月-12月,用戶的總體活躍度如圖1(a)所示?;趫D可得,折線整體趨于平緩,且明顯存在兩個(gè)峰值,峰值一是每月11日-13日,峰值二是一月中的17日-19日,此二峰值均處于“雙十一”前后,故認(rèn)為由于“雙十一”優(yōu)惠活動(dòng)使得用戶在該時(shí)間段操作頻繁。
一天中用戶活躍度如圖1(b)所示。在圖中可以發(fā)現(xiàn),從0點(diǎn)至24點(diǎn),整體呈先減少后增加再減少的趨勢(shì),并存在2個(gè)谷值和1個(gè)峰值。谷值一是每天凌晨2點(diǎn)-5點(diǎn),谷值二為每天16點(diǎn)-18點(diǎn),兩個(gè)時(shí)間段中,大部分用戶處于工作或睡眠狀態(tài),因而活躍度較低。峰值是21點(diǎn)-22點(diǎn),該時(shí)間大部分用戶處于非工作時(shí)間,網(wǎng)購(gòu)的活躍度普遍較高。這在一定程度上也反映了大部分用戶網(wǎng)購(gòu)的時(shí)間規(guī)律。
2.用戶操作行為分析
(1) 用戶購(gòu)買數(shù)量分析
本節(jié)對(duì)11月-12月之間,用戶購(gòu)買商品的數(shù)量進(jìn)行了分析。據(jù)初步統(tǒng)計(jì),大部分購(gòu)買者購(gòu)買物品都是在9件以內(nèi),為便于更深入的理解與分析,也為了解大多數(shù)用戶購(gòu)買商品的差異性,本文將購(gòu)買細(xì)分為購(gòu)買1件、購(gòu)買2-4件、購(gòu)買5-8件、購(gòu)買9-100件四個(gè)數(shù)量級(jí)。結(jié)果如圖2所示。
根據(jù)圖2(a)的漏斗圖可以發(fā)現(xiàn),用戶整體購(gòu)買商品的數(shù)量呈現(xiàn)遞減的趨勢(shì)。其中,購(gòu)買1件商品的人數(shù)極多,購(gòu)買2-4件商品的人數(shù)與之類似,即大部分人屬于消費(fèi)數(shù)量較少的少數(shù)需求,謹(jǐn)慎消費(fèi)的狀態(tài)。在8477人中,只有82人購(gòu)買了9件以上的商品,說(shuō)明大量消費(fèi)人數(shù)占極少比例,該類用戶可能存在大量需求,也可能為具有沖動(dòng)。
把用戶購(gòu)買商品的數(shù)量繪制成折線圖如圖2(b)所示。其中,橫軸代表購(gòu)買商品的數(shù)量,縱軸代表購(gòu)買該數(shù)量商品的用戶數(shù)量。從圖中可發(fā)現(xiàn),整體呈現(xiàn)遞增趨勢(shì)。在購(gòu)買商品數(shù)量在9-82件時(shí),整體呈現(xiàn)平緩狀態(tài),這從另一個(gè)角度反映了極大部分用戶在短時(shí)間內(nèi)均為單次小數(shù)目購(gòu)買。
(2) 用戶操作行為分析
本節(jié)對(duì)用戶在11月-12月時(shí)間跨度下的付款、加購(gòu)、瀏覽、支付四種操作行為進(jìn)行了可視化分析。用戶操作行為分析從用戶五種操作的結(jié)合、用戶的“收藏-加購(gòu)-支付”行為和用戶的“瀏覽-支付”三個(gè)方面來(lái)做。
一方面結(jié)合了用戶的五種操作,并通過(guò)折線圖來(lái)展示用戶行為間的關(guān)系,并對(duì)用戶的付款、加購(gòu)、瀏覽、支付的行為進(jìn)行數(shù)量大小比較。結(jié)果如圖3(a)所示。其中,用戶操作次數(shù)和用戶瀏覽次數(shù)整體呈現(xiàn)先減少再增長(zhǎng)又減少趨勢(shì),與人本身作息規(guī)律相符。而另外三種操作,即用戶付款、用戶收藏、用戶加購(gòu)的次數(shù),整體呈現(xiàn)平緩趨勢(shì),且與用戶瀏覽次數(shù)差距較大。綜上可得,用戶大部分操作都是瀏覽,支付的操作是遠(yuǎn)小于瀏覽。
二方面是結(jié)合了用于收藏-加購(gòu)-付款三種操作間的關(guān)系。通過(guò)形成折線圖與柱狀圖對(duì)其進(jìn)行趨勢(shì)分析,如圖3(c)可以得到,收藏-加購(gòu)-付款數(shù)額整體呈現(xiàn)相同趨勢(shì),付款數(shù)額遠(yuǎn)小于收藏?cái)?shù)額,用戶的消費(fèi)沖動(dòng)不足以支撐每件商品的購(gòu)買,而收藏?cái)?shù)額遠(yuǎn)小于加購(gòu)數(shù)額,其原因?yàn)橛脩舾矚g用加購(gòu)習(xí)慣來(lái)對(duì)商品進(jìn)行標(biāo)記。局部來(lái)看,收藏?cái)?shù)額波動(dòng)更大,受個(gè)體差異習(xí)慣影響較大。
三方面是針對(duì)于瀏覽-支付分時(shí)轉(zhuǎn)化率間用戶分析。通過(guò)形成折線圖3(d)對(duì)其進(jìn)行趨勢(shì)分析??傮w來(lái)看,瀏覽-支付比率整體呈現(xiàn)平緩趨勢(shì),即用戶消費(fèi)習(xí)慣在一天中基本處于穩(wěn)定狀態(tài)。局部而言,在每天10時(shí)-15時(shí)情況下,轉(zhuǎn)化率突增,推測(cè)用戶此時(shí)購(gòu)買為剛需產(chǎn)品,從而增高轉(zhuǎn)化率。
(3) 轉(zhuǎn)化率分析
本文對(duì)11月-12月時(shí)間跨度下,用戶購(gòu)買商品的轉(zhuǎn)化率進(jìn)行了分析,即用戶進(jìn)行其他操作至最終支付的情況。本文將轉(zhuǎn)化率分為以下四個(gè)路徑。路徑一:從用戶瀏覽商品至收藏商品,再到加購(gòu)商品,最終支付該商品。路徑二:從用戶瀏覽商品至加購(gòu)商品到最終支付該商品。路徑三:從用戶瀏覽商品至收藏商品到最終支付該商品。路徑四:從用戶瀏覽商品后至直接支付該商品。在本節(jié)中,計(jì)算了上述四種路徑的支付轉(zhuǎn)化率,即并繪制了頻率分布直方圖展示各路徑下支付的轉(zhuǎn)化率,如圖4所示。
圖4(a)是路徑1的轉(zhuǎn)化率,圖中絕大部分轉(zhuǎn)化率集中在0-0.2區(qū)間,即處于一種低轉(zhuǎn)化率狀態(tài),這種路徑較復(fù)雜,涉及到較多的操作,故極少有用戶在購(gòu)買物品時(shí)全部完成這些所有操作后最終支付商品。圖4(b)為路徑2的轉(zhuǎn)化率,其轉(zhuǎn)化率數(shù)值區(qū)間集中于0-0.45之間,其轉(zhuǎn)化率相較于其他類型轉(zhuǎn)化率較高,該操作步驟符合消費(fèi)者一般操作習(xí)慣。圖4(c)是路徑3的轉(zhuǎn)化率,圖4(d)是路徑4的轉(zhuǎn)化率,均處于極低狀態(tài),轉(zhuǎn)化率集中于0-0.1之間,究其原因?yàn)橛脩魧?duì)收藏商品的偏好遠(yuǎn)低于加購(gòu)商品,且用戶極少直接通過(guò)瀏覽對(duì)商品進(jìn)行支付。
3.商品分析
本節(jié)對(duì)11月-12月時(shí)間跨度下,對(duì)商品銷量、用戶瀏覽量、加購(gòu)量、收藏量進(jìn)行分析,從而了解各個(gè)商品及商品類型對(duì)客戶瀏覽、加購(gòu)、收藏等操作的影響。結(jié)果如圖5所示。
圖5(a)為商品加購(gòu)量前20,圖5(b)為商品瀏覽量前20,圖5(c)為商品收藏量前20,圖5(d)為商品購(gòu)買量前20,經(jīng)過(guò)對(duì)比,并不存在商品同時(shí)處于瀏覽、加購(gòu)、收藏、購(gòu)買前20中,瀏覽量第一與收藏量第一商品重合但該商品并未進(jìn)入銷量前20,加購(gòu)量第一也未能進(jìn)入銷量前20商品中,局部而言,瀏覽商品前20中僅一件商品進(jìn)入銷量前20商品列表中,收藏圖中無(wú)商品進(jìn)入銷量前20商品列表中,加購(gòu)商品共有五件商品進(jìn)入銷量前20。
122338823商品共計(jì)銷售出82件、123842164共計(jì)銷售出49件等可得,瀏覽會(huì)導(dǎo)致和收藏商品受用戶體驗(yàn)感影響較強(qiáng),但用戶熱衷于瀏覽和收藏的并不能代表用戶更愿意加購(gòu)或支付該商品,即瀏覽量的高低與銷量的高低并無(wú)直接的強(qiáng)關(guān)聯(lián)。用戶存在大量上商品的購(gòu)買并未進(jìn)行大量操作,可見(jiàn)用戶直接購(gòu)買商品占絕大多數(shù),多數(shù)用戶生活存在剛需,該類商品具有支付時(shí)間短、瀏覽次數(shù)少、支付時(shí)間多的特點(diǎn)。
四、總結(jié)
人類日常生活生產(chǎn)活動(dòng)產(chǎn)生了大量行為數(shù)據(jù)。隨著信息化的發(fā)展與普及,越來(lái)越多的人在網(wǎng)上購(gòu)物,產(chǎn)生了大量電商行為數(shù)據(jù)。這些數(shù)據(jù)中包含了人類在購(gòu)物時(shí)的行為模式、購(gòu)物規(guī)律等,在行為研究、模式挖掘等領(lǐng)域有很大的研究?jī)r(jià)值。基于阿里云天池的淘寶用戶行為數(shù)據(jù)集,本文中通過(guò)三個(gè)維度分析數(shù)據(jù),分別通過(guò)時(shí)間維度分析發(fā)現(xiàn)用戶高活躍狀態(tài)時(shí)間,通過(guò)分析用戶行為發(fā)現(xiàn)用戶對(duì)偏好商品的標(biāo)記習(xí)慣與購(gòu)買習(xí)慣間的關(guān)系,通過(guò)商品維度分析各操作下商品之間關(guān)系發(fā)現(xiàn)高銷產(chǎn)品特點(diǎn),從而總結(jié)出了一系列淘寶用戶的行為模式與規(guī)律,對(duì)于相關(guān)研究具有一定的推動(dòng)作用。然而,本文仍然存在一定的局限性,比如尚未對(duì)用戶購(gòu)買商品間隔進(jìn)行分析,我們?cè)谖磥?lái)的工作會(huì)解決這些問(wèn)題。
參考文獻(xiàn):
[1]劉珊,蔡明月,劉興.淘寶文化產(chǎn)業(yè)數(shù)據(jù)的可視化研究[J].科教文匯,2018(19):183-185.DOI:10.16871/j.cnki.kjwha.2018.07.079.
[2]Zoratti S,Gallagher L.Precision Marketing:Maximizing Revenue Through Relevance[M].Kogan Page,2012.
[3]陳燁,王樂(lè),陳天雨,等.基于社會(huì)網(wǎng)絡(luò)分析的社會(huì)化問(wèn)答平臺(tái)用戶畫像研究[J].情報(bào)學(xué)報(bào),2021,40(4):414-423.DOI:10.3772/j.issn.1000-0135.2021.04.008.
[4]Kennedy D S.The Ultimate Marketing Plan:Target Your Audience!Get Out Your Message!Build Your Brand![M].Adams Media,2014.
[5]MUELLER J,STUMME G.Gender inference using statistical name characteristics in twitter[EB/OL].(2016-6-17)[2018-3-01].https://arxiv.org/abs/1606.05467.
[6]阿里云天池-淘寶用戶行為數(shù)據(jù)集.https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1.
作者簡(jiǎn)介:費(fèi)千笑(2000.09- ),女,漢族,四川成都人,本科在讀,研究方向:金融數(shù)據(jù)分析