【摘 要】隨著移動通信技術(shù)的迅猛發(fā)展,移動運營商積累了海量的用戶行為數(shù)據(jù)。首先基于移動網(wǎng)絡(luò)的多種數(shù)據(jù)源,結(jié)合通信用戶行為的特點,通過時空關(guān)聯(lián)分析的方法提出了一套通信用戶停留分析的方法;隨后在對用戶進行停留分析的基礎(chǔ)上,通過用戶價值區(qū)域多維分析的方法挖掘出高價值區(qū)域的地理分布情況。實踐表明,基于通信數(shù)據(jù)的用戶行為分析及用戶價值區(qū)域特征分析對通信網(wǎng)絡(luò)的建設(shè)、通信網(wǎng)絡(luò)的建設(shè)與優(yōu)化具有重要的現(xiàn)實意義和實用的應(yīng)用價值。
【關(guān)鍵詞】用戶行為 區(qū)域特征 網(wǎng)絡(luò)建設(shè) 網(wǎng)絡(luò)優(yōu)化
1 引言
移動通信技術(shù)的快速發(fā)展和應(yīng)用不僅提升了用戶使用通信媒體的便利性,也產(chǎn)生了大量的用戶信息。與此同時,基于移動通信用戶數(shù)據(jù)研究用戶行為、用戶習(xí)慣、用戶使用業(yè)務(wù)的地理特征也不斷涌現(xiàn),這些研究能夠為移動通信運營商的網(wǎng)絡(luò)建設(shè)與優(yōu)化提供有價值的信息:根據(jù)用戶使用的業(yè)務(wù)行為規(guī)律有效地配置網(wǎng)絡(luò)資源,做到資源的精準投放。因此,本文將對移動網(wǎng)絡(luò)的用戶行為及用戶價值區(qū)域特征進行研究,對運營商的數(shù)據(jù)進行多維關(guān)聯(lián),從中提煉出高價值區(qū)域的分布,幫助運營商有效提升網(wǎng)絡(luò)服務(wù)水平,為移動用戶提供優(yōu)質(zhì)的網(wǎng)絡(luò)質(zhì)量和具有競爭力的業(yè)務(wù)體驗。
2 用戶行為研究
通過挖掘用戶的位移變化、用戶使用網(wǎng)絡(luò)類型、用戶使用業(yè)務(wù)類型來分析用戶停留特征及用戶使用業(yè)務(wù)的熱點。利用了用戶的使用網(wǎng)絡(luò)請求類型、業(yè)務(wù)量、位移量:
(1)網(wǎng)絡(luò)請求類型:是指用戶在使用業(yè)務(wù)時使用的網(wǎng)絡(luò)類型、使用不同類型網(wǎng)絡(luò)的次數(shù)、特定時間段使用不同網(wǎng)絡(luò)類型的次數(shù)作為描述用戶使用業(yè)務(wù)習(xí)慣的關(guān)鍵指標(biāo)。
(2)業(yè)務(wù)量:業(yè)務(wù)量是指用戶使用業(yè)務(wù)的次數(shù)、時長以及使用業(yè)務(wù)的時間分布作為描述用戶的停留特征、用戶業(yè)務(wù)使用熱點的關(guān)鍵指標(biāo)。
(3)位移量:位移量是指用戶發(fā)生業(yè)務(wù)時請求的基站的次數(shù)、在不同時段請求基站的次數(shù)分布作為描述用戶停留特征分析以及使用熱點的關(guān)鍵指標(biāo)。
2.1 用戶停留特征分析
用戶的停留行為一般具有規(guī)律性,在特定的時間段、特定區(qū)域停留次數(shù)、停留分布等在一定程度上反映了該區(qū)域的人口密度以及該區(qū)域的主要職能特點?;谟脩敉A舴治觯P(guān)聯(lián)用戶使用業(yè)務(wù)的類型、業(yè)務(wù)量,挖掘用戶使用業(yè)務(wù)的熱點,以此來指導(dǎo)網(wǎng)絡(luò)建設(shè)。
(1)用戶停留的數(shù)據(jù)提取方法
用戶停留數(shù)據(jù)包括一系列的業(yè)務(wù)使用記錄點集P(p1, p2, ……, pn),其中n為位置記錄點的數(shù)量,每一個記錄點是一個三元素集合pi(lat, long, T),其中(lat, long)是用戶發(fā)生業(yè)務(wù)的紀錄基站;T為用戶發(fā)生業(yè)務(wù)的時間。
由于用戶發(fā)生業(yè)務(wù)不是聯(lián)系的,它跟GPS點不一樣,因此用戶停留分析需要連續(xù)觀察一段時間內(nèi)用戶在某個區(qū)域發(fā)生業(yè)務(wù)的頻率,以此來反應(yīng)用戶在特定時間段在某一個區(qū)域的停留特征。在本文是連續(xù)觀察某一個地市一個月的用戶在某一個基站、某一個時間段發(fā)生業(yè)務(wù)的次數(shù)、每天發(fā)生業(yè)務(wù)的頻率,以此來識別用戶是否在該區(qū)域具有停留的特征。本文對停留定義的規(guī)則是用戶在一個月內(nèi)平均每天在某一個時間段在某一個基站上發(fā)生業(yè)務(wù)的概率大于0.7,那么就認為該用戶在基站具有停留的特征。
(2)用戶的停留特征分析
基于上述的定義,本文把某地市移動用戶在工作停留區(qū)、休息停留區(qū)的用戶停留特征進行GIS展現(xiàn),如下圖所示。從圖1可以看出,用戶的工作停留區(qū)域主要分布在紅色區(qū)域,該區(qū)域是該地市的行政中心,也是人口比較集中的區(qū)域。從圖2可以看出,用戶的休息停留區(qū)也是分布在紅色區(qū)域,但較圖1而言,圖2所覆蓋的區(qū)域更大,因此可以判斷出該行政中心主要的功能還是住宅,工作區(qū)域已經(jīng)逐漸遷出郊區(qū)方向。
2.2 用戶業(yè)務(wù)使用熱點分析
分析用戶業(yè)務(wù)使用熱點能夠使現(xiàn)有的無線通信資源實現(xiàn)優(yōu)化配置,極大提高資源利用率,有效調(diào)節(jié)該區(qū)域業(yè)務(wù)量不均衡的狀態(tài),提高用戶滿意度。
(1)用戶業(yè)務(wù)使用熱點的數(shù)據(jù)提取方法
用戶通信熱點數(shù)據(jù)包括一系列的業(yè)務(wù)使用記錄點集P(p1, p2, ……, pn),其中n為位置記錄點的數(shù)量,每一個記錄點是一個五元素集合pi(lat, long, T, B, N),其中(lat, long)是用戶發(fā)生業(yè)務(wù)的紀錄基站;T為用戶發(fā)生業(yè)務(wù)的時間;B是業(yè)務(wù)的使用類型,包括語音和數(shù)據(jù);N是業(yè)務(wù)量的使用數(shù)量。
(2)用戶業(yè)務(wù)使用的熱點
利用全網(wǎng)基站語音、流量數(shù)據(jù)與基站的覆蓋范圍,計算全網(wǎng)業(yè)務(wù)使用量的密度,并通過GIS對全網(wǎng)業(yè)務(wù)量進行渲染,根據(jù)業(yè)務(wù)量的密度分析全網(wǎng)業(yè)務(wù)使用量熱點。
用戶使用業(yè)務(wù)熱點分析是根據(jù)基站發(fā)生的業(yè)務(wù)量(語音量、數(shù)據(jù)流量)與基站的覆蓋面積(通過泰森多邊形確定)構(gòu)建全網(wǎng)的業(yè)務(wù)量分布熱點圖。通過對業(yè)務(wù)量密度進行分檔以及對不同的顏色進行渲染,最后得到業(yè)務(wù)量密度高的基站,并把這些基站的覆蓋范圍作為熱點的范圍。本文通過對3G網(wǎng)絡(luò)的業(yè)務(wù)量在不同時間段的熱點進行渲染,分別得到了不同時間段的語音熱點、流量熱點。通過對比圖3~圖6不同時間段語音和流量的熱點分布圖,得知該區(qū)域的流量熱點在閑時忙時差異不是特別大,相反語音在閑時忙時差異很大。由此可以得知,在網(wǎng)絡(luò)建設(shè)時,需要根據(jù)用戶的業(yè)務(wù)使用量的時空分布特征有側(cè)重性進行資源調(diào)節(jié),提高網(wǎng)絡(luò)利用率,有效解決網(wǎng)絡(luò)的超負荷問題。
3 用戶價值區(qū)域特征的分析研究
隨著通信技術(shù)和移動互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)業(yè)務(wù)已經(jīng)取代傳統(tǒng)的語音業(yè)務(wù),流量業(yè)務(wù)的增長不僅對運營商的網(wǎng)絡(luò)運營帶來巨大的壓力,同時也給運營商自身的利潤帶來挑戰(zhàn)。當(dāng)前運營商的重要任務(wù)是如何掌握用戶的價值,通過對用戶價值區(qū)域進行甄別,使得運營商合理地將優(yōu)先的網(wǎng)絡(luò)資源分配給高價值的用戶使用業(yè)務(wù)的區(qū)域,實現(xiàn)資源的精準投資,降低網(wǎng)絡(luò)資源負載過重的現(xiàn)象,限制那些對運營商貢獻少但又占用極大網(wǎng)絡(luò)資源的業(yè)務(wù)來保證網(wǎng)絡(luò)質(zhì)量,從而為高價值的用戶群體提供更高速、更持續(xù)的網(wǎng)絡(luò)服務(wù),提高高價值用戶的用戶感知。
3.1 價值區(qū)域數(shù)據(jù)提取方法
用戶價值是利用用戶的話務(wù)詳單、流量詳單以及工參等數(shù)據(jù),實現(xiàn)區(qū)域的流量分析、流量回落分析、高價值用戶分析、終端分析以及收入分析,以確定用戶的高價值區(qū)域,為網(wǎng)絡(luò)精準規(guī)劃和優(yōu)化提供支撐。
用戶價值數(shù)據(jù)包括一系列的業(yè)務(wù)使用記錄點集P(p1, p2, ……, pn),其中n為位置記錄點的數(shù)量,每一個記錄點是一個八元素集合pi(lat, long, T, B, N, package, I, terminal),其中(lat, long)是用戶發(fā)生業(yè)務(wù)的紀錄基站;T為用戶發(fā)生業(yè)務(wù)的時間;B是業(yè)務(wù)的使用類型,包括語音和數(shù)據(jù);N是業(yè)務(wù)量的使用數(shù)量;package表示用戶的套餐類型;I表示用戶的收入;terminal表示用戶的終端類型。
3.2 用戶價值區(qū)域多維分析
(1)流量分析
通過對每一個基站發(fā)生的流量進行匯總,通過流量排名的方法對基站的流量進行排名,按照實際的需求挖掘高流量的區(qū)域。如圖7所示,運營商可以根據(jù)實際的需要分析topN的基站,分析高流量區(qū)域的地理分布以及聚集區(qū)域。
(2)流量回落分析
如圖8所示,通過對每一個基站的流量回落進行分析,結(jié)合該基站被覆蓋的4G基站的情況、不同終端發(fā)生的流量、不同制式的終端流量發(fā)生情況,找到導(dǎo)致該基站發(fā)生回落的原因,為運營商的基站建設(shè)和擴容提供有價值的信息。
(3)高價值用戶分析
如圖9所示,高價值用戶分析主要是關(guān)注高價值用戶發(fā)生業(yè)務(wù)的區(qū)域、流量分級,以此挖掘高流量用戶聚集的區(qū)域分布以及業(yè)務(wù)特征。
(4)終端分析
如圖10所示,結(jié)合不同制式的終端滲透率以及流量排名,以此挖掘滿足終端滲透率需求以及流量需求的區(qū)域,為運營商的基站建設(shè)和擴容提供必要性的條件。
(5)多維關(guān)聯(lián)分析
通過對上述的流量分析、流量回落分析、高價值用戶分析、終端分析進行多維關(guān)聯(lián),為運營商的網(wǎng)絡(luò)規(guī)劃和建設(shè)提供一個綜合性的解決方案。從圖11可以看到,運營商可以根據(jù)各項選項進行關(guān)聯(lián)分析,挖掘有價值的區(qū)域。
4 結(jié)論
隨著4G時代的到來,業(yè)務(wù)的性能越來越成為運營商和終端用戶的共同關(guān)注點。面向移動數(shù)據(jù)業(yè)務(wù)的網(wǎng)絡(luò)質(zhì)量評估面臨新的挑戰(zhàn),本文通過用戶行為和價值區(qū)域特征分析的特點,反映基于用戶感知的網(wǎng)絡(luò)質(zhì)量情況,實現(xiàn)有效利用當(dāng)前網(wǎng)絡(luò)資源,達到精準化投資的目的。
參考文獻:
[1] 劉瑜,肖昱,高松,等. 基于位置感知設(shè)備的人類移動研究綜述[J]. 地理與地理信息科學(xué), 2011,27(4): 8-13.
[2] Gonzalez M C, Hidalgo C A, Barabasi A L. Understanding individual human mobility patterns[J]. Nature, 2008,453(7196): 779-782.
[3] Chinrungrueng C, Sequin C H. Optimal adaptive k-means algorithm with dynamic adjustment of learning rate[J]. IEEE Transactions on neural networks, 1995,6(1): 157-169.
[4] Davies D L, Bouldin D W. A Cluster Separation Measure[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1979(2): 224-227.
[5] Dunn J C. A Fuzzy Relative of Isodata Process and Its Use in Detecting Compact Well——Separated Clusters[J]. Cybernetics and Systems, 1973,3(3): 32-57.
[6] Song C, Qu Z, Blumm N, et al. Limits of predictability in human mobility[J]. Science, 2010,327(5968): 1018-1021.
[7] 徐贊新,王鉞,司洪波,等. 基于隨機矩陣理論的城市人群移動行為分析[J]. 物理學(xué)報, 2011,60(4): 46-52.
[8] Phithakkitnukoon S, Horanont T, Di Lorenzo G, et al. Activity-aware map: Identifying human daily activity pattern using mobile phone data[A]. Salah A A, Gevers T, Sebe N, et al. Human Behavior Understanding[C]. Berlin: Springer Berlin Heidelberg, 2010: 14-25.
[9] 湯燕娟,張小剛. 業(yè)務(wù)預(yù)測與無線網(wǎng)話務(wù)量分析方法初探[J]. 電信工程技術(shù)與標(biāo)準化, 2005(4): 77-83.
[10] 田萌. 移動數(shù)據(jù)業(yè)務(wù)話務(wù)分析及預(yù)測[D]. 北京: 北京郵電大學(xué), 2012.
[11] 琳琳,劉俊杉,李德忠,等. 數(shù)據(jù)業(yè)務(wù)密度圖生成方法及在TD-LTE網(wǎng)絡(luò)規(guī)劃中的應(yīng)用[J]. 電子工程技術(shù)與標(biāo)準化, 2013(3): 38-41.
作者簡介
顧震強:畢業(yè)于南京郵電大學(xué),現(xiàn)任廣州杰賽科技股份有限公司市場部副總經(jīng)理,從事移動通信網(wǎng)絡(luò)規(guī)劃設(shè)計及用戶行為分析等工作,長期跟蹤通信技術(shù)發(fā)展,曾主持參與國內(nèi)外多個運營商的網(wǎng)絡(luò)建設(shè)規(guī)劃編制。
梁楊:高級工程師,碩士畢業(yè)于清華大學(xué),現(xiàn)任職于中國移動通信集團設(shè)計院有限公司河北分公司,研究方向為電信領(lǐng)域IT支撐專業(yè)的咨詢、設(shè)計和規(guī)劃。
孫淳曄:助理工程師,碩士畢業(yè)于河北大學(xué),現(xiàn)任職于中國移動通信集團設(shè)計院有限公司河北分公司,研究方向為電信領(lǐng)域IT支撐專業(yè)的咨詢、設(shè)計。
王智宏:工程師,碩士畢業(yè)于北京交通大學(xué),現(xiàn)任職于中國移動通信集團設(shè)計院有限公司河北分公司,研究方向為電信領(lǐng)域IT支撐專業(yè)的咨詢和設(shè)計。