(中國工程院戰(zhàn)略咨詢中心,北京 100088)
電信運營商基于移動互聯(lián)網(wǎng)門戶的精細化營銷系統(tǒng)研究
陳巖
(中國工程院戰(zhàn)略咨詢中心,北京 100088)
本文提出電信運營商基于移動互聯(lián)網(wǎng)門戶的精細化營銷系統(tǒng)實現(xiàn)方式,通過在部署分光器獲取用戶上網(wǎng)全流量數(shù)據(jù),采用深度分組檢測技術(shù)對這部分用戶數(shù)據(jù)進行深度分析,采用TOP N、聚類分析、關(guān)聯(lián)分析等進行用戶行為分析,最終根據(jù)用戶畫像結(jié)果為用戶展現(xiàn)個性化移動互聯(lián)網(wǎng)門戶。
精細化營銷;用戶行為分析;智能推送;流量經(jīng)營
中國互聯(lián)網(wǎng)絡(luò)信息中心CNNIC發(fā)布的《第37次中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》顯示,截至2015年12月,中國網(wǎng)民數(shù)量已達到6.88億,其中手機網(wǎng)民達6.2億,用手機接入互聯(lián)網(wǎng)的用戶占比由上年底的85.8%提升至90.1%,如圖1所示。隨著4G網(wǎng)絡(luò)覆蓋率的不斷提高,用戶上網(wǎng)設(shè)備不斷向移動端集中。
很多專家都已意識到運營商流量經(jīng)營已成為未來的趨勢,受限于傳統(tǒng)固網(wǎng)的思維方式,目前大多還是停留在經(jīng)營“流量費”上,進而導致用戶流量使用飛速增加,業(yè)務(wù)收入緩慢增長,甚至趕不上網(wǎng)絡(luò)投資成本,流量、收入剪刀差越拉越大。
按照傳統(tǒng)的門戶網(wǎng)站設(shè)計思路,需要用戶主動觸發(fā)到門戶網(wǎng)站,運營人員需要按照交換鏈接、論壇宣傳、搜索引擎推廣等傳統(tǒng)思路推廣。電信運營商門戶存在內(nèi)容和應(yīng)用缺乏、推廣經(jīng)驗欠缺等劣勢,如何發(fā)揮自有門戶的首訪優(yōu)勢,精準化推廣自有或合作業(yè)務(wù),成為電信運營商流量經(jīng)營的一種重要方式。
圖1 中國移動互聯(lián)網(wǎng)網(wǎng)民及其占網(wǎng)民比例
得益于控制機制的完善性,電信運營商掌握著豐富的網(wǎng)絡(luò)、平臺和用戶全景信息資源,通過對這些全息大數(shù)據(jù)的透視,得出用戶行為愛好,進而將用戶感興趣的內(nèi)容主動展現(xiàn)在門戶中,吸引用戶發(fā)現(xiàn)并且樂于使用運營商的自有業(yè)務(wù),成為電信運營商運營門戶網(wǎng)站的全新思路,也可能成為流量經(jīng)營的一種重要方式。
以EPC核心網(wǎng)為例,用戶訪問互聯(lián)網(wǎng)時,PDN GW將用戶請求送至互聯(lián)網(wǎng),通過在eNode B和Serving GW之間部署分光器獲取用戶上網(wǎng)全流量數(shù)據(jù),通過深度分組檢測技術(shù)對這部分用戶數(shù)據(jù)進行深度分析,可以得出用戶畫像。如圖2所示,數(shù)據(jù)采集模塊通過eNode B與Serving GW之間分光監(jiān)聽可以獲取用戶的GTP協(xié)議信令,其中S1-U是無線接入網(wǎng)與核心網(wǎng)之間傳送用戶數(shù)據(jù),可以以IPv4、IPv6或PPP中的任何格式傳輸,GTP-C可以解析出用戶的私網(wǎng)IP-手機號碼信息。通過對GTP信令的解析可以獲取用戶的完整訪問記錄,通過DPI技術(shù)可以獲得包括用戶的私網(wǎng)IP、MSISDN、授權(quán)標識、請求時間、訪問記錄等。
對用戶行為進行分析后,通過推送平臺將推送信息從PDN GW防火墻SGi口注入給用戶,用戶可以體驗到定制化的門戶。
用戶發(fā)起PDP激活請求,PDN GW響應(yīng)請求,并且返回分配給用戶的IP地址。用戶發(fā)起HTTP GET請求,如請求訪問網(wǎng)站www.xxx.com,數(shù)據(jù)采集模塊通過監(jiān)聽S1口的數(shù)據(jù),根據(jù)策略判斷為第一次PDP請求,并截獲該連接,推送平臺通過移動互聯(lián)網(wǎng)門戶系統(tǒng)的用戶行為數(shù)據(jù)分析,選取適合該用戶的策略然后給用戶組織相關(guān)頁面。
用戶行為分析實際上是一個從海量數(shù)據(jù)獲得有價值的信息的數(shù)據(jù)挖掘過程,通過對采集到的流量數(shù)據(jù)的過濾、預(yù)處理、綜合分析處理等程序,從中獲取有價值的分析結(jié)果,并以準確直觀的方式表示出來的過程。系統(tǒng)通過直接分析S11口的旁路碼流,得出業(yè)務(wù)數(shù)據(jù)信息和用戶上線信息數(shù)據(jù),進行數(shù)據(jù)分析。
圖2 用戶使用移動通信網(wǎng)絡(luò)上網(wǎng)路徑示意圖
如圖3所示,數(shù)據(jù)分組解碼模塊完成對數(shù)據(jù)分組的解碼操作,實現(xiàn)數(shù)據(jù)分組的初步處理,如判斷數(shù)據(jù)分組的正確性,獲取數(shù)據(jù)分組的IP、Port等相關(guān)信息。全業(yè)務(wù)分析模塊主要用于P2P業(yè)務(wù)、HTTP業(yè)務(wù)、即時通信等的業(yè)務(wù)分析,實現(xiàn)TOP N分析、聚類分析、關(guān)聯(lián)分析等。網(wǎng)站行為分析用于分析用戶訪問網(wǎng)站的行為,獲取用戶訪問網(wǎng)站的用戶、網(wǎng)站名、主機名、URL等信息。
圖3 用戶行為分析示意圖
2.1 TOP N分析
TOP N分析是網(wǎng)絡(luò)用戶行為分析的一種最常用的方法。因為對某類用戶行為進行分析時,TOP N用戶最大程度代表并影響了該類用戶的特性,而且對TOP N 用戶采取相應(yīng)的策略措施也是最有效的方式。TOP N分析法就是通過TOP N算法從研究對象中得到所需的N個數(shù)據(jù),并從排序列表中選取最大或最小的N個數(shù)據(jù),可以用于關(guān)鍵詞分析、用戶行為內(nèi)容偏好分析等。
通過重點觀察用戶的Web瀏覽行為,過濾出GTP分組中承載的HTTP數(shù)據(jù)分組,將相關(guān)數(shù)據(jù)傳送給數(shù)據(jù)清洗模塊留作后續(xù)分析。系統(tǒng)通過分詞處理,如樣本數(shù)據(jù)訓練、提取關(guān)鍵字列表、用戶消息內(nèi)容打標簽等進行分詞,在此基礎(chǔ)上提取出一類樣本數(shù)據(jù)的關(guān)鍵詞列表,存入分類詞庫中,最終根據(jù)分詞完成的用戶內(nèi)容標簽對所屬用戶的標簽內(nèi)容進行權(quán)重統(tǒng)計,將權(quán)重TOP前3的行為內(nèi)容偏好進行展現(xiàn)。
2.2 聚類分析
聚類方法是數(shù)據(jù)挖掘技術(shù)中的一種重要的方法,聚類算法的分類一般可分為基于層次的、基于劃分的、基于密度的、基于網(wǎng)格的和基于模型的5種。這5大類算法都有各自的優(yōu)點、缺點以及各自適合處理的環(huán)境。聚類的目的是進行用戶細分群組,從而為市場營銷等提供數(shù)據(jù)依據(jù),所以分類結(jié)果是要與現(xiàn)有運營商現(xiàn)有的套餐體系契合度越高越好,運營商現(xiàn)有的營銷套餐體系的特點是粗細結(jié)合、有層次的營銷體系,一般來說運營商業(yè)務(wù)分布是一個呈現(xiàn)層次結(jié)構(gòu)分布的系統(tǒng),所以選擇層次聚類是一個比較好的選擇,圖4是根據(jù)層次聚類的結(jié)果提供的是一個譜系圖。
圖4 層次聚類譜系圖
聚類數(shù)據(jù)處理流程如圖5所示,首先設(shè)置聚類記錄使用的維度、權(quán)重信息,從數(shù)據(jù)庫表初始化取聚類中心記錄,讀取待分析的記錄;字符串聚類采用哈明距離,數(shù)字直接算差值;計算1-N條記錄后對每個聚類中心的所有記錄重新計算出新的聚類中心,對于某些特定的類型,要選取實際存在的維度;聚類結(jié)果可以輸出到數(shù)據(jù)庫或文本文件等多種輸出格式。
圖5 聚類數(shù)據(jù)處理流程圖
2.3 其他用戶行為分析方式
關(guān)聯(lián)分析可以找出隱藏的關(guān)聯(lián)關(guān)系,例如把用戶的一種使用習慣和另外的使用習慣進行關(guān)聯(lián)分析,也可以把用戶的消費習慣和使用網(wǎng)絡(luò)習慣進行關(guān)聯(lián)分析,或者把用戶的自然屬性如年齡、性別、職業(yè)與使用網(wǎng)絡(luò)習慣進行關(guān)聯(lián)分析。
在時間序列數(shù)據(jù)庫中,某個屬性僅僅被看作時間段的一個點的時候才有意義。時序數(shù)據(jù)挖掘在網(wǎng)絡(luò)用戶行為的分析上主要體現(xiàn)在用戶上下線的時序分析和用戶使用業(yè)務(wù)以及內(nèi)容偏好的時序兩個方面。
決策樹是一種以實例為基礎(chǔ)的歸納學習算法,它著眼于從一組無次序、無規(guī)則的事例中推理出決策樹表示形式的分類規(guī)則,采用自頂向下的遞歸方式,在決策樹的內(nèi)部節(jié)點進行屬性值的比較,并根據(jù)不同屬性判斷從該結(jié)點向下的分支,在決策樹的葉節(jié)點得到結(jié)論,可以用于用戶流失分析等環(huán)節(jié)。
從流量經(jīng)營的角度來看,個性化門戶的核心目標就是提升流量價值,實現(xiàn)流量變現(xiàn),結(jié)合網(wǎng)絡(luò)部署、終端情況,歸納起來門戶可在流量加工、流量引導、流量合作、流量服務(wù)4種業(yè)務(wù)形態(tài)。
移動互聯(lián)網(wǎng)門戶可以攜帶用戶MSISDN、UA、目標URL等信息,由門戶系統(tǒng)組織導航頁面,添加用戶原始訪問鏈接并返回導航頁面給移動互聯(lián)網(wǎng)門戶。流量加工主要是對用戶訪問網(wǎng)絡(luò)的流量根據(jù)用戶終端配置、網(wǎng)絡(luò)情況等匹配,以提高用戶的業(yè)務(wù)使用感知。如通過頁面適配調(diào)整使用戶訪問結(jié)果更適于自己的終端,通過視頻文件的編碼轉(zhuǎn)換,提高用戶體驗等。流量引導用于業(yè)務(wù)推薦和用戶業(yè)務(wù)使用過程中的友好提醒。如通過初始頁面或toolbar提供資費查詢、套餐提醒、自營或合作業(yè)務(wù)推薦等功能。流量合作是指與SP進行深度流量合作,如定向流量包定制、后向付費等,提升用戶流量使用感知,拓寬流量收入來源。流量服務(wù)是基于流量的過濾與控制服務(wù),如針對中小學的綠色上網(wǎng)、涉黃網(wǎng)站屏蔽提醒等。
通過對移動互聯(lián)網(wǎng)門戶精細化營銷系統(tǒng)的運營,本系統(tǒng)的建設(shè)已取得初步效益。移動互聯(lián)網(wǎng)門戶的內(nèi)容包含用戶喜好個性化的視頻、電視、圖書、軟件下載、圖片、購物、資訊等大量內(nèi)容,通過向不同用戶推薦其喜好的內(nèi)容,吸引用戶主動訪問門戶看視頻、下載軟件,有效拉動了流量增長。
受益于主動推送,XX運營商移動互聯(lián)網(wǎng)門戶訪問量快速發(fā)展,試用4個月后平均日訪問PV值達453萬次,比建設(shè)前4月增長5.66倍,隨著用戶畫像的不斷建立,推送用戶二次點擊率從建設(shè)前的2.1%提升到9.7%。通過內(nèi)容精準推薦,有效的刺激了用戶超套餐,進一步推動用戶由低流量套餐包向高流量套餐包轉(zhuǎn)移,通過用戶流量使用行為推出的套餐自動升級服務(wù)也在每月月底得到大量的銷售。
[1]郭興國. 淺談運營商網(wǎng)絡(luò)流量精細化運營[J]. 科技與創(chuàng)新,2015(10).
[2]張第,羅曉娜,楊靜雯. 移動互聯(lián)網(wǎng)時代的用戶上網(wǎng)行為分析淺談[J]. 信息通信技術(shù),2014(4).
[3]殷小紅,王君. 流量精細化運營的網(wǎng)絡(luò)架構(gòu)方案[J]. 通信管理與技術(shù),2014(2).
[4]朱洪亮. 面向業(yè)務(wù)感知的流量監(jiān)控技術(shù)研究[D]. 北京:北京郵電大學,2010.
[5]陳敏,苗奪謙,段其國. 基于用戶瀏覽行為聚類用戶[J]. 計算機科學,2008,35(3).
The research of precision marketing system on the mobile Internet portal by telecom operators
CHEN Yan
(CAE Center for Strategic Studies, Beijing 100088, China)
Propose a method of precision marketing system based on the mobile Internet portal by telecom operators. The user Internet full fl ow data is obtained, the user data is depth analyzed using deep packet inspection technology, and user behavior analysis is accomplished by TOP N, cluster analysis and correlation analysis. Finally personalized mobile Internet portal is showed according to the user portrait results.
precision marketing; user behavior analysis; intelligent push; data fl ow operating
TN929.5
A
1008-5599(2017)02-0060-04
2016-12-15