本刊記者 | 張鵬
“云-管-端”全數(shù)據(jù)采集運營商大數(shù)據(jù)能力“廣而不深”
本刊記者 | 張鵬
既然已經(jīng)具備了完整的大數(shù)據(jù)布局,而且后臺系統(tǒng)每年、每分鐘甚至是每秒都在產(chǎn)生大量的數(shù)據(jù),那么,運營商過去在大數(shù)據(jù)分析方面的表現(xiàn)如何,答案恐怕是令人遺憾的。
在ICT產(chǎn)業(yè)的發(fā)展歷程中,總是不乏有新概念的引領(lǐng),眼見著云計算從盲目熱炒漸漸走向了務(wù)實應(yīng)用,“大數(shù)據(jù)”又揭竿而起,再度成為今年以來產(chǎn)業(yè)界的最熱門詞匯。
不過,與云計算在概念初期的“云里霧里”不同,大數(shù)據(jù)顯得更加“有理有據(jù)”。事實上,早在幾年前,當(dāng)國內(nèi)還在討論“大數(shù)據(jù)究竟是什么”這個問題的時候,美國總統(tǒng)奧巴馬就已經(jīng)利用數(shù)據(jù)挖掘技術(shù),幫助其自己實現(xiàn)政界連任的目標(biāo)。
2014年春節(jié)期間,以百度為代表的一系列互聯(lián)網(wǎng)巨頭開始在中國的大數(shù)據(jù)舞臺上粉墨登場,如央視新聞就利用了百度地圖定位而來的數(shù)據(jù),詳盡且真實地展現(xiàn)了極具中國特色的“春節(jié)遷徙大潮”。隨即,騰訊、阿里等互聯(lián)網(wǎng)企業(yè)也紛紛開放了自己的數(shù)據(jù)后臺,以供產(chǎn)業(yè)鏈的相關(guān)企業(yè)進行精準(zhǔn)營銷和廣告推送。
然而,大數(shù)據(jù)應(yīng)用并非互聯(lián)網(wǎng)企業(yè)的“特長”,而應(yīng)該是電信運營商的主場。中國移動通信集團公司業(yè)務(wù)支撐系統(tǒng)部項目經(jīng)理何鴻凌也表示,數(shù)據(jù)是第一等競爭力,更多的數(shù)據(jù)會勝過更好的算法,數(shù)據(jù)甚至可以列入資產(chǎn)負(fù)載表。
眾所周知,大數(shù)據(jù)之所以受到業(yè)界追捧,是因為基于海量巨大的信息數(shù)據(jù),通過復(fù)雜的挖掘技術(shù)在合理時間內(nèi)獲取、清洗、提煉而形成的對企業(yè)經(jīng)營策略和銷售行為益的信息。確切地說,傳統(tǒng)的咨詢分析是基于抽樣數(shù)據(jù),而大數(shù)據(jù)得到的結(jié)論卻是基于全體數(shù)據(jù)的結(jié)果,其準(zhǔn)確性顯然更勝一籌。而放眼當(dāng)下的互聯(lián)網(wǎng)產(chǎn)業(yè),除了BAT(百度、阿里、騰訊)之外,恐怕再難找出具備相當(dāng)“數(shù)據(jù)實力”的企業(yè)。
讓我們看看,運營商的數(shù)據(jù)實力究竟如何?根據(jù)中國移動2013年底的內(nèi)部統(tǒng)計資料顯示,中國移動的網(wǎng)絡(luò)上每天將產(chǎn)生100TB的信令數(shù)據(jù),每分鐘產(chǎn)生800萬次通話,每秒發(fā)送2.4萬條短信,每分鐘應(yīng)用下載量1142人次。
另據(jù)記者了解,目前,國內(nèi)運營商已經(jīng)能夠做到從云-管-端的各環(huán)節(jié)中采集數(shù)據(jù),其中的云,即運營商自己的后臺網(wǎng)站和APP服務(wù)器,運營商根據(jù)自己的采集準(zhǔn)則獲取數(shù)據(jù)資源;在管道方面,運營商不僅面向無線網(wǎng)絡(luò)、有線寬帶獲取數(shù)據(jù),同時也能延伸至一些軟的管道上(如百度輕應(yīng)用);在端的部分,運營商一方面積累了用戶終端的流經(jīng)軌跡(這部分與管道數(shù)據(jù)類似),另一方面也通過瀏覽器插碼和APP SDK等軟件,獲取了更加直觀的個體用戶數(shù)據(jù)。
既然已經(jīng)具備了完整的大數(shù)據(jù)布局,而且后臺系統(tǒng)每年、每分鐘甚至是每秒都在產(chǎn)生大量的數(shù)據(jù),那么,運營商過去在大數(shù)據(jù)分析方面的表現(xiàn)又是如何,答案恐怕是令人遺憾的。由于運營商后臺系統(tǒng)多為省級割據(jù),不同業(yè)務(wù)系統(tǒng)間也是相互獨立且無法互通,這使得運營商的大數(shù)據(jù)能力“廣而不深”。
相關(guān)廠商的技術(shù)人士對此表示,運營商內(nèi)部過去多采用傳統(tǒng)的技術(shù)平臺(小型機+存儲陣列),數(shù)據(jù)采集上難以適應(yīng)大數(shù)據(jù)規(guī)模性采集的需要,加上傳統(tǒng)的數(shù)據(jù)源系統(tǒng)和數(shù)據(jù)庫方式,無法源源不斷地提供分布式的數(shù)據(jù)導(dǎo)出,這也是為什么分布式架構(gòu)X86服務(wù)器如今在數(shù)據(jù)中心大行其道的原因。
除以之外,大量的非結(jié)構(gòu)化數(shù)據(jù)也成為了擋在大數(shù)據(jù)面前的難關(guān),以圖片、視頻、文件等形式存在的非結(jié)構(gòu)化數(shù)據(jù),使得計算機難以輕易識別,尤其還要實現(xiàn)結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的結(jié)合。
正是意識與技術(shù)上的雙重匱乏,使得大數(shù)據(jù)在國內(nèi)電信運營業(yè)多年來都處在小步潛行的狀態(tài),難有實質(zhì)性進展。雖然國內(nèi)運營商2002年就已出現(xiàn)了大數(shù)據(jù)的“雛形”——經(jīng)營分析系統(tǒng),也稱BI,但經(jīng)過多年發(fā)展BI系統(tǒng)也無法全局化,很多時候只是針對某省中某一個特定業(yè)務(wù)的分析系統(tǒng),更多時候BI也只是業(yè)務(wù)過后領(lǐng)導(dǎo)辦公桌上的一張統(tǒng)計報表。
與此相比,國外電信運營商在大數(shù)據(jù)方面卻得到了長足的發(fā)展,不僅是數(shù)據(jù)挖掘和分析的技術(shù)日漸成熟,相應(yīng)的商業(yè)模式和合作機制也得到了不同程度的探索和拓展。
比較典型的有,西班牙電信基于大數(shù)據(jù)分析能力推出了“Smart Steps”產(chǎn)品,通過無線網(wǎng)絡(luò)中的用戶數(shù)據(jù),獲得某固定商圈內(nèi)的人流特征、消費特征甚至是客戶標(biāo)簽(包括識別規(guī)模用戶的身份地位、生存需求、成長需求以及社交需求等),以此來幫助那些想要開分店的零售商選擇更恰當(dāng)?shù)拈_店地址。AT&T的大數(shù)據(jù)應(yīng)用更加直接,通過分析用戶實現(xiàn)在電視、郵箱、手機亦或是電腦上的廣告推動和精準(zhǔn)投放。
正是看到了國外運營商將大數(shù)據(jù)變現(xiàn)的一個個真實案例,近兩年,國內(nèi)運營商也逐漸放開了自身在大數(shù)據(jù)領(lǐng)域的步子,開始思索如何向數(shù)據(jù)要效益的課題,比如利用綜合性數(shù)據(jù)對用戶進行深入洞察,用數(shù)據(jù)分析定位識別體系歸納出哪些是校園用戶、政企客戶以及家庭用戶,從而進行更加精準(zhǔn)的營銷。
在外部合作方面,以中國移動為例,近年來其不斷加強與政府組織和企業(yè)商戶的數(shù)據(jù)挖掘,比如智慧城市OD分析、商店選址助手、營銷指南針、景區(qū)客源分析、分析報告服務(wù)等方面。而在未來,運營商也有意愿在個性化推薦、地理信息服務(wù)、金融征信以及流量趨勢和熱點分析方面,尋找合作伙伴共同探索。