高鵬群 鄧建高
[摘 要]在線社交網(wǎng)絡(luò)精準營銷是現(xiàn)代營銷理論的重點發(fā)展方向。文章以新浪微博用戶作為研究對象,分析用戶微博文本內(nèi)容信息,創(chuàng)建微博用戶交互內(nèi)容數(shù)據(jù)庫。運用復(fù)雜網(wǎng)絡(luò)分析方法構(gòu)建加權(quán)用戶關(guān)系網(wǎng)絡(luò)。最后,基于潛在用戶價值分析,采用改進的k-核分解方法實現(xiàn)在線社交網(wǎng)絡(luò)新客戶識別。該方法兼顧文本內(nèi)容信息和用戶影響力因素,精準識別在線社交網(wǎng)絡(luò)中的新客戶,實現(xiàn)企業(yè)精準化營銷對象發(fā)現(xiàn)。
[關(guān)鍵詞]k-核分解;在線社交網(wǎng)絡(luò);精準營銷;新客戶識別
[DOI]10.13939/j.cnki.zgsc.2018.17.119
1 引 言
中國已形成龐大的在線社交網(wǎng)絡(luò)。2018年中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的第41次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》[1]數(shù)據(jù)顯示,截至2017年12月,中國網(wǎng)民規(guī)模達7.72億,互聯(lián)網(wǎng)普及率達到55.8%。網(wǎng)民數(shù)量的激增推動了新浪微博、微信等在線社交網(wǎng)絡(luò)新媒體平臺的迅猛發(fā)展,其對市場營銷和計算廣告產(chǎn)生重大影響。
基于在線社交網(wǎng)絡(luò)和大數(shù)據(jù)的精準營銷將是企業(yè)營銷理論發(fā)展的方向。一方面,在線社交網(wǎng)絡(luò)塑造了全新的社會生活形態(tài),成為產(chǎn)品推廣、營銷互動以及挖掘潛在客戶的重要平臺。低成本、高效率以及個性化傳播等特點,決定了其作為精準營銷手段的巨大潛力。在線社交網(wǎng)絡(luò)被認為是現(xiàn)代企業(yè)開展高效精準營銷最有效的方法。[2]另一方面,大數(shù)據(jù)環(huán)境下,在線社交網(wǎng)絡(luò)平臺保存了大量用戶數(shù)據(jù)信息,海量數(shù)據(jù)為目標客戶準確定位提供了強大的支持。面對以“分眾市場”為主要特征的現(xiàn)代市場,消費者需求越來越細分化,企業(yè)具備從網(wǎng)絡(luò)平臺獲取營銷信息的能力,有助于細分目標市場,識別潛在新客戶。
目前,關(guān)于精準營銷的研究主要集中在內(nèi)涵分析和體系構(gòu)建等方面。現(xiàn)代營銷大師Philip Kotler首先分析了精準營銷的內(nèi)涵,他認為企業(yè)需要更精準、可衡量和高投資回報的營銷溝通,制定更具針對性的營銷策略。新客戶的精準識別正是企業(yè)精準營銷的重要目標,精準營銷的關(guān)鍵在于理解目標客戶的行為、愛好與需求,然后將這些信息應(yīng)用到獲取新客戶的過程中?,F(xiàn)有研究多從新客戶的特點和重要性出發(fā),提出了新客戶識別的技術(shù)和方法,其成果為精準營銷新客戶識別的深入探究提供了借鑒。然而,現(xiàn)有基于海量數(shù)據(jù)的精準營銷新客戶識別研究成果較少。在線社交網(wǎng)絡(luò)環(huán)境下,企業(yè)精準營銷新客戶識別的關(guān)鍵是找到合適的數(shù)據(jù),掌握潛在客戶的情況,特別是影響力大的潛在客戶,并進行精準的歸類與定位。下文以新浪微博用戶為例,采用復(fù)雜網(wǎng)絡(luò)改進k-核分解法進行新客戶的挖掘。
2 微博文本分析與用戶關(guān)系網(wǎng)絡(luò)構(gòu)建
微博作為在線社交網(wǎng)絡(luò)主要應(yīng)用形式,兼具社會網(wǎng)絡(luò)和社交平臺的特征,微博已成為企業(yè)開展營銷策劃活動的重要平臺。以新浪微博華為榮耀手機相關(guān)微博信息為例,其微博內(nèi)容可分為兩類:一類為華為榮耀手機購買者的微博信息,他們發(fā)布的購買以及使用體驗信息對其他用戶產(chǎn)生購買影響,對這部分貢獻現(xiàn)金流的老客戶,企業(yè)應(yīng)深入分析客戶資料,提高客戶關(guān)系管理水平,進而提高客戶忠誠度;另一類為華為榮耀手機的潛在購買者的微博信息,他們對榮耀手機有一定的關(guān)注,會對相關(guān)微博內(nèi)容進行轉(zhuǎn)發(fā)和推送,他們利用其社會聲望對廣大用戶產(chǎn)生影響,為企業(yè)帶來豐富的社會關(guān)系和強大的社會影響力,幫助企業(yè)識別新客戶。
傳播在用戶間的微博信息蘊含了巨大的營銷價值,然而由于目標群體過于龐大,企業(yè)營銷資源有限,亟須縮小范圍,對部分用戶實施更具針對性的營銷策略。一方面,現(xiàn)代企業(yè)的發(fā)展更看重預(yù)期收益,相比于老客戶流失的必然性,新客戶的獲得帶動市場新增長,為企業(yè)創(chuàng)造新的市場空間,開發(fā)新客戶意義遠大于維護老客戶。另一方面,在線社交網(wǎng)絡(luò)的興起,影響力已經(jīng)成為用戶行為管理和關(guān)系形成的關(guān)鍵因素,[3]這種社會影響力有利于營銷信息的廣泛傳播,[4]而高影響力的客戶正是新客戶識別的關(guān)鍵。[5]潛在購買用戶群體中,尤其是購買意愿強烈且具有廣泛社會影響力的用戶將是精準營銷的重點客戶。
2.1 微博信息的抓取與整理
基于新浪微博數(shù)據(jù)平臺,通過八爪魚采集器爬取了27023條華為榮耀手機潛在用戶的微博信息,共956名微博用戶。將采集到的微博信息進行分類整理,建立微博用戶交互內(nèi)容數(shù)據(jù)庫。采集到的榮耀手機微博信息主要包括以下六個方面:一是微博信息發(fā)布者;二是微博文本信息;三是微博轉(zhuǎn)發(fā)者;四是微博評論;五是微博推送對象;六是微博轉(zhuǎn)發(fā)和推送次數(shù)。
2.2 微博內(nèi)容文本分析
在新浪微博中,華為榮耀手機關(guān)注者對該產(chǎn)品的相關(guān)意見和觀點直接反映了用戶對產(chǎn)品的態(tài)度以及購買意愿。結(jié)合詞典,基于R語言軟件中的Rwordseg、jiebaR等程序包編寫代碼,對抓取到的微博文本內(nèi)容進行分詞處理,剔除停用詞和頻率較低的特征詞,最終實現(xiàn)文檔分詞。[6]然后提取與榮耀手機相關(guān)的關(guān)鍵評價詞,由于用戶購買意愿程度不同,因而對產(chǎn)品的評價褒貶不一,按照購買意愿程度將評價詞由強到弱分為五類,依據(jù)評價詞賦予原微博文本內(nèi)容發(fā)布者或評論者不同等級的評分(用δ表示),如表1所示。
鑒于用戶可能發(fā)布或評論多條微博內(nèi)容,文本內(nèi)容亦可能包含多個評價詞,因此,對用戶所被賦予的所有評分取平均值(若不為整數(shù)則向上取整)作為該用戶的最終評分值。用戶直觀分類使得企業(yè)可以有針對性地識別出潛在消費用戶。
2.3 構(gòu)建加權(quán)用戶關(guān)系網(wǎng)絡(luò)
分析微博平臺的特征、微博用戶間轉(zhuǎn)發(fā)和推送行為可以很好地表示用戶之間的信任關(guān)系及親密程度。下文依據(jù)前文所建微博用戶交互內(nèi)容數(shù)據(jù)庫,通過轉(zhuǎn)發(fā)和推送行為,構(gòu)建加權(quán)用戶關(guān)系網(wǎng)絡(luò)。其中,用戶關(guān)系網(wǎng)絡(luò)中的節(jié)點代表微博用戶,節(jié)點間有邊相連,邊即社會連帶,指通過分享經(jīng)驗或交流信息而產(chǎn)生的互動關(guān)系。邊上的權(quán)值表示用戶間聯(lián)系的緊密程度,權(quán)值越高,則表示聯(lián)系越緊密。借鑒復(fù)雜信任網(wǎng)絡(luò)構(gòu)造理論,[7]用戶間關(guān)系權(quán)值可由式(1)計算:
wij=[SX(]α[JB((]N(r)i,j+N(r)j,i[JB))]+β[JB((]N(m)j,i+N(m)i,j[JB))][]Ni+Nj[SX)](1)
其中:r表示轉(zhuǎn)發(fā)行為,m表示推送行為;Ni,j表示用戶i和用戶j之間轉(zhuǎn)發(fā)和推送的互動次數(shù);Ni表示用戶i發(fā)起的行為次數(shù);α與β為權(quán)重因子,分別表示轉(zhuǎn)發(fā)行為與推送行為的權(quán)重。由于推送微博信息中常含有用戶不感興趣的信息,因而賦予轉(zhuǎn)發(fā)行為較高的權(quán)重,取α=0.6,取推送行為權(quán)重β=0.4。下文結(jié)合榮耀手機的營銷推廣信息,集中選取數(shù)據(jù)庫中30名微博潛在用戶,根據(jù)用戶關(guān)系權(quán)值公式,構(gòu)建用戶加權(quán)網(wǎng)絡(luò),如圖1所示。
圖1 用戶加權(quán)網(wǎng)絡(luò)圖情況
3 在線社交網(wǎng)絡(luò)關(guān)鍵節(jié)點k-核挖掘算法
關(guān)鍵節(jié)點挖掘,即復(fù)雜網(wǎng)絡(luò)中最廣泛傳播影響節(jié)點發(fā)現(xiàn)問題,已成為目前最具研究價值的領(lǐng)域之一,[8]其目的是挖掘復(fù)雜網(wǎng)絡(luò)中最具信息傳播影響力的節(jié)點集合。[9]該問題是一個優(yōu)化問題,并且已經(jīng)被證明是NP-難的。[10]關(guān)鍵節(jié)點研究應(yīng)用領(lǐng)域極廣,學(xué)者們從不同的實際問題出發(fā)設(shè)計出各種各樣的算法。Kitsak等學(xué)者通過研究表明,在信息傳播影響力方面,核數(shù)比度數(shù)和介數(shù)等節(jié)點屬性更為有效地刻畫了節(jié)點的傳播效率,并認為信息傳播更穩(wěn)健的節(jié)點是根據(jù)k-核分解算法求得處于網(wǎng)絡(luò)中心的節(jié)點。[11]k-核分解算法對于識別復(fù)雜網(wǎng)絡(luò)傳播動力學(xué)中最關(guān)鍵節(jié)點具有重要價值。[12]
k-核分解法計算復(fù)雜度低,在分析大規(guī)模網(wǎng)絡(luò)層級結(jié)構(gòu)等方面應(yīng)用廣泛。近幾年不少學(xué)者受到這種思想的啟發(fā),對k-核算法進行了擴展改進,使之應(yīng)用范圍更廣,準確性更好。曹久新等學(xué)者考慮節(jié)點影響區(qū)域的重疊問題,提出核覆蓋算法(CCA),該算法在核數(shù)相同的情況下,考慮了節(jié)點的度數(shù)屬性,確保傳播節(jié)點可以更大程度上影響網(wǎng)絡(luò)中的其他節(jié)點。[13]
4 在線社交網(wǎng)絡(luò)新客戶識別
微博中最具影響力的少數(shù)用戶所發(fā)微博很快就能傳遍整個網(wǎng)絡(luò),[14]這些用戶的挖掘是企業(yè)微博精準營銷的關(guān)鍵。用戶關(guān)系網(wǎng)絡(luò)中新客戶的挖掘,類似于復(fù)雜網(wǎng)絡(luò)中關(guān)鍵節(jié)點的篩選。此類關(guān)鍵節(jié)點一般數(shù)量不多,但其影響卻能夠迅速波及網(wǎng)絡(luò)中大部分節(jié)點。[15]在信息傳播功能背景下對節(jié)點角色區(qū)分和排序,挖掘具有“消息引爆能力”的關(guān)鍵節(jié)點,可以應(yīng)用于市場營銷和廣告投放策略的研究中。[16]企業(yè)通過在線社交網(wǎng)絡(luò)平臺進行營銷推廣過程中,精準營銷下的新客戶對企業(yè)的產(chǎn)品最可能做出積極回應(yīng)并表現(xiàn)出強烈購買意愿;[17]同時,他們具有廣泛的社會影響力,能夠?qū)ζ渌脩舢a(chǎn)生影響,為企業(yè)發(fā)展規(guī)模龐大的潛在消費者群體,最終給企業(yè)帶來豐富利潤。
4.1 新客戶價值計算
基于微博文本信息和用戶行為信息,精準營銷新客戶價值包括用戶本身對企業(yè)產(chǎn)品的強烈購買意愿以及用戶為企業(yè)帶來的高社會影響力價值。以此為依據(jù),結(jié)合Wei等學(xué)者關(guān)于k-核分解加權(quán)度的改進計算,[18]進行在線社交網(wǎng)絡(luò)下精準營銷新客戶的挖掘,其計算方法如下:
4.2 基于k-核分解的新客戶挖掘過程
基于已構(gòu)建好的加權(quán)用戶網(wǎng)絡(luò)(見圖1),按照經(jīng)典k-核分解算法對網(wǎng)絡(luò)進行分解,結(jié)果如圖2所示。
圖2 用戶加權(quán)網(wǎng)絡(luò)k-核分解圖情況
節(jié)點核數(shù)從外至里依次是1,2,3,4,其分布呈層次結(jié)構(gòu)。依據(jù)用戶微博文本信息,對照購買意愿賦分表,由式(4)計算新用戶價值,對圖3中已分層的用戶網(wǎng)絡(luò)進行精準營銷新客戶的挖掘??紤]到用戶節(jié)點的廣泛影響能力及影響區(qū)域重疊問題,選定用戶節(jié)點后,標識其所有鄰居用戶節(jié)點為信息傳播的覆蓋狀態(tài),覆蓋狀態(tài)下的用戶節(jié)點將不再考慮。初始階段,每個節(jié)點都處于未覆蓋狀態(tài),每步在當(dāng)前核數(shù)最大并且未被覆蓋的節(jié)點中選定價值最大的節(jié)點用戶作為精準營銷新客戶。
首先,考慮核數(shù)最大的用戶節(jié)點集合,選取其中用戶價值最大的節(jié)點。核數(shù)為4的用戶節(jié)點計算數(shù)據(jù)如表2所示。
由表2得知,用戶節(jié)點B20的用戶價值為最大值144,因此選定用戶節(jié)點B20為精準營銷新客戶。同時,標識用戶節(jié)點B20所有鄰居節(jié)點的集合{B13、B14、B15、B19、B23、B24}為信息傳播覆蓋狀態(tài);其次,重復(fù)第一步,挖掘得到用戶節(jié)點B18、B11和⑧;最后,考慮到小核值用戶節(jié)點的影響能力相對較弱,當(dāng)用戶節(jié)點③選定后,對剩下核值為1的用戶節(jié)點不再進行精準營銷用戶節(jié)點的挖掘。綜上所述,精準營銷用戶節(jié)點集合為S={B20、B18、B11、⑧、③}。
對企業(yè)來說,精準營銷目標客戶群體確定后,企業(yè)可以集中資源,采取各種精準營銷手段對上述集合S中的用戶進行高效營銷推廣,最終實現(xiàn)企業(yè)精準營銷目標。
5 結(jié) 論
文章兼顧微博文本內(nèi)容與用戶影響力,探索了基于復(fù)雜網(wǎng)絡(luò)k-核分解算法的在線社交網(wǎng)絡(luò)精準營銷新客戶識別方法,為今后的研究提供理論和實踐參考。理論方面,對復(fù)雜網(wǎng)絡(luò)關(guān)鍵節(jié)點挖掘的k-核分解算法進行了擴展和改進,并運用到精準營銷新客戶識別的研究中。該方法可以準確、快速地挖掘出企業(yè)精準營銷所需新客戶;實踐方面,在線社交網(wǎng)絡(luò)的普及和低成本特性使得企業(yè)可以通過媒體平臺精準快速地識別新客戶,擴大企業(yè)市場占有率,提高經(jīng)濟效益。同時,在線社交網(wǎng)絡(luò)新媒體平臺上產(chǎn)生了大量的用戶文本信息,這些文本內(nèi)容的商業(yè)化和價值化使得微博、微信等平臺具備了成為強有力營銷工具的潛能。
此外,復(fù)雜網(wǎng)絡(luò)作為描述自然界和人類社會各種復(fù)雜系統(tǒng)的有力工具,目前已廣泛應(yīng)用于社會科學(xué)、生命科學(xué)和信息科學(xué)等領(lǐng)域。在線社交網(wǎng)絡(luò)屬于典型復(fù)雜網(wǎng)絡(luò)問題,它的發(fā)展優(yōu)化了大數(shù)據(jù)時代海量信息的共享、推薦和挖掘。運用復(fù)雜網(wǎng)絡(luò)技術(shù)手段開展在線社交網(wǎng)絡(luò)精準營銷研究將是未來研究工作的重點。
參考文獻:
[1]中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC).第41次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》[EB/OL].(2018-01-31).http://www.cac.gov.cn/2018-01/31/c_1122346138.htm.
[2]L PEI,Z YINI,Q F,et al.Information Diffusion in Structured Online Social Networks[J].Modern Physics Letters B,2015,29(13):65-76.
[3]Z ZHIGUO,S JINGQIN,K LIPING.Measuring Influence in Online Social Network Based on the User-content Bipartite Graph[J].Computers in Human Behavior,2015(52):184-189.
[4]ALFALAHI K,ATIF Y,ABRAHAM A.Models of Influence in Online Social Networks[J].International Journal of Intelligent Systems,2014,29(2):161-183.
[5]KUMAR V,PETERSEN JA,LEONE RP.How valuable is word of mouth?[J].Harvard Business Review,2007,85(10):2-9.
[6]伍萬坤,吳清烈,顧錦江.基于EM-LDA綜合模型的電商微博熱點話題發(fā)現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2015(11):33-40.
[7]唐曉波,孫飛.基于復(fù)雜信任網(wǎng)絡(luò)的社會化媒體好友推薦研究[J].情報理論與實踐,2015,38(11):96-102.
[8]L JIANHONG,G QIANG,D WENZHAO,et al.Identifying the Node Spreading Influence with Largest K-core Values[J].Physics Letters A,2014,378(45):3279-3284.
[9]方濱興.在線社交網(wǎng)絡(luò)分析[M].北京:電子工業(yè)出版社,2014:365-368.
[10]許宇光,潘驚治,謝惠揚.基于最小點覆蓋和反饋點集的社交網(wǎng)絡(luò)影響最大化算法[J].電子與信息學(xué)報,2016,38(4):795-802.
[11]MAKSIM K,LAZAROSK G,SHLOMO H,et al.Identification of Influential Spreaders in Complex Networks[J].Nature Physics,2010(11):888-893.
[12]任卓明,劉建國,邵鳳,等.復(fù)雜網(wǎng)絡(luò)中最小K-核節(jié)點的傳播能力分析[J].物理學(xué)報,2013,62(10):474-479.
[13]曹玖新,董丹,徐順,等.一種基于k-核的社會網(wǎng)絡(luò)影響最大化算法[J].計算機學(xué)報,2015,38(2):238-248.
[14]WENG J,LIM E P,JIANG J,et al.Twitterrank:Finding Topic-sensitive Influential Twitterers[M].Proceedings of the Third ACM International Conference on Web Search and Data Mining.New York:ACM Press,2010:261-270.
[15]ALBERT R,JEONG H,BARABASI A L.Error and attack tolerance of complex networks[J].Nature,2000(406):378-382.
[16]任曉龍,呂琳媛.網(wǎng)絡(luò)重要節(jié)點排序方法綜述[J].科學(xué)通報,2014(59):1175-1197.
[17]CUI G,WONG ML,WAN X.Targeting High Value Customers while Under Resource Constraint:Partial Order Constrained Optimization with Genetic Algorithm[J].Journal of Interactive Marketing,2014(29):27-37.
[18]WEI B,LIU J,WEI D,et al.Weighted K-shell Decomposition for Complex Networks based on Potential Edge Weights[J].Physica A:Statistical Mechanics and its Applications,2015(420):277-283.