楊知玲 方樟填 謝爍爍
【摘 要】目前高校微信平臺(tái)日漸增長,各大高校紛紛創(chuàng)立各自的微信公眾號(hào)?,F(xiàn)在高校微信公眾平臺(tái)已成為高校信息推送的重要媒體,高校微信公眾平臺(tái)每次發(fā)送推文的瀏覽量,以及轉(zhuǎn)發(fā)量是衡量高校微信平臺(tái)影響力的重要因素,本文通過對(duì)微信公眾號(hào)和weka數(shù)據(jù)挖掘平臺(tái)進(jìn)行研究,通過對(duì)高校微信平臺(tái)用戶的使用意愿進(jìn)行深入詳細(xì)分析和挖掘,提出一種基于weka平臺(tái)的高校微信平臺(tái)用戶行為分析與預(yù)測模型。通過分析決策樹為高校微信平臺(tái)的發(fā)展提供參考。
【關(guān)鍵詞】高校;微信平臺(tái);用戶分析;weka
中圖分類號(hào): G206 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 2095-2457(2017)29-0025-002
【Abstract】At present, the WeChat platform in colleges and universities is increasing day by day. All major universities have set up their own WeChat public account. Now that the WeChat public platform in colleges and universities has become an important media for pushing information in colleges and universities, the number of times each page is sent by the WeChat public platform in colleges and universities and the forwarding volume is an important factor for measuring the influence of the WeChat platform in colleges and universities. Mining platform for research, through the use of the Weixin University platform users in-depth analysis and mining in depth, based on weka platform for university WeChat platform user behavior analysis and prediction model. By analyzing the decision tree for the development of university WeChat platform to provide a reference.
【Key words】University; WeChat platform; User analysis; Weka
如今,微信公眾平臺(tái)帶來的經(jīng)濟(jì)利益、精神利益正不斷攀升,使得申請(qǐng)平臺(tái)的用戶日益增長,高校也積極開放微信公眾號(hào)為高校用戶服務(wù)。在此,我們以華農(nóng)大珠江學(xué)院學(xué)生會(huì)的微信公眾號(hào)作為研究對(duì)象,對(duì)其每一次推文發(fā)送后在短時(shí)間內(nèi)的點(diǎn)擊量和截取一個(gè)時(shí)間段以來關(guān)注量的人數(shù)曲線進(jìn)行分析,挖掘用戶心態(tài),為高校微信公眾號(hào)的運(yùn)營提供借鑒,以提高高校信息傳播的有效性。
1 珠江學(xué)院微信公眾號(hào)用戶行為分析
本文采用華南農(nóng)業(yè)大學(xué)珠江學(xué)院微信公眾號(hào)平臺(tái)導(dǎo)出的數(shù)據(jù),對(duì)微信公眾號(hào)用戶行為分為用戶對(duì)公眾號(hào)的關(guān)注行為、用戶閱讀推文的行為和用戶分享推文行三類,并對(duì)三種類型行為的特點(diǎn)和產(chǎn)生該行為的原因及動(dòng)機(jī)進(jìn)行了分析。
1.1 珠江學(xué)院微信公眾號(hào)用戶關(guān)注行為
用戶關(guān)注行為是指微信用戶新關(guān)注、取消關(guān)注公眾號(hào),包括新關(guān)注人數(shù)、取消關(guān)注人數(shù)、凈增關(guān)注人數(shù)、累積關(guān)注人數(shù)等數(shù)據(jù)。
2016年7-9月、11月、3月新關(guān)注人數(shù)數(shù)量增加較大。高考志愿填報(bào)和錄取、舉辦中國大學(xué)生音樂節(jié)、“十佳歌手”活動(dòng)恰好是這幾個(gè)月份的重要活動(dòng),在一定程度上促使學(xué)生關(guān)注公眾號(hào)。然而,新關(guān)注人數(shù)能否保持甚至持續(xù)增加是衡量一個(gè)公眾號(hào)吸引力的重要考量指標(biāo)。
以2016年6月1日為起始點(diǎn),取消關(guān)注的人數(shù)在下滑,6月份到7月上旬恰逢畢業(yè)季,部分大四學(xué)生因?yàn)榧磳㈦x校,以及早前一個(gè)網(wǎng)絡(luò)投票活動(dòng)的結(jié)束,這可能是取消關(guān)注人數(shù)多的原因。
從問卷反饋的結(jié)果來看,學(xué)生取消關(guān)注公眾號(hào)的最主要原因是推文內(nèi)容無新意,陳乏老舊;對(duì)于不符合自身需求的公眾號(hào),同樣會(huì)選擇取消關(guān)注。而推文條數(shù)過多,不能有原創(chuàng)作品出現(xiàn)的公眾號(hào),也是取消關(guān)注的主要因素。
1.2 珠江學(xué)院微信公眾號(hào)用戶閱讀行為
用戶圖文閱讀行為是指微信用戶打開公眾號(hào)推文的行為,反映用戶圖文閱讀行為的統(tǒng)計(jì)數(shù)據(jù)有閱讀來源分布、閱讀發(fā)展趨勢,送達(dá)人數(shù)和圖文閱讀人數(shù)的比例閱讀方式等。
圖3是截取了部分推文閱讀點(diǎn)贊的統(tǒng)計(jì)數(shù)據(jù),可以看到,其中《新生攻略|校園分區(qū)大解說》最為突出,累積閱讀數(shù)、閱讀人數(shù)、分享轉(zhuǎn)發(fā)次數(shù)較高;其余四篇較高閱讀數(shù)的同樣是面向新生的推文。用戶愿意看的推文,是與自身需求密切相關(guān)的內(nèi)容,閱讀次數(shù)和人數(shù)較低的推文則與自身需求關(guān)聯(lián)不緊密,無法引起大部分學(xué)生閱讀興趣。
從調(diào)查問卷的結(jié)果可以看出,大部分用戶點(diǎn)開推文的主要原因是標(biāo)題吸引,其次原因是推文的描述與發(fā)生在自己身邊有關(guān),因朋友圈有人推薦而閱讀推文也是因素之一。
1.3 珠江學(xué)院微信公眾號(hào)用戶分享行為
用戶分享行為是指微信用戶分享一則推文的行為。微信公眾號(hào)的用戶是有限的,想要讓推文在網(wǎng)絡(luò)上傳播,利用微信分享推文來引導(dǎo)用戶關(guān)注新微信公眾號(hào)是一個(gè)重要渠道。
微信消息內(nèi)容與用戶相關(guān)。用戶關(guān)注微信公眾號(hào)的目的是希望通過這個(gè)平臺(tái)獲得自己所需要的各類信息資源。而用戶對(duì)于自己感興趣的、與自己利益相關(guān)的信息往往有更高的轉(zhuǎn)發(fā)意愿。分享數(shù)量越高的微信消息內(nèi)容與熱點(diǎn)相關(guān)越密切。學(xué)院的熱點(diǎn)消息很大程度上反應(yīng)了高校用戶的需求,高校微信公眾號(hào)推送此類推文時(shí),可以吸引大部分人的興趣,因此有很大的概率被用戶轉(zhuǎn)發(fā)。endprint
2 珠江學(xué)院微信公眾號(hào)用戶行為預(yù)測
本文借助weka數(shù)據(jù)挖掘的開源軟件作為工具,采用分類預(yù)測的方法,找出提高用戶閱讀和分享推文,減少取消關(guān)注行為的重要因素。本文采用問卷調(diào)查方法收集原始數(shù)據(jù),共收集209份數(shù)據(jù),其中2/3作為訓(xùn)練集,用于學(xué)習(xí)和構(gòu)建用戶行為模型;1/3作為測試集,作為模型準(zhǔn)確性的檢驗(yàn)。
2.1 推文特征值提取
通過微信后臺(tái)數(shù)據(jù)以及問卷調(diào)查的結(jié)果分析,可知微信公眾號(hào)中的推文推送時(shí)間、類型、特點(diǎn)等與用戶關(guān)注和取消關(guān)注行為、閱讀行為和互動(dòng)分享行為有一定相關(guān)性。
因此,本文提取影響微信用戶行為的因素作為特征值,如推文閱讀時(shí)間、推送方式、微信用戶使用動(dòng)機(jī)。
2.2 用戶行為預(yù)測
在數(shù)據(jù)的預(yù)處理中,本文將一些無用多余的數(shù)據(jù)如序號(hào)等數(shù)據(jù)刪除。閱讀時(shí)間“sj”這一屬性的屬性值相對(duì)較多,對(duì)時(shí)間進(jìn)行離散化,將0-6時(shí)設(shè)為1,6-9時(shí)設(shè)為2,9-12時(shí)設(shè)為3……21-24時(shí)設(shè)為7。一周推文數(shù)用“TWS”表示,將一周一條設(shè)為a,一周2-3條設(shè)為b,一周4-5條設(shè)為c,一周6-7條設(shè)為d;關(guān)注原因用“gzyy”表示,按選項(xiàng)分別設(shè)為G1,G2,G3,G4,G5;閱讀原因用“YDYY”表示,按選項(xiàng)分別設(shè)為Y1,Y2,Y3,Y4,Y5,Y6,Y7;;推薦原因用“TJYY”表示,按選項(xiàng)分別設(shè)為T1,T2,T3,T4;吸引閱讀原因用“XY”表示,按選項(xiàng)分別設(shè)為X1,X2,X3,X4,X5;對(duì)自己是否有幫助用“BZ”表示,“T”表示對(duì)自己有幫助,“F”表示對(duì)自己沒有幫助。
分類屬性是用戶行為中的取消關(guān)注、閱讀行為和分享互動(dòng)行為。取消關(guān)注用“QG”表示,按選項(xiàng)分別設(shè)為Q1,Q2,Q3,Q4,Q5,Q6?;?dòng)程度用“HD”表示,互動(dòng)程度由低往高由h1-h5表示。分享互動(dòng)用“FX”表示,“Y”表示分析,“N”表示不分享。
原始數(shù)據(jù)經(jīng)過處理后,加載到WEAK中,對(duì)訓(xùn)練集采用c4.3算法進(jìn)行學(xué)習(xí),十折交叉驗(yàn)證測試,運(yùn)行后得到QG、HD、FX的分類準(zhǔn)確率分別為0.89、0.78、0.89。
測試集數(shù)據(jù)進(jìn)行訓(xùn)練和評(píng)估,查看統(tǒng)計(jì)信息中測試集的預(yù)測結(jié)果,QG預(yù)測值和實(shí)際值都為q2,有181個(gè)數(shù)據(jù)被預(yù)測正確,有22個(gè)數(shù)據(jù)被預(yù)測錯(cuò)誤。HD預(yù)測值和實(shí)際值都為h3,有159個(gè)數(shù)據(jù)被預(yù)測正確,有44個(gè)數(shù)據(jù)被預(yù)測錯(cuò)誤;FX預(yù)測值和實(shí)際值分別是Y,有181個(gè)數(shù)據(jù)被預(yù)測正確,有22個(gè)數(shù)據(jù)被預(yù)測錯(cuò)誤。
從實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn)本文提出的微信用戶行為預(yù)測模型是有效的,可以作為預(yù)測微信用戶行為的方法。
通過圖7,筆者看到?jīng)Q策樹的根節(jié)
點(diǎn)是從“SJ”這個(gè)因素開始的,分支由“HD”和“YDYY”兩個(gè)因素判定,即通過決策樹可以推出最影響高校微信平臺(tái)用戶閱讀的因素是“SJ”時(shí)間因素,“HD”和“YDYY”是影響高校微信平臺(tái)用戶閱讀的主要因素。
(1)時(shí)間因素是影響高校微信平臺(tái)用戶最主要的因素,用戶更傾向于在21-24時(shí)閱讀高校微信平臺(tái)推文。
(2)標(biāo)題吸引是吸引高校微信平臺(tái)用戶閱讀的主要因素。
(3)高校微信平臺(tái)用戶對(duì)微信平臺(tái)的互動(dòng)程度并不滿意。
3 珠江學(xué)院微信公眾號(hào)運(yùn)營建議
(1)高校微信平臺(tái)推送時(shí)間應(yīng)設(shè)為21-24時(shí)。推送時(shí)間是影響高校微信平臺(tái)用戶最主要的因素,高校在推送文章時(shí)應(yīng)在大量用戶閱讀的時(shí)間段,這樣才能讓用戶第一時(shí)間點(diǎn)擊閱讀。在當(dāng)天需推送晚上的活動(dòng)時(shí),可考慮提前做好推送稿,這樣活動(dòng)結(jié)束后可迅速修改并發(fā)布。
(2)高校微信平臺(tái)應(yīng)提高互動(dòng)能力。運(yùn)營團(tuán)隊(duì)要通過各種線上、線下的活動(dòng)獲取新粉絲,獲取新粉絲后要通過運(yùn)營手段激活用戶,比如話題留言精選點(diǎn)贊數(shù)排名前三可獲贈(zèng)小禮品、轉(zhuǎn)發(fā)推文可以獲得指定商家發(fā)放的優(yōu)惠券。通過一系列的手段,使部分粉絲選擇存留下來,并且給公眾號(hào)帶來人氣。
(3)推送文章時(shí)應(yīng)琢磨一個(gè)好的標(biāo)題。微信用戶第一眼看到的是標(biāo)題,如果標(biāo)題沒有吸引力的話,那么他們就不會(huì)點(diǎn)擊。標(biāo)題一定要實(shí)在,一定要有內(nèi)容,同時(shí)也要文章關(guān)鍵詞,然后加上“數(shù)字、疑問、限時(shí)明星熱門事件、跨年”這類具有吸引力的詞語。
(4)文章內(nèi)容以幽默和實(shí)用性為主。首先,要注重內(nèi)容的實(shí)用性和趣味性。具有這兩種特點(diǎn)的內(nèi)容是很多用戶都非常喜歡的。尤其是在生活壓力越來越大的今天,閑暇之余讀一些有趣實(shí)用的知識(shí),不但能夠增長見聞,還能給自己帶來快樂。高校微信平臺(tái)做微信內(nèi)容時(shí)一定要考慮其實(shí)用性和趣味性。其次在文章中可適當(dāng)使用一些網(wǎng)絡(luò)詞語或自我調(diào)侃,提高文章幽默性。
【參考文獻(xiàn)】
[1]李平榮.大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘技術(shù)與應(yīng)用[D].重慶:重慶三峽學(xué)院學(xué)報(bào),2014.
[2]田野.基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)購物市場問卷調(diào)查數(shù)據(jù)分析[D].遼寧:吉林大學(xué),2014.
[3]趙辰瑋.高校微信公眾號(hào)圖文消息閱讀行為研究_以河北大學(xué)青年微信平臺(tái)為例[D].新聞知識(shí).2015.
[4]黃煒.基于微信用戶行為的分享預(yù)測模型研究[D].情報(bào)理論與實(shí)踐.2016.
[5]郭愛芳.微信公眾號(hào)持續(xù)關(guān)注度影響因素的實(shí)證分析_基于信息特性視角[D].情報(bào)雜志.2017.endprint