高哲
摘? 要? 公共圖書館微信公眾號服務面對的用戶群體龐大且復雜,所提供的文化服務內(nèi)容多,如何獲取更優(yōu)質、用戶需求更大的文化服務內(nèi)容,是當前公共圖書館微信公眾號服務所面臨的挑戰(zhàn)之一。大數(shù)據(jù)的發(fā)展為公共圖書館微信公眾號傳播效果的研究帶來了新的契機。文章以國家圖書館微信公眾號為例,將聚類算法應用于圖文消息的特征數(shù)據(jù),在大數(shù)據(jù)視角下對公共圖書館微信公眾號消息傳播效果進行探究,為微信公眾號的運營工作提供科學的參考。
關鍵詞? 圖書館;微信公眾號;大數(shù)據(jù);聚類;算法
中圖分類號? G250? ? ? 文獻標識碼? A? ? ? 文章編號? 2096-0360(2020)17-0012-04
隨著互聯(lián)網(wǎng)以及移動應用技術的發(fā)展,基于微信的社交化閱讀方式的影響力不斷擴大。微信公眾平臺是基于微信的一個功能模塊,它注冊簡單、推送效率高、信息溝通速度快,所具有的一對多即時信息推送的特點使其在政府機構、企業(yè)、高校以及個人中得以廣泛應用。
公共圖書館擔負著為公眾提供文化服務的使命,“互聯(lián)網(wǎng)+”背景下的公共圖書館微信公眾號服務拓寬了公共圖書館的服務渠道[1],優(yōu)化了公共文化服務方式,推動其從傳統(tǒng)的服務模式轉向多媒體融合服務模式。目前,圖書館微信公眾號作為優(yōu)質的線上文化服務方式,已經(jīng)得到了較為廣泛深入的研究。然而,已有研究多是針對高校圖書館微信公眾號服務,對公共圖書館微信公眾號信息傳播效果的研究成果和深度還比較欠缺。公共圖書館微信公眾號服務面對的用戶基數(shù)大,范圍廣,用戶群體復雜,所提供的文化服務內(nèi)容多,如何從中獲取更優(yōu)質、用戶需求更大的文化服務內(nèi)容,是當前公共圖書館微信公眾號服務所面臨的挑戰(zhàn)之一。
已有對圖書館微信公眾號的量化研究多是基于大數(shù)據(jù)的微信傳播指數(shù)(WCI)的橫向研究,通過參考多個維度的數(shù)據(jù)計算各微信公眾號的WCI,進而進行多個微信公眾號的傳播影響力比較。李龍等人[2]通過利用WCI工具對35所高校圖書館微信公眾號進行量化比較,提出了高校圖書館微信公眾號建設舉措。王康等人[3]通過計算56所高校圖書館微信公眾號WCI指數(shù)及相關分析,對高校圖書館微信公眾號傳播影響力的因素進行了研究。對于特定的微信公眾號而言,進行量化的實證研究較少,且已有研究多是針對于高校圖書館微信公眾號。王曉慧等人[4]以武漢大學圖書館為例,通過推文標題、主題、閱讀數(shù)等的相關分析探究了影響高校圖書館微信公眾號信息傳播力的因素。李曉蔚[5]以四川大學圖書館微信公眾號為例,通過方差分析探究了微信公眾號傳播影響力的相關因素。這些研究通過對高校圖書館微信公眾號進行實證研究,探究了高校圖書館微信公眾號運營內(nèi)容以及運營方式的強化策略,從而提升高校圖書館的微信服務效能。
然而,以國家圖書館微信公眾號為例的公共圖書館微信公眾號用戶群體龐大且復雜,用戶行為和用戶需求更為多樣化,對公共圖書館微信公眾號的縱向研究還比較不足,對公共圖書館微信公眾號的信息傳播效果的衡量缺乏科學的標準體系。因而在傳統(tǒng)的對消息傳播效果策略進行研究的基礎上,探究如何從內(nèi)容種類豐富的消息服務中,動態(tài)獲取當前用戶更為偏愛的服務內(nèi)容,從而基于當前用戶內(nèi)容服務需求進行動態(tài)調整,顯得尤為重要。
機器學習方法中的無監(jiān)督聚類算法,通過數(shù)據(jù)驅動的方式,在綜合考慮推送順序、推送內(nèi)容等影響因素的基礎上,可以從大數(shù)據(jù)的視角下對內(nèi)容服務效果進行綜合考量。同時,該算法運算速度快,穩(wěn)定性相對較高,可移植性好,適合基于大量樣本數(shù)據(jù)進行學習,動態(tài)獲取用戶內(nèi)容服務需求,能夠為公共圖書館公眾號用戶需求服務提供方法學參考。
該研究將以國家圖書館微信公眾號為例,通過無監(jiān)督算法對圖文消息對應的特征數(shù)據(jù)進行聚類分析,從大數(shù)據(jù)視角下對消息傳播效果進行實證研究。結果表明,通過無監(jiān)督聚類方法所獲取的需求度更高的推送內(nèi)容符合相關研究中的頭條優(yōu)勢的原則;非參數(shù)檢驗結果顯示,通過聚類算法得到的兩類消息的用戶需求存在顯著性差異。與以往的基于推送內(nèi)容和推送順序的研究不同,利用機器學習方法中的無監(jiān)督聚類算法,可以通過數(shù)據(jù)驅動的方式在綜合考慮推送順序、推送內(nèi)容等影響因素的基礎上,從復雜多樣的用戶行為數(shù)據(jù)中進行挖掘,動態(tài)獲取用戶需求,科學調整用戶服務內(nèi)容,從而不斷優(yōu)化公共文化內(nèi)容服務。
1? 公共圖書館微信公眾號傳播效果實證研究
1.1? 數(shù)據(jù)來源
該研究抽樣單位為國家圖書館微信公眾號,分析單位為2018年5月1日至2019年4月30日期間通過國家圖書館微信公眾號群發(fā)的354篇圖文消息。研究數(shù)據(jù)包括每篇消息的送達人數(shù)、推送順序、閱讀數(shù)、點贊(在看)數(shù)、分享數(shù)、留言數(shù)等,統(tǒng)計截止時間為2019年10月31日。
1.2? 數(shù)據(jù)處理
1.2.1? 聚類方法
聚類方法的基本思想是將具有相似特征的原始數(shù)據(jù)聚為一類。其中,k-means算法是一種常見的聚類算法,該算法基于隨機給定的k個簇中心,依照最近鄰原則,分別計算各樣本點與簇中心的距離,從而將樣本點歸到相應的簇中,在此基礎上,用均值方法對聚類的中心點重新進行計算,迭代上述過程,不斷更新聚類中心以及樣本所屬類,直至算法收斂。
以國家圖書館為例的公共圖書館微信公眾號所面向的用戶基數(shù)大,用戶行為相對復雜,用戶需求多樣化,因此,通過數(shù)據(jù)驅動的方式,可以更好地從大量用戶數(shù)據(jù)中對用戶需求進行挖掘。通過算法本身的迭代達到收斂條件,來獲取用戶需求更大的服務內(nèi)容,從而動態(tài)調整公共圖書館微信公眾號服務內(nèi)容。此外,以k-means聚類算法為例的聚類方法運算速度快,穩(wěn)定性相對較高,可移植性好,適合基于大量樣本數(shù)據(jù)進行學習,動態(tài)獲取用戶內(nèi)容服務需求,能夠為公共圖書館公眾號用戶需求服務提供方法學參考。
因此,研究中將聚類算法應用于圖文消息的特征數(shù)據(jù),在大數(shù)據(jù)視角下對公共圖書館微信公眾號消息傳播效果進行探究,以數(shù)據(jù)驅動的方式從大數(shù)據(jù)視角下對影響因素進行綜合考慮,獲取適用于當前用戶群體的消息內(nèi)容服務,對公共圖書館微信公眾號運營提供具有針對性的內(nèi)容服務指導。
1.2.2? 無監(jiān)督聚類分析
無監(jiān)督的k-means聚類方法可將n×p維的觀測數(shù)據(jù)矩陣X劃分成k類,返回包含每個觀測數(shù)據(jù)類標記的n維向量y,如下列公式所示:
y=kmeans(X,k)
通過將354篇群發(fā)消息的相關數(shù)據(jù)進行整理,可以得到維度為354×4的矩陣A,其中每一行代表一條消息,每一列分別代表消息的閱讀數(shù)、點贊(在看)數(shù)、分享數(shù)、留言數(shù)等特征數(shù)據(jù)。
在該研究中,將通過對矩陣A執(zhí)行k-means聚類分析的方式,從群發(fā)圖文消息中根據(jù)特征數(shù)據(jù)選取出用戶歡迎度更高、需求更大的消息內(nèi)容。通過利用無監(jiān)督k-means聚類算法對矩陣A進行處理,其中k取值為2,可以返回354維的類標簽向量b。算法選用歐式距離作為相似性度量,用k-means++算法進行聚類中心初始化。
1.2.3? 需求度得分分析
對于每篇圖文消息,分別記錄其閱讀數(shù)、點贊(在看)數(shù)、分享數(shù)、留言數(shù)、送達人數(shù),根據(jù)以下公式得到每篇消息的需求度分數(shù)。同時,分別記錄每篇消息的推送順序。綜合每篇圖文消息的各項指標數(shù)據(jù),通過需求度得分公式可以計算出每篇消息的分數(shù),計算公式如下所示:
score=(閱讀數(shù)×40%+點贊(在看)數(shù)×20%+分享數(shù)×30%+留言數(shù)×10%)/送達人數(shù)
1.3? 結果分析
在該研究中,包含通過國家圖書館微信公眾號從2018年5月1日至2019年4月30日期間推送的所有圖文消息數(shù)據(jù),時間跨度為一年,共計354條圖文消息。
通過對所有推送消息進行統(tǒng)計,結果顯示,其中頭條占比為70.6%,各推送順序類型消息的占比情況如圖1所示。
通過對推送消息數(shù)據(jù)所對應的矩陣A執(zhí)行聚類分析,利用k-means算法將特征數(shù)據(jù)分成兩類,一類包含69條圖文消息。其中,包含頭條67條,頭條占比為97%。無監(jiān)督k-means聚類方法從大數(shù)據(jù)視角下對消息傳播效果進行了分析,通過無監(jiān)督聚類方法所獲取的需求度更高的推送內(nèi)容符合相關研究中的頭條優(yōu)勢的原則。
對每篇文章的需求度得分進行排序,k-means聚類結果中的69條消息有47條排在需求度得分top50的文章中,與得分排在top70文章的重復比例為87%,與top100重復比例為100%。
根據(jù)k-means聚類所得到的類標簽向量b,可以將需求度得分分為兩組。對兩組數(shù)據(jù)進行非參數(shù)檢驗,檢驗結果如表1所示。非參數(shù)檢驗結果顯示,兩組數(shù)據(jù)之間存在顯著性差異。
通過對無監(jiān)督聚類結果結合需求度得分進行對比分析,可以得出,基于聚類算法的用戶需求更高的推送內(nèi)容符合相關研究中的頭條優(yōu)勢原則;非參數(shù)檢驗結果顯示,通過聚類算法得到的兩類消息的用戶需求存在顯著性差異。
國家圖書館微信公眾號服務所面向的用戶群體龐大復雜,用戶需求呈現(xiàn)多樣化的特點,與基于推送內(nèi)容和推送順序的研究不同,該研究利用機器學習方法中的無監(jiān)督聚類算法,通過數(shù)據(jù)驅動的方式對用戶行為樣本數(shù)據(jù)進行挖掘,能夠獲取科學的用戶服務內(nèi)容服務指導。
2? 討論
通過無監(jiān)督k-means聚類方法,根據(jù)每篇消息的閱讀數(shù)、點贊(在看)數(shù)、分享數(shù)、留言數(shù)等特征數(shù)據(jù),將國家圖書館微信公眾號一年內(nèi)共354篇群發(fā)圖文消息分成兩類,得到69篇公眾需求度更高的消息。同時,通過需求度得分公式,分別計算每篇消息的得分并進行排序。結果顯示,通過k-means算法得到的69篇消息,在需求度得分排序中排在top100,在top70中重合率為87%。
在通過聚類方法得到的69篇消息中,頭條文章所占比例為97%,符合相關文獻中的頭條優(yōu)勢的原則。此外,69篇消息中頭條文章在全部頭條文章中所占的比例為27%,表明無監(jiān)督k-means聚類方法可以在綜合考慮推送順序、推送內(nèi)容等影響因素的基礎上,更加精細地獲取公眾需求度更高的消息。
通過k-means算法得到的69篇消息進行歸類統(tǒng)計,講座、公開課、公益展演等所占比例為39%;展覽類占16%;征文、活動、圖書推薦類占22%;新聞、館情資訊類占23%。其中包括 “本周講座”“國圖公開課招募”“節(jié)假日開館安排”等常設欄目的部分內(nèi)容以及部分國圖新聞類資訊。
展覽類文章中包含《永樂大典》文獻展及內(nèi)容報道、動漫原畫特展、《四庫全書》特展等熱門展覽。以《永樂大典》文獻展為例,微信公眾號配合線下展覽進行了系列線上宣傳,內(nèi)容包括豐富有趣的展覽預告、對《永樂大典》所經(jīng)歷的飄搖多舛的命運的闡述、通過幽默風趣的語言再現(xiàn)《永樂大典》的編纂過程等等,讓讀者對展品有了更深入的理解。
在征文、活動、圖書推薦類中包括“我和我的祖國”征文活動、“行囊中的那本書”分享活動、古籍修復活動、“文津圖書獎”獲獎圖書等。公共圖書館微信公眾號作為傳播讀書的有效途徑之一[6],可以通過用戶活躍程度更高的讀書類相關活動,不斷提升圖書館微信公眾號運營的讀者參與度[7]。
基于微信公眾號平臺,在做好常設欄目內(nèi)容推送的基礎上,可以通過把握用戶閱讀興趣,配合線下展覽進行宣傳、通過舉辦圖書相關分享和推薦活動等方式,為用戶提供需求度更高、更加豐富多彩的文化內(nèi)容服務。
該研究以國家圖書館微信公眾號為例,通過無監(jiān)督算法對圖文消息對應的特征數(shù)據(jù)進行聚類分析,對消息傳播效果進行實證研究。結果表明,通過無監(jiān)督聚類方法所獲取的需求度更高的推送內(nèi)容符合相關研究的頭條優(yōu)勢原則;非參數(shù)檢驗結果顯示,通過聚類算法得到的兩類消息的用戶需求存在顯著性差異。與以往的基于推送內(nèi)容和推送順序的研究不同,利用機器學習方法中的無監(jiān)督聚類算法,可以通過數(shù)據(jù)驅動的方式在綜合考慮推送順序、推送內(nèi)容等影響因素的基礎上,從復雜多樣的用戶行為數(shù)據(jù)中進行挖掘,動態(tài)獲取用戶需求,科學調整用戶服務內(nèi)容,為公共圖書館微信公眾號的運營工作提供方法學參考,從而不斷優(yōu)化公共文化內(nèi)容服務。
以國家圖書館為例的公共圖書館微信公眾號服務所面向的讀者群體龐大且復雜,用戶需求多樣,通過無監(jiān)督聚類算法,以數(shù)據(jù)驅動的方式可以從大數(shù)據(jù)視角下對影響因素進行綜合考慮,獲取適用于當前用戶群體的消息傳播效果策略,對公共圖書館微信公眾號運營提供具有針對性的指導,從而更好地提供讀者服務。
此外,以k-means聚類算法為例的聚類方法運算速度快,穩(wěn)定性相對較高,可移植性好,適合基于大量樣本數(shù)據(jù)進行學習。因此,可以用于動態(tài)獲取用戶內(nèi)容服務需求,為公共圖書館微信公眾號用戶需求服務提供了方法學參考。
3? 結語
文中以國家圖書館微信公眾號為例,通過無監(jiān)督算法對圖文消息對應的特征數(shù)據(jù)進行聚類分析,從大數(shù)據(jù)視角下對消息傳播效果進行了實證研究。結果顯示,通過無監(jiān)督聚類方法所獲取的需求度更高的推送內(nèi)容符合相關研究中的頭條優(yōu)勢原則;通過聚類算法得到的兩類消息的用戶需求存在顯著性差異。與以往的基于推送內(nèi)容和推送順序的研究不同,文中基于龐大復雜的用戶群體以及多樣化的用戶需求,利用機器學習方法中的無監(jiān)督聚類算法,通過數(shù)據(jù)驅動的方式在綜合考慮推送順序、推送內(nèi)容等影響因素的基礎上,從大數(shù)據(jù)的視角下獲取更加精細化的消息傳播效果策略,為公共圖書館微信公眾號的運營工作提供了方法學參考,從而不斷優(yōu)化公共文化內(nèi)容服務。
參考文獻
[1]張興旺,李晨暉.當圖書館遇上“互聯(lián)網(wǎng)+”[J].圖書與情報,2015(4):63-70.
[2]李龍,王瑤,武含冰.基于新媒體大數(shù)據(jù)與讀者點贊留言的高校圖書館微信公眾號實證研究——以浙江省35所本科院校圖書館為例[J].圖書館學研究,2019(7):34-40,33.
[3]王康,王曉慧.高校圖書館微信公眾號影響力指數(shù)相關性分析與發(fā)布內(nèi)容研究[J].圖書館雜志,2018,37(5):52-57,81.
[4]王曉慧,王康.高校圖書館微信公眾號信息傳播影響因素研究——以武漢大學圖書館為例[J].上海高校圖書情報工作研究,2017,27(4):35-38.
[5]李曉蔚.高校圖書館微信公眾號傳播效果實證研究——以四川大學圖書館為例[J].圖書館論壇,2016,36(11):84-91.
[6]李玉艷,錢軍.圖書館微信公眾號的傳播策略[J].圖書館工作與研究,2016(2):95-97.
[7]姚鵬.高校圖書館微信服務大數(shù)據(jù)研究——以“985”工程高校為例[J].圖書館學研究,2017(4):62-67,50.