国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

信息管理技術(shù)視角下微博研究綜述與趨勢(shì)分析*

2015-12-31 09:13:26崔金棟于圓美王新媛孫遙遙
圖書館論壇 2015年4期
關(guān)鍵詞:信息管理建模用戶

崔金棟,于圓美,王新媛,孫遙遙

1 信息管理視角下的微博研究

微博憑借實(shí)時(shí)性和便捷性成為重要的網(wǎng)絡(luò)應(yīng)用,其聚集的大量用戶和相對(duì)自由的言論信息使之成為把握社會(huì)脈搏的重要工具。微博信息管理專指從微博信息出發(fā),并不考慮各種規(guī)則制度的約束力。早在2006年,就有外國(guó)學(xué)者關(guān)注微博信息管理,國(guó)外研究建立在對(duì)Twitter研究的基礎(chǔ)上。筆者在IEEE數(shù)據(jù)庫中檢索發(fā)現(xiàn),國(guó)外研究的Micro-blog就是Twitter,研究有很強(qiáng)的個(gè)案性,難以在其他微博系統(tǒng)上推廣使用,直至2009年才出現(xiàn)具有推廣意義的研究成果。國(guó)外的研究倡導(dǎo)以法治和規(guī)范約束微博信息,同時(shí)強(qiáng)調(diào)通過采用新的微博信息管理技術(shù)使微博信息的組織、傳播等環(huán)節(jié)實(shí)現(xiàn)規(guī)范化和可控化。我國(guó)對(duì)微博信息管理的研究始于2010年,除倡導(dǎo)在用戶管理上進(jìn)行引導(dǎo)外,技術(shù)層面的關(guān)注點(diǎn)集中于微博信息組織、傳播與用戶個(gè)性化推薦,這三方面恰恰描述了微博信息的生命周期。

2 微博信息組織研究

學(xué)術(shù)界并沒有統(tǒng)一的“信息組織”定義,信息管理領(lǐng)域認(rèn)可的信息組織專指有序化和結(jié)構(gòu)化,是指通過某種方式使信息便于獲取、使用和存儲(chǔ)。微博信息組織是指建立某種結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu),使微博信息能得到有效重組和整合。截至目前,網(wǎng)絡(luò)信息資源的組織方式包括文件管理和數(shù)據(jù)庫管理,微博的底層數(shù)據(jù)管理也使用這兩種組織方式,但不局限于此。微博需把信息數(shù)據(jù)和服務(wù)結(jié)合在一起,對(duì)其組合和再造,從這個(gè)角度來講,微博信息的組織方式是重組與再造。利用RSS技術(shù),微博可實(shí)現(xiàn)信息的聚合和推送,有明顯的信息自組織特點(diǎn)。隨著數(shù)據(jù)挖掘技術(shù)和網(wǎng)絡(luò)傳播技術(shù)的發(fā)展,信息組織方式會(huì)進(jìn)一步發(fā)展,微博會(huì)更加智能和方便。

Kaplan A等研究微博允許用戶之間交換短內(nèi)容,如句子、圖像和視頻鏈接等信息組織形式的機(jī)理[1];VELIKOVICH L等研究微博消息內(nèi)容特點(diǎn)、活躍時(shí)間特點(diǎn)、趨勢(shì)話題特點(diǎn)[2];LEED H、SCHLEYERT等歸納前人的研究成果,闡述微博信息組織研究的局限性,認(rèn)為看起來有序是由于限定了用戶和使用領(lǐng)域,尤其是學(xué)術(shù)界和某些特定領(lǐng)域?qū)ξ⒉┦褂玫挠行蚧⒉痪哂型茝V性[3]。我國(guó)學(xué)者的研究也有局限性。劉魯?shù)葘?duì)基于機(jī)器學(xué)習(xí)的中文微博情感分類進(jìn)行實(shí)證研究[4];王晶等對(duì)基于信息數(shù)據(jù)分析的微博研究進(jìn)行梳理,提出微博信息傳播三大構(gòu)件的概念,歸納此類研究的內(nèi)容及方法,總結(jié)國(guó)內(nèi)外圍繞微博信息傳播三大構(gòu)件取得的研究成果[5];章成志等研究不同領(lǐng)域的用戶標(biāo)簽主題表達(dá)能力差異,認(rèn)為標(biāo)簽主題在微博信息組織中應(yīng)處于主導(dǎo)作用,并以騰訊微博為例進(jìn)行驗(yàn)證[6];吳丹、王艷妮闡述微博標(biāo)簽的重要性,認(rèn)為標(biāo)簽在微博信息組織中的作用無可替代[7];潘嬋等基于微博用戶標(biāo)簽與關(guān)鍵詞的用戶行為分析,研究微博信息組織,說明前期的微博信息組織研究具有局限性,尤其是一些實(shí)證分析,并以娛樂和學(xué)術(shù)兩個(gè)領(lǐng)域標(biāo)簽的差異性否決一些研究成果[8];李林紅、李榮榮根據(jù)自組織理論,認(rèn)為新浪微博社會(huì)網(wǎng)絡(luò)是自組織系統(tǒng),從整體網(wǎng)絡(luò)、個(gè)體網(wǎng)絡(luò)、小團(tuán)體、小世界效應(yīng)構(gòu)建模型,以“可持續(xù)發(fā)展”話題為例,采用滾雪球抽樣方法,對(duì)網(wǎng)絡(luò)用戶間的“發(fā)布、轉(zhuǎn)發(fā)、評(píng)論、@、回復(fù)”關(guān)系進(jìn)行實(shí)證研究[9];劉風(fēng)光、朱愛菊介紹微博的信息組織方式,探討微博信息質(zhì)量的分析原則[10-11];胡媛利用自然語言處理和數(shù)據(jù)挖掘技術(shù),通過分析微博中的信息內(nèi)容、用戶的社會(huì)網(wǎng)絡(luò)和交互情況以及研究某條信息傳播運(yùn)動(dòng)過程來揭示微博中非正式信息交流規(guī)律及其信息交流機(jī)制[12];王曉光等通過對(duì)新浪博文的發(fā)布者、發(fā)博途徑、博文內(nèi)容、轉(zhuǎn)發(fā)數(shù)、評(píng)論數(shù)、關(guān)注數(shù)、粉絲數(shù)等的統(tǒng)計(jì),分析微博信息結(jié)構(gòu)和傳播模式的差異,說明微博用戶的表征差異性,探究微博信息產(chǎn)生互動(dòng)的結(jié)構(gòu)性要素、發(fā)生機(jī)制。這些研究使微博信息的組織更加有序化,豐富了微博信息組織的研究?jī)?nèi)容,使網(wǎng)絡(luò)信息組織理論有了新的突破[13]。

3 微博信息傳播研究

微博大大提高了信息傳播速度和廣度,信息傳播包括粉絲和轉(zhuǎn)發(fā)兩種路徑。粉絲路徑是指博主的粉絲可實(shí)時(shí)接收和閱讀博主發(fā)布的信息,該路徑是將博文直接分發(fā)給粉絲而產(chǎn)生的。轉(zhuǎn)發(fā)路徑是指博主發(fā)布的某一博文如果得到粉絲認(rèn)可,被轉(zhuǎn)發(fā)并同步到粉絲的微博中,這樣,博主粉絲的粉絲同樣可以實(shí)時(shí)接收該博文,造成信息的傳播超越最初博主的朋友圈,實(shí)現(xiàn)更快更廣的傳播。粉絲通常會(huì)在轉(zhuǎn)發(fā)時(shí)進(jìn)行評(píng)論,導(dǎo)致相關(guān)話題增多,促使微博得到更廣泛的傳播。圖1為影響微博信息傳播因素的示意圖。

圖1 微博傳播影響因素示意圖

社會(huì)網(wǎng)絡(luò)理論被微博研究者充分挖掘,以“關(guān)注”與“被關(guān)注”為關(guān)聯(lián)紐帶,以用戶為節(jié)點(diǎn),通過分析用戶節(jié)點(diǎn)和整個(gè)社會(huì)網(wǎng)絡(luò)的中心性等若干指標(biāo),解析微博社會(huì)網(wǎng)絡(luò),并通過定量方式發(fā)現(xiàn)微博傳播特征[14];田占偉等利用復(fù)雜網(wǎng)絡(luò)理論方法,對(duì)微博信息傳播網(wǎng)絡(luò)建模,基于信息網(wǎng)絡(luò)節(jié)點(diǎn)的出入度、路徑兩個(gè)指標(biāo)進(jìn)行分析,解釋微博信息傳播的小世界、高度中心化等特征[15];吳凱等提取影響轉(zhuǎn)發(fā)行為的四類特征,利用機(jī)器學(xué)習(xí)中的邏輯回歸模型分析預(yù)測(cè)個(gè)體轉(zhuǎn)發(fā)行為,在此基礎(chǔ)上融入用戶個(gè)體差異,建立基于行為預(yù)測(cè)的信息傳播模型[16];田占偉與劉臣基于PA算法提出信息分享預(yù)測(cè)模型,以微博用戶的共享需求為前提條件,以2013年的新浪微博數(shù)據(jù)驗(yàn)證預(yù)測(cè)模型[17];袁毅等以事件為主線,分析傳播過程中的用戶行為,利用分析軟件繪制事件的微博信息傳播圖,闡述影響微博信息傳播的內(nèi)外部因素[18];劉燕錦以社交網(wǎng)站和微博為對(duì)象,運(yùn)用社會(huì)網(wǎng)絡(luò)分析法,對(duì)比兩者的傳播模式,分析同屬于關(guān)系型的媒介技術(shù)平臺(tái)是否因?yàn)楣δ茉O(shè)置的差異而造成信息在使用者之間流動(dòng)的差異[19];劉繼、李磊發(fā)現(xiàn)在網(wǎng)絡(luò)輿情傳播模式中,單關(guān)鍵點(diǎn)型傳播模式以強(qiáng)勢(shì)節(jié)點(diǎn)為主,傳播速度快,多關(guān)鍵點(diǎn)型傳播模式的多個(gè)強(qiáng)勢(shì)節(jié)點(diǎn)通過橋節(jié)點(diǎn)進(jìn)行信息交互,傳播影響大,鏈?zhǔn)叫蛡鞑ツJ接捎谌狈?qiáng)勢(shì)節(jié)點(diǎn),信息傳播擴(kuò)散能力較弱,但傳播層次較深[20];陳波等研究微博信息輿論的控制問題,研究成果以傳染病模型為基礎(chǔ),通過分析影響傳染力的因素實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)輿情微博信息傳播的有效控制策略[21];錢穎等提出與陳波等不同的結(jié)論,發(fā)現(xiàn)輿情信息和微博信息具有記憶性,傳染病模型描述的微博信息傳播在某些場(chǎng)合和輿情信息傳播并不是很一致[22];唐曉波等借助共詞網(wǎng)絡(luò)等工具對(duì)微博信息傳播進(jìn)行預(yù)測(cè),使用圖論對(duì)現(xiàn)實(shí)中的輿情問題進(jìn)行分析和建模[23];張賽、徐恪提出一種三角和算法用于探測(cè)用戶粉絲數(shù)閾值,該算法根據(jù)散點(diǎn)分布的統(tǒng)計(jì)規(guī)律來估計(jì)使微博熱度達(dá)到某一值的粉絲數(shù)的臨界值[24];郭浩等為了定量研究用戶影響力,提出基于用戶消息傳播范圍的用戶影響力量化定義,給出用戶影響力的計(jì)算方法[25]。

國(guó)外研究者更熱衷于使用統(tǒng)計(jì)分析來研究微博的傳播規(guī)律。NARAYANAM R、NARAHARI Y提出線性閾值模型(linear threshold model,LTM),基本思想是一個(gè)節(jié)點(diǎn)轉(zhuǎn)為活躍狀態(tài)的概率會(huì)隨著周圍活躍節(jié)點(diǎn)個(gè)數(shù)的增多而增大,如果一個(gè)節(jié)點(diǎn)鄰居中的活躍節(jié)點(diǎn)數(shù)量超過一定閾值,該節(jié)點(diǎn)將轉(zhuǎn)為活躍狀態(tài)[26];M.EFRON等對(duì)微博信息傳播的研究偏好在應(yīng)用領(lǐng)域,研究結(jié)果強(qiáng)調(diào)在數(shù)據(jù)挖掘、電子商務(wù)領(lǐng)域的應(yīng)用[27];B.SUH、L.HONG等重點(diǎn)研究微博信息分享過程涉及的兩個(gè)主體:用戶個(gè)人行為和信息本身[28];Yu Louis、Asur Sitaram、Huberman Bernardo A對(duì)比西方和我國(guó)微博信息傳播的不同特點(diǎn),通過構(gòu)建指標(biāo)體系對(duì)東西方微博信息的特有傳播現(xiàn)象進(jìn)行研究[29]。上述研究成果說明微博信息傳播具有復(fù)雜性和混沌性,使微博信息傳播預(yù)測(cè)性的難度增加,這恰恰是微博輿論爆發(fā)的源泉。

4 微博用戶推薦研究

微博在信息組織和傳播中最具特色的地方在于其個(gè)性化的信息推薦,有兩種方式,即推薦個(gè)性化的微博內(nèi)容和推薦擁有共同興趣的用戶。

早期的微博用戶推薦源于微博用戶的個(gè)性化研究需要。Zhiheng X、Ru L、Xiang L等倡導(dǎo)使用詞包模型(Bag of words)分析用戶興趣,建立影響力回歸方程來研究用戶推薦[30];Yu L,Asur S和楊成明等通過研究Twitter、新浪微博,抽取微博平臺(tái)提供的各項(xiàng)字段,從用戶性別、地域、影響力等多個(gè)角度揭示微博用戶的行為特征,以達(dá)到用戶推薦的目的[31];張中峰等認(rèn)為驅(qū)使動(dòng)態(tài)社會(huì)發(fā)展的最主要機(jī)制是同質(zhì)性,即微博用戶雙方相互關(guān)注是因?yàn)樗麄儞碛泄餐呐d趣愛好[32];胡文江等提出基于關(guān)聯(lián)規(guī)則和標(biāo)簽的個(gè)性化好友推薦策略,結(jié)合共同好友和用戶標(biāo)簽相似性兩個(gè)特征向量,使得推薦好友更準(zhǔn)確、更具個(gè)性化[33];涂存超等通過對(duì)用戶個(gè)人簡(jiǎn)介中的詞語和標(biāo)簽之間的關(guān)系進(jìn)行建模,同時(shí)利用其社交網(wǎng)絡(luò)結(jié)構(gòu)作為模型的正則化因子[34],提出網(wǎng)絡(luò)正則化的標(biāo)簽分發(fā)模型(NTDM),為用戶推薦標(biāo)簽;覃夢(mèng)河等發(fā)現(xiàn)結(jié)合人際關(guān)系的傳統(tǒng)分類,通過因子分析找出強(qiáng)關(guān)系構(gòu)建因子,對(duì)幫助用戶拓展社交網(wǎng)絡(luò)關(guān)系有很好的參考意義和實(shí)踐價(jià)值[35];徐志明等將用戶現(xiàn)實(shí)關(guān)系應(yīng)用于用戶推薦的相關(guān)實(shí)驗(yàn),基于社交信息的用戶相似度取得了較好的推薦效果[36];Naruchitparames J、Gunes M 等在IEEE大會(huì)上提出FOF理論(好友的好友理論),為微博好友推薦的研究提供了新的理論依據(jù)[37];Chechev M、Georgiev P等倡導(dǎo)基于內(nèi)容的好友推薦能夠深層次挖掘用戶的隱性興趣[38];Hannon J、Mc Carthy K、Smyth B等的研究表明基于多維度的好友推薦準(zhǔn)確率更高;通過比較基于內(nèi)容和基于協(xié)同過濾的好友推薦方法,發(fā)現(xiàn)兩者都能進(jìn)行高質(zhì)量的推薦,但若將兩者結(jié)合,推薦效率更高[39];Krestel R、Fankhauser P倡導(dǎo)對(duì)微博信息或者資源進(jìn)行標(biāo)注(即標(biāo)簽),利用標(biāo)簽相似性來推薦好友,以大大提高信息或資源的推薦效率與準(zhǔn)確度[40]。

近年國(guó)內(nèi)外關(guān)于微博用戶推薦的研究集中在推薦算法和推薦模型上,這些研究既有早期關(guān)于k-means算法、WAF算法,也有目前備受關(guān)注的LDA主題推薦模型。楊尊琦等基于k-means算法實(shí)現(xiàn)微博用戶推薦功能,以新浪微博達(dá)人為研究對(duì)象,提取他們關(guān)注的名人以及機(jī)構(gòu)進(jìn)行歸類,基于共鏈關(guān)系將統(tǒng)計(jì)結(jié)果制成相關(guān)性矩陣,導(dǎo)入SPSS軟件中進(jìn)行k-means聚類,結(jié)果發(fā)現(xiàn)具有相似性的興趣用戶可以聚為一組[41]。

LDA主題推薦模型是微博用戶推薦研究中最為火熱的一種用戶推薦模型,國(guó)內(nèi)外大量學(xué)者都對(duì)其進(jìn)行了深入的研究。Blei D等研究LDA模型的始祖——LSA,認(rèn)為在微博中應(yīng)用LSA能更好地實(shí)現(xiàn)近似于人類的理解關(guān)系,即將表面信息轉(zhuǎn)化為深層次的抽象[42];Tang Xuning、Yang CC將LDA引入超參數(shù),形成文檔-主題-單詞三層的貝葉斯模型[43];Hong Liangjie、Davison B利用LDA模型將兩個(gè)主題模型合并,以搭積木的方式形成新的主題模型[44];Zhao Wayne Xin等假設(shè)一個(gè)單獨(dú)的微博帖子通常只有一個(gè)主題,對(duì)ATM模型進(jìn)行擴(kuò)展,提出Twitter-LDA模型[45]。

我國(guó)對(duì)LDA的研究多是結(jié)合新浪等微博提供商的實(shí)證研究。唐曉波等基于社會(huì)關(guān)系理論中的同質(zhì)性理論和三元閉包關(guān)系理論,從社會(huì)關(guān)系和內(nèi)容兩個(gè)維度向社交網(wǎng)絡(luò)用戶推薦同道合的朋友,并利用LDA的擴(kuò)展模型UserLDA對(duì)新浪微博用戶進(jìn)行興趣主題建模,通過用戶主題概率分布矩陣計(jì)算用戶相似度,以進(jìn)行TopN二級(jí)好友推薦[46];邸亮、杜永萍發(fā)現(xiàn)LDA主題模型可用于識(shí)別大規(guī)模文檔集中潛藏的主題信息,但對(duì)微博短文本的應(yīng)用效果并不理想,將標(biāo)準(zhǔn)的文檔-主題-詞的三層LDA模型變?yōu)橛脩?主題-詞的用戶模型,利用該模型進(jìn)行用戶推薦[47];張培晶、宋蕾對(duì)基于LDA的微博文本主題建模方法研究進(jìn)行述評(píng),分析LDA模型的特征及其用于微博類網(wǎng)絡(luò)文本挖掘的優(yōu)勢(shì),介紹和評(píng)述微博環(huán)境下現(xiàn)有的基于LDA模型的文本主題建模方法,并對(duì)其擴(kuò)展方式和建模效果進(jìn)行總結(jié)和比較[48];唐曉波等提出微博熱度的概念,將其引入LDA模型的趨勢(shì)挖掘研究中,構(gòu)建基于微博熱度的LDA模型,通過API采集微博數(shù)據(jù)的實(shí)驗(yàn),得到更直觀的微博熱度表,并得出更具有說服力的挖掘結(jié)論[49];唐曉波還與王洪艷實(shí)現(xiàn)了基于潛在語義分析的微博主題挖掘模型構(gòu)建,提出根據(jù)微博信息特點(diǎn)進(jìn)行有針對(duì)性的預(yù)處理后,使用基于先驗(yàn)概率的潛在語義分析模型LDA進(jìn)行微博主題挖掘,并在LDA建模基礎(chǔ)上,設(shè)計(jì)文本增量聚類算法,進(jìn)一步實(shí)現(xiàn)主題結(jié)構(gòu)識(shí)別,從而使用戶更好地理解主題[50];余傳明等基于LDA模型在吉布斯抽樣過程中得到兩個(gè)矩陣:特征詞-主題矩陣和微博-主題矩陣,利用LDA模型對(duì)要構(gòu)建的文檔向量空間矩陣進(jìn)行降維[51]。微博信息用戶推薦研究多是根據(jù)用戶興趣,利用LDA模型等主題推薦模型來實(shí)現(xiàn),但LDA模型是基于詞頻統(tǒng)計(jì)分布的,缺乏語義性,解決這方面問題的研究成果并不多。

5 技術(shù)層面下微博信息管理的研究趨勢(shì)

技術(shù)層面的微博信息管理包括微博信息組織、傳播及用戶推薦三部分。從上述綜述可看到,國(guó)內(nèi)外研究正向縱深化、個(gè)性化和融合化發(fā)展,具體表現(xiàn)在微博信息組織的規(guī)范化、微博信息傳播的可控化以及微博信息推薦的個(gè)性化與精準(zhǔn)化三個(gè)方面。

5.1 微博信息組織的規(guī)范化——本體與大眾分類法的融合

微博作為信息生產(chǎn)系統(tǒng),由“混沌”到組織化的過程可看作“信息自組織”過程。微博信息的發(fā)布與擴(kuò)散在本質(zhì)上處于不可逆狀態(tài),而且受用戶真實(shí)身份、虛擬空間的個(gè)人魅力、發(fā)布內(nèi)容的關(guān)注度、用戶登錄和更新頻率等因素的影響,微博客網(wǎng)站中的信息一直處于動(dòng)態(tài)變化的不均衡狀態(tài),為準(zhǔn)確描述微博信息組織和傳播過程,對(duì)其進(jìn)行建模是必不可少的。

本體作為有效表現(xiàn)概念結(jié)構(gòu)形式化的語義模型,雖然有構(gòu)建復(fù)雜、需人工參與的缺點(diǎn),但部分研究成果已可成熟應(yīng)用。本體的構(gòu)建過程通過獲取相關(guān)領(lǐng)域的知識(shí),加以規(guī)范化的描述,形成形式化、結(jié)構(gòu)化的定義,為信息與知識(shí)建模提供明確無歧義的定義??上胂?,經(jīng)過本體技術(shù)規(guī)范化的微博信息具有明確的含義和結(jié)構(gòu)化的特點(diǎn),在微博信息組織和傳播控制領(lǐng)域帶來的益處是顯而易見的。因此,利用本體技術(shù)對(duì)微博信息進(jìn)行有效的規(guī)范和結(jié)構(gòu)化,提升微博信息描述事件的精度和準(zhǔn)度,從而達(dá)到消除歧義、提升信息組織效率的目的成為研究熱點(diǎn)。

Floksonomy作為微博傳統(tǒng)信息組織方式,本質(zhì)是基于標(biāo)簽語法層次的簡(jiǎn)單聚合分類,再加上語言本身的復(fù)雜性和用戶標(biāo)注的隨意性,信息組織的清晰度和資源查詢的準(zhǔn)確度都較低,同時(shí)無法解決近義異形詞濫用的問題。本體與大眾分類法的有效融合成為解決上述問題的有效途徑。利用本體和大眾分類法的融合,構(gòu)建適合微博信息組織的架構(gòu)形式成為大勢(shì)所趨,即構(gòu)建一種基于Folksonomy的微型本體架構(gòu)來進(jìn)行微博信息的規(guī)范化,為消除歧義和提升結(jié)構(gòu)化微博信息的應(yīng)用打下基礎(chǔ)。這種微型本體架構(gòu)既可以結(jié)合Folksonomy的優(yōu)點(diǎn),讓所有用戶參與本體構(gòu)建,降低微博信息本體的構(gòu)建成本和復(fù)雜度;又可以擁有本體的優(yōu)點(diǎn),形成結(jié)構(gòu)化的、無歧義的、易控制的信息組織結(jié)構(gòu),便于信息的管理和傳播。目前崔金棟、徐寶祥、王新媛等人在這方面開展了研究,取得了一定的成果[52]:以自組織和本體建模理論對(duì)微博信息的組織過程進(jìn)行規(guī)范化,形成結(jié)構(gòu)化的信息組織結(jié)構(gòu);進(jìn)入到微博信息傳播階段,再通過本體建模理論對(duì)傳播中的信息進(jìn)行重新建模,圖2展現(xiàn)了其構(gòu)造的微博信息管理的概念模型。

5.2 微博信息傳播的可控化——混沌性與可控性的博弈

圖2 微博信息管理技術(shù)概念模型

現(xiàn)有的微博信息傳播可控性研究主要是指從建模的角度對(duì)微博信息傳播臨界點(diǎn)表征進(jìn)行建模,通過對(duì)這些表征信息抽取而成的微博信息傳播具體事件的監(jiān)測(cè),達(dá)到微博信息傳播預(yù)警的目的,但這種方法往往具有滯后性。微博信息的傳播一旦超越臨界點(diǎn)便難以控制,這成為研究者的共識(shí)。因此,廣大學(xué)者希望在臨界點(diǎn)產(chǎn)生前對(duì)傳播信息的臨界表征進(jìn)行分析和鑒別,從而實(shí)現(xiàn)對(duì)信息傳播的規(guī)范和抑制。但微博信息平臺(tái)是一個(gè)復(fù)雜系統(tǒng),混沌性帶來的初值敏感性極強(qiáng),表現(xiàn)為一條微博在轉(zhuǎn)發(fā)中常由于某一突發(fā)事件的出現(xiàn)造成微博信息傳播生態(tài)的失控,特別是某個(gè)網(wǎng)絡(luò)意見領(lǐng)袖的評(píng)論或異樣見解的發(fā)酵引起整個(gè)信息傳播的突然爆發(fā)。這種爆炸狀的微博信息傳播是傳染病模型所不能描述的,整個(gè)微博信息生態(tài)系統(tǒng)在臨界點(diǎn)附近所表現(xiàn)出來的臨界行為只能用復(fù)雜系統(tǒng)論的突變論和混沌論去描述。以系統(tǒng)學(xué)視角研究傳播過程的約束和管制,從而達(dá)到在技術(shù)層面上加強(qiáng)微博信息管理的目的成為微博信息傳播研究的新趨勢(shì)。鐘映竑等已開始從微博信息傳播的混沌性中去發(fā)現(xiàn)混沌吸引子,探討混沌性中的可控性[53]。

5.3 微博用戶信息推薦的個(gè)性化和精準(zhǔn)化——多級(jí)推薦和模型融合

微博信息推薦本質(zhì)上屬于微博信息組織的內(nèi)容,但是由于涉及到用戶角色,微博信息推薦已不是單純的信息組織問題,而是融合了信息傳播的若干內(nèi)容,成為建立在微博信息組織與傳播之上的一種用戶服務(wù)功能。目前,由于用戶數(shù)據(jù)稀疏性和用戶信息的非結(jié)構(gòu)化,推薦不準(zhǔn)確成為影響微博發(fā)展的制約因素。以多級(jí)過濾和融合推薦模型為趨勢(shì)的個(gè)性化推薦和精準(zhǔn)化推薦成為微博用戶信息推薦研究的主流。新的微博推薦系統(tǒng)結(jié)合了用戶的偏好、話題之間的相似度、狀態(tài)之間的相似度等推薦模式,取得良好的推薦效果。另外,針對(duì)用戶信息的非結(jié)構(gòu)化問題,以簡(jiǎn)化的本體架構(gòu)為數(shù)據(jù)結(jié)構(gòu)來構(gòu)建微博信息推薦系統(tǒng)的底層數(shù)據(jù)庫,結(jié)合改進(jìn)的LDA模型進(jìn)行微博信息和用戶推薦,從而有效提高微博信息推薦的精度和質(zhì)量,也成為微博信息研究的一個(gè)新方向。圖3展示了融合后的用戶層面的微博信息管理概念模型。

圖3 用戶層面的微博信息管理概念模型

6 結(jié)語

研究信息在微博網(wǎng)絡(luò)上的組織及其傳播的性質(zhì)、規(guī)律,進(jìn)而研究如何控制、引導(dǎo)輿論,具有非常重要的理論價(jià)值和現(xiàn)實(shí)意義。筆者在技術(shù)層面上梳理了國(guó)內(nèi)外關(guān)于微博信息管理的主要文獻(xiàn),并對(duì)其進(jìn)行分析,闡述了微博信息組織、信息傳播和用戶推薦三方面的研究熱點(diǎn);在解析相關(guān)研究成果的同時(shí),總結(jié)了現(xiàn)有研究的不足;最后,筆者提出了技術(shù)視角下微博信息管理研究的新趨勢(shì)——微博信息組織的規(guī)范化、微博信息傳播的可控化以及微博用戶信息推薦的個(gè)性化,這些研究試圖通過構(gòu)建新的微博信息組織模型和傳播模型,解決技術(shù)層面上微博信息管理的弊端,實(shí)現(xiàn)微博信息有效管理的新突破。

[1] Kaplan A.Users of the world,unite!The challenges and opportunities of Social Media[J].Business Horizons,2010,53(1):59-68.

[2] VELIKOVICHL,BLAIR-GOLDENSOHNS,HANNANK,et al.The viability of Web-derived polarity lexicons[C]//Proceedingsof the North American Chapter of the Association for Computational Linguistics.Stroudsburg,PA:Association f or Computational Linguistics,2010:777-785.

[3] LEEDH,SCHLEYERT.Social tagging isnosubstitute for controlled indexing:acomparison of medical subj ect headingsand CiteULiketagsassigned to231,388 papers[J].Journal of the American Society f or Information Science and Technology,2012,63(9):1747-1757.

[4] 劉魯,劉志明.基于機(jī)器學(xué)習(xí)的中文微博情感分類實(shí)證研究[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(1):1-4.

[5] 王晶,朱珂,汪斌強(qiáng).基于信息數(shù)據(jù)分析的微博研究綜述[J].計(jì)算機(jī)應(yīng)用,2012,32(7):2027-2029.

[6] 章成志,何陸琳,丁培紅.不同領(lǐng)域的用戶標(biāo)簽主題表達(dá)能力差異研究——以中文微博為例[J].情報(bào)理論與實(shí)踐,2013,36(4):68-71.

[7] 吳丹,王艷妮.社會(huì)標(biāo)簽的規(guī)范性研究——學(xué)術(shù)論文標(biāo)注[J].圖書館,2012(1):85-88.

[8] 潘嬋,馮利飛,丁婉瑩,等.基于標(biāo)簽—關(guān)鍵詞的用戶行為分析[J].情報(bào)雜志,2010,29(3):139-142.

[9] 李林紅,李榮榮.新浪微博社會(huì)網(wǎng)絡(luò)的自組織行為研究[J].統(tǒng)計(jì)與信息論壇,2013,28(1):88-94.

[10]劉風(fēng)光.網(wǎng)絡(luò)博客堯微博的信息組織方式和信息質(zhì)量分析原則[J].價(jià)值工程,2013(8):185-186.

[11]朱愛菊.從對(duì)人的關(guān)注和瀏覽中獲取信息——新浪微博中的信息組織與信息獲取機(jī)制分析[J].情報(bào)雜志,2011(5):161-164.

[12]胡媛.微博客中基于時(shí)序的非正式信息流機(jī)制研究——以sina微博為例[J].圖書情報(bào)知識(shí),2011(4):111-117.

[13]王曉光.微博客用戶行為特征與關(guān)系特征實(shí)證分析——以新浪微博為例[J].圖書情報(bào)工作,2010(14):66-70.

[14]平亮,宗利永.基于社會(huì)網(wǎng)絡(luò)中心性分析的微博信息傳播的研究——以Sina微博為例[J].圖書情報(bào)知識(shí),2010(6):92-97.

[15]田占偉,隋玚.基于復(fù)雜網(wǎng)絡(luò)理論的微博信息傳播實(shí)證分析[J].圖書情報(bào)工作,2012(8):42-46.

[16]吳凱,季新生,劉彩霞.基于行為預(yù)測(cè)的微博網(wǎng)絡(luò)信息傳播建模[J].計(jì)算機(jī)應(yīng)用研究,2013(6):1809-1812.

[17]田占偉,劉臣.基于模糊PA算法的微博信息傳播分享預(yù)測(cè)研究[J].計(jì)算機(jī)應(yīng)用研究,2013(30):51-54.

[18]袁毅.微博客信息傳播結(jié)構(gòu)、路徑及其影響因素分析[J].圖書情報(bào)工作,2011,55(12):26-30.

[19]劉燕錦.社交網(wǎng)站和微博的信息傳播比較——以社會(huì)網(wǎng)絡(luò)分析結(jié)果為依據(jù)[J].東南傳播,2012(9):65-68.

[20]劉繼,李磊.基于微博用戶轉(zhuǎn)發(fā)行為的輿情信息傳播模式分析[J].情報(bào)雜志,2013,32(7):74-77.

[21]陳波,于泠,劉君亭,等.泛在媒體環(huán)境下的網(wǎng)絡(luò)輿情傳播控制模型[J].系統(tǒng)工程理論與實(shí)踐,2011(11):2040-2050.

[22]錢穎,張楠,趙來軍,等.微博輿情傳播規(guī)律研究[J].情報(bào)學(xué)報(bào),2012(12):1299-1304.

[23]唐曉波,宋承偉.基于復(fù)雜網(wǎng)絡(luò)的微博輿情分析[J].情報(bào)學(xué)報(bào),2012,31(11):1153-1163.

[24]張賽,徐恪,李海濤.微博類社交網(wǎng)絡(luò)中信息傳播的測(cè)量與分析[J].西安交通大學(xué)學(xué)報(bào),2013,47(2):124-130.

[25]郭浩,陸余良,王宇,等.基于信息傳播的微博用戶影響力度量[J].山東大學(xué)學(xué)報(bào)(理學(xué)報(bào)),2012,47(5):78-83.

[26]NARAYANAMR,NARAHARI Y.Ashapley value-based approach to discover influential nodes in social networks[J].IEEETranson Automation Science and Engineering,2011,20(1):130-147.

[27]M.EFRON.Inf ormation Search and Retrieval in Microblogs[J].Journal of the American Society for Inf ormation Science and Technology,2011,62(6):996-1008.

[28]B.SUH,L.HONG,P.PIROLLI.Want toberetweeted-Large scale analytics on f actors impacting retweet in Twitter network[C]//IEEE,2010:177-184.

[29][31]Yu Louis,Asur Sitaram,Huberman Bernardo A.What trends in Chinese social media[C]//Proceedings of the 5th SNA-KDDWorkshop on Web Mining and Social Network Analysis(SNA-KDD’11).NewYork:ACMPress,2011.

[30]Zhiheng X,Ru L,Xiang L,et al.Discovering User Interest on Twitter with a Modified Author-Topic Model[C]//Proceedings of the 2011 IEEE/WIC/ACM International Conf erences on Web Intelligence and Intelligent Agent Technology.Washington DC,USA:IEEEComputer Society,2011.

[32]張中峰,李秋丹.社交網(wǎng)站中潛在好友推薦模型研究[J].情報(bào)學(xué)報(bào),2011,30(12):1319-1325.

[33]胡文江,胡大偉,高永兵.基于關(guān)聯(lián)規(guī)則與標(biāo)簽的好友推薦算法[J].計(jì)算機(jī)工程與科學(xué),2013,35(2):109-113.

[34]涂存超,劉知遠(yuǎn),孫茂松.社會(huì)媒體用戶標(biāo)簽的分析與推薦[J].圖書情報(bào)工作,2013,57(23):24-35.

[35]覃夢(mèng)河,晉佑順.基于微博顯性結(jié)構(gòu)特征的用戶強(qiáng)關(guān)系研究[J].圖書館學(xué)研究,2013(3):58-63.

[36]徐志明,李棟.微博用戶的相似性度量及其應(yīng)用[J].計(jì)算機(jī)學(xué)報(bào),2014,37(1):207-218.

[37]Naruchitparames J,Gunes M H,Louis S J.Friend recommendations in social network topology[C]//Evolutionary Computation(CEC), 2011 IEEE Congresson.NewOrleans:IEEE,2011.

[38]Chechev M,Georgiev P.Amultiview conent-based user recommendation scheme f or f ollowing users in TWITTER[C]//4th International Conference,SocInfo 2012.Berlin:Springer Berlin Heidelberg,2012.

[39]Hannon J,McCarthy K,Smyth B.Content vs.tags for friend recommendation[M]//Max Bramer,Miltos Petridis.Research and Development in Intelligent Systems XXIX.London:Springer,2012:289-302.

[40]Krestel R,F(xiàn)ankhauser P.Personalized topic-based tag recommendation[J].Neurocomputing,2012,76(1):61-70.

[41]楊尊琦,張倩楠.基于k-means算法的微博用戶推薦功能研究[J].情報(bào)雜志,2013,32(8):142-144.

[42]Blei D.Probabilistic Topic Models[J].Communicationsof the ACM,2012,55(4):77-84.

[43]Tang Xuning,Yang CC.TUT:AStatistical Model for Detecting Trends,Topics and User Interests in Social Media[C]//Proceedings of the 21st ACMInternational Conference on Information and Knowledge Management.NewYork,USA:ACMPress,2012:972-981.

[44]Hong Liangj ie,Davison B.Empirical study of topic modeling in Twitter[C]//Proceedings of the First Workshop on Social Media Analytics(SOMA’10) .NewYork:ACMPress,2010:80-88.

[45]Zhao Wayne Xin,Jiang Jing,Weng Jianshu.Comparing Twitter and traditional media using topic models[C]//Proceedings of the 33rd European Conference on Information Retrieval(ECIR’11).Berlin,Heidelberg:Springer-Verlag,2011:338-349.

[46]唐曉波,祝黎,謝力.基于主題的微博二級(jí)好友推薦模型研究[J].圖書情報(bào)工作,2014,58(9):105-113.

[47]邸亮,杜永萍.LDA模型在微博用戶推薦中的應(yīng)用[J].計(jì)算機(jī)工程,2014,40(5):1-11.

[48]張培晶,宋蕾.基于LDA的微博文本主題建模方法研究述評(píng)[J].圖書情報(bào)工作,2012,56(24):120-126.

[49]唐曉波,向坤.基于LDA模型和微博熱度的趨勢(shì)挖掘[J].圖書情報(bào)工作,2014,58(5):58-63.

[50]唐曉波,王洪艷.基于潛在語義分析的微博主題挖掘模型研究[J].圖書情報(bào)工作,2012,56(24):114-119.

[51]余傳明,張小青,陳雷.基于LDA模型的評(píng)論趨勢(shì)挖掘:原理與實(shí)現(xiàn)[J].情報(bào)理論與實(shí)踐,2010,33(5):103-106.

[52]崔金棟,徐寶祥,王新媛.基于微本體構(gòu)建的微博信息管理機(jī)理研究[J].情報(bào)資料工作,2013(5):50-55.

[53]鐘映竑.基于混沌情景預(yù)測(cè)方法的微博信息擴(kuò)散建模與仿真研究[J].價(jià)值工程,2014(7):225-228.

猜你喜歡
信息管理建模用戶
造價(jià)信息管理在海外投標(biāo)中的應(yīng)用探討
聯(lián)想等效,拓展建?!浴皫щ娦∏蛟诘刃?chǎng)中做圓周運(yùn)動(dòng)”為例
評(píng)《現(xiàn)代物流信息管理與技術(shù)》(書評(píng))
基于PSS/E的風(fēng)電場(chǎng)建模與動(dòng)態(tài)分析
電子制作(2018年17期)2018-09-28 01:56:44
不對(duì)稱半橋變換器的建模與仿真
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
在高速公路信息管理中如何做好QC小組活動(dòng)
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
读书| 嘉禾县| 兰州市| 昌江| 东台市| 吉木乃县| 阳曲县| 泰宁县| 肇东市| 易门县| 九龙县| 荆门市| 曲阳县| 黑山县| 古蔺县| 万年县| 固原市| 齐齐哈尔市| 台安县| 昭平县| 福贡县| 汶川县| 洞口县| 略阳县| 任丘市| 崇文区| 高台县| 肃宁县| 江油市| 孝义市| 江达县| 台前县| 阿城市| 宣威市| 安溪县| 阳江市| 包头市| 涪陵区| 德阳市| 兴安县| 城口县|