岳芳 黃鵬 李小鋒
[摘 要]本文選擇百度貼吧“沙糖桔吧”為研究對象,建立用戶交互網(wǎng)絡(luò),采用社會網(wǎng)絡(luò)分析法對網(wǎng)絡(luò)結(jié)構(gòu)、網(wǎng)絡(luò)密度、影響力等進(jìn)行分析。研究發(fā)現(xiàn)該網(wǎng)絡(luò)具有明顯的小世界效應(yīng),且網(wǎng)絡(luò)密度較低,核心用戶較少,大部分用戶處于網(wǎng)絡(luò)邊緣。該研究對于提升農(nóng)產(chǎn)品類貼吧的服務(wù)水平具有一定的參考價值。
[關(guān)鍵詞]社會網(wǎng)絡(luò)分析;交互行為;百度貼吧;“沙糖桔吧”
doi:10.3969/j.issn.1673 - 0194.2019.24.071
[中圖分類號]G434[文獻(xiàn)標(biāo)識碼]A[文章編號]1673-0194(2019)24-0-03
0 ? ? 引 言
與普通農(nóng)作物相比,經(jīng)濟(jì)作物具有較高的經(jīng)濟(jì)價值,已成為我國農(nóng)民增收的重要途徑。例如在廣西、廣東等地區(qū),砂糖橘得到了廣泛種植。但是,與水稻等農(nóng)作物相比,砂糖橘等經(jīng)濟(jì)作物的種植周期較長,農(nóng)戶分散,組織規(guī)模小,技術(shù)水平低,缺乏穩(wěn)定的銷售渠道,生產(chǎn)和銷售受天氣和病蟲害影響較大,價格波動劇烈?;诖耍r(nóng)們開始利用網(wǎng)絡(luò)信息技術(shù),通過百度貼吧和微信等互聯(lián)網(wǎng)平臺,通過發(fā)帖和評論等,交換銷售和客戶信息,并尋找種植、病蟲害防治等方面的技術(shù)支持。但是這種自發(fā)形成的社會網(wǎng)絡(luò)和交互行為缺乏監(jiān)管和輔助措施,交流深度和廣度不夠。因此需要對在線農(nóng)戶的交互行為進(jìn)行研究,有助于相關(guān)研究人員更好地理解和發(fā)現(xiàn)社會網(wǎng)絡(luò)中人們交互行為隱含的信息和規(guī)律,從而有助于提高農(nóng)業(yè)信息交流的效率,提升農(nóng)業(yè)生產(chǎn)水平。
人們在微信朋友圈、微信公眾號、微博和百度貼吧等網(wǎng)絡(luò)平臺交流時,形成一定的交互網(wǎng)絡(luò),可利用社會網(wǎng)絡(luò)分析法等對其進(jìn)行研究。例如,萬力勇采用社會網(wǎng)絡(luò)分析法對百度百科貼吧中群體的互動結(jié)構(gòu)、社區(qū)集中趨勢及核心成員角色等進(jìn)行分析。王國華等采用內(nèi)容分析法和社會網(wǎng)絡(luò)分析法,以百度“HIV吧”為研究對象,分析了社會支持信息類別和社會支持關(guān)系網(wǎng)。鄧楚雄等采用百度城市吧主題帖流通過網(wǎng)絡(luò)虛擬空間,通過計算城市網(wǎng)絡(luò)聯(lián)系密度等指標(biāo),揭示了長江中游城市群城市網(wǎng)絡(luò)聯(lián)系特征。然而,目前較少研究者使用在線交互的真實(shí)數(shù)據(jù)對農(nóng)產(chǎn)品主題吧中的用戶交互行為進(jìn)行研究。本文以百度貼吧“沙糖桔吧”為研究對象,通過構(gòu)建交互網(wǎng)絡(luò),對用戶的交互過程和行為進(jìn)行研究,通過計算網(wǎng)絡(luò)密度等相關(guān)指標(biāo),分析網(wǎng)絡(luò)結(jié)構(gòu)特征、用戶角色等,便于管理者有針對性地采取措施,增強(qiáng)互動,提高信息交流的效率和質(zhì)量。
1 ? ? 研究對象和研究方法
數(shù)據(jù)來源于全球最大的中文交流社區(qū)——百度貼吧,是一種基于關(guān)鍵詞的主題交流社區(qū),讓那些對同一個話題感興趣的人們聚集在一起,方便展開交流。本研究利用爬蟲軟件采集了來自“沙糖桔吧”中的一個關(guān)于“種植技術(shù)”方面的主題帖,包括了2015年6月-2018年11月人們的在線交互數(shù)據(jù),具體采集了發(fā)帖人ID、發(fā)帖內(nèi)容、發(fā)帖時間、回復(fù)人ID、回帖內(nèi)容和回帖時間等信息。共107個帖子,涉及109個用戶。在此將百度貼吧中的用戶視為節(jié)點(diǎn),帖子回復(fù)關(guān)系視為一種二元屬性關(guān)系。構(gòu)建一個有向多值網(wǎng)絡(luò),其中值表示“回復(fù)的次數(shù)”,也就是關(guān)系強(qiáng)度。利用這些用戶之間的“回復(fù)關(guān)系數(shù)據(jù)”,構(gòu)建交互網(wǎng)絡(luò)。由于需要研究整體網(wǎng)絡(luò)以及用戶之間的關(guān)系,去除了29個孤立的用戶節(jié)點(diǎn),處理后的用戶數(shù)為80個,關(guān)系數(shù)為102個。雖然參與該主題帖的用戶很多,但是回復(fù)關(guān)系相對較少,是稀疏的。因此利用邊列表表示用戶之間的“回復(fù)”關(guān)系,然后使用UCINET軟件將收集到的邊列表數(shù)據(jù)轉(zhuǎn)換為矩陣,并進(jìn)行相關(guān)分析。
2 ? ? 研究結(jié)果分析
2.1 ? 網(wǎng)絡(luò)結(jié)構(gòu)圖
利用UCINET軟件將該主題帖內(nèi)用戶的互動關(guān)系進(jìn)行可視化處理,得到的整體網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1所示,其中的小方塊表示用戶節(jié)點(diǎn),箭線表示回復(fù)關(guān)系。該網(wǎng)絡(luò)類似于星型網(wǎng)絡(luò),并以“很二的陳二哥”為互動關(guān)系的中心。結(jié)合該用戶的背景,發(fā)現(xiàn)該用戶種植砂糖橘4年,具有一定的實(shí)踐經(jīng)驗,而且非常樂于分享自己的種植知識。
通過k-核分析,可以從中發(fā)現(xiàn)該網(wǎng)絡(luò)中的一些凝聚子群。k-核分析的結(jié)果如表1所示。凝聚子群有5個,分別是CL1,CL2,…,CL5。例如,CL1由69個用戶組成,CL2由2個用戶組成等。
2.2 ? 整體網(wǎng)絡(luò)密度分析
網(wǎng)絡(luò)密度指一個圖中各個節(jié)點(diǎn)之間聯(lián)絡(luò)的緊密程度。固定規(guī)模的節(jié)點(diǎn)之間的連線越多,該圖的密度就越大。網(wǎng)絡(luò)密度的取值范圍為0~1。計算得到該整體網(wǎng)絡(luò)的網(wǎng)絡(luò)密度為0.016 1,相對較低,說明用戶之間的關(guān)系比較松散,資源分配相對分散。結(jié)合發(fā)帖內(nèi)容分析,網(wǎng)絡(luò)密度低是由于許多用戶在該主題帖中向“很二的陳二哥”等少數(shù)用戶咨詢種植技術(shù),例如裂果和施肥等問題,因此只與少量的用戶產(chǎn)生聯(lián)系。
2.3 ? 中間中心度分析
中間中心度指標(biāo)如表2所示,按照指標(biāo)數(shù)值由高到低降序排列。顯然,“很二的陳二哥”具有最高的中間中心度,而且比其他用戶高出很多,處于網(wǎng)絡(luò)的中心,擁有較大的權(quán)利,同時對資源的控制程度也是最高的。其他用戶的中間中心度逐漸減少,在信息交互中的聯(lián)系功能逐漸降低。而高達(dá)90%的用戶的中間中心度為0,意味著大部分的用戶不能控制其他任何用戶,處于網(wǎng)絡(luò)的邊緣。結(jié)合發(fā)帖內(nèi)容分析,這些用戶主要是尋求種植方面的幫助。
2.4 ? 影響力指數(shù)分析
在該網(wǎng)絡(luò)中,每個用戶的關(guān)系選擇不同,影響力也不同。若得到很多用戶的關(guān)注,即該用戶的影響力也就越大。在此設(shè)置衰減因子為0.25,計算卡茲指數(shù)。例如,“很二的陳二哥”對其他所有用戶的影響指數(shù)總和為25.43,而他受到的全部影響總和為37.71。結(jié)合發(fā)帖內(nèi)容分析,“很二的陳二哥”在發(fā)帖科普種植技術(shù)的同時,積極對種植有疑問的用戶提供技術(shù)支持。對于“萊汶楓”,對其他所有用戶的影響指數(shù)總和為12.639,而他受到的全部影響總和為0。表明該用戶主要是提出種植方面的疑問,例如針對一些果樹缺鉀、缺鋅現(xiàn)象,該如何用藥治理問題,并未參與其他用戶的討論。對于“麥得包”,對其他所有用戶的影響指數(shù)總和為0,而他受到的全部影響總和為9.68。表明該用戶主要是積極參與其他用戶的討論。
2.5 ? 派系分析
找到14個派系(派系的規(guī)模是3),如表3所示。在這14個派系中,任何兩個用戶之間都有回復(fù)關(guān)系,具有一定的凝聚力。其中,反復(fù)在多個派系中出現(xiàn)的用戶是比較活躍的,例如“很二的陳二哥”和“萊汶楓”等。他們與其他用戶的互動比較頻繁,能夠參與各種話題的交流和討論,對種植技術(shù)問題等進(jìn)行補(bǔ)充,促進(jìn)信息流動和知識利用。
2.6 ? 小世界效應(yīng)分析
如果一個網(wǎng)絡(luò)同時具有了較短的平均距離和較高的聚類系數(shù),該網(wǎng)絡(luò)稱為小世界網(wǎng)絡(luò)(small-world networks)。Facebook
和Twitter在內(nèi)的一些社交網(wǎng)絡(luò)都顯示為小世界網(wǎng)絡(luò)。通過UCINET計算后,得到該交互網(wǎng)絡(luò)的聚類系數(shù)是1.01,最小距離是1,最大距離是4,平均距離是2.19。可見,在該網(wǎng)絡(luò)中,用戶之間平均只需要一個中間人就可以建立聯(lián)系。為了驗證該網(wǎng)絡(luò)中是否存在小世界效應(yīng),在UCINET中創(chuàng)建一個具有80個節(jié)點(diǎn)的隨機(jī)網(wǎng)絡(luò),計算得出該隨機(jī)網(wǎng)絡(luò)的平均距離為6.48,聚類系數(shù)為0.03。而該網(wǎng)絡(luò)的平均距離明顯小于隨機(jī)網(wǎng)絡(luò),聚類系數(shù)明顯大于隨機(jī)網(wǎng)絡(luò)。因此可以認(rèn)為,針對該主題帖討論過程中形成的交互網(wǎng)絡(luò)具有較明顯的小世界效應(yīng),種植或者病蟲害防治知識能夠較快地在用戶間傳播。
2.7 ? 個體網(wǎng)指標(biāo)分析
個體網(wǎng)的指標(biāo)有很多,包括個體網(wǎng)規(guī)模、個體網(wǎng)密度等,如表4所示。例如,“很二的陳二哥”的個體網(wǎng)規(guī)模是51,說明與他有回復(fù)關(guān)系的用戶有51人,但其個體網(wǎng)的密度非常低,僅為0.51%,即這51個用戶之間的互動非常少,這些用戶主要是向“很二的陳二哥”提出自己在種植過程中遇到的技術(shù)難題?!斑h(yuǎn)哥577”的個體網(wǎng)規(guī)模是3,說明與他有回復(fù)關(guān)系的用戶有3人,個體網(wǎng)的密度是33.33%。
3 ? ? 結(jié) 語
本研究利用社會網(wǎng)絡(luò)分析法,對“沙糖桔吧”某一主題貼中用戶的交互過程和交互行為進(jìn)行研究。通過研究發(fā)現(xiàn),整體網(wǎng)絡(luò)的網(wǎng)絡(luò)密度為0.016 1,網(wǎng)絡(luò)中節(jié)點(diǎn)的關(guān)系比較松散。通過k-核分析,發(fā)現(xiàn)了該網(wǎng)絡(luò)中的一些凝聚子群。用戶“很二的陳二哥”具有最高的中間中心度,擁有較大的權(quán)利,而90%的用戶卻處于網(wǎng)絡(luò)邊緣,只是獲取資源。該網(wǎng)絡(luò)具有明顯的小世界效應(yīng),用戶之間信息交流比較迅速。針對以上結(jié)論,本文提出以下建議。第一,雖然該主題帖關(guān)注的人數(shù)較多,但是用戶之間的交互相對較少,交流不充分,應(yīng)采取相應(yīng)激勵措施,增強(qiáng)互動性,更好地發(fā)揮該貼吧的作用。第二,發(fā)揮核心節(jié)點(diǎn)的作用,例如,“很二的陳二哥”等幾個核心用戶積極幫助其他用戶解決種植難題。應(yīng)采取相應(yīng)激勵措施,留住并更好地發(fā)揮這些核心用戶的作用。第三,吸引更多的專家,例如砂糖橘種植專家等加入,給予用戶更多的幫助,提高信息質(zhì)量,從而提升該貼吧的服務(wù)水平。本文的不足之處,一方面,研究的對象是百度貼吧“沙糖桔吧”某一主題帖中人們的交互情況,規(guī)模較小;另一方面,只是利用該主題吧某一段時間累積的數(shù)據(jù)對用戶的交往行為進(jìn)行分析,所考慮的用戶之間的關(guān)系是靜止的,群體也是相對封閉的,但是實(shí)際上用戶之間的交互是動態(tài)變化的。因此如何全面、準(zhǔn)確地揭示該貼吧中的交互關(guān)系及其變化過程,將是進(jìn)一步研究的重點(diǎn)。
主要參考文獻(xiàn)
[1]萬力勇.網(wǎng)絡(luò)百科用戶協(xié)同創(chuàng)作的互動機(jī)制研究——以百度百科貼吧為例[J].情報雜志,2014(1).
[2]王國華,劉菊,楊騰飛,等.網(wǎng)絡(luò)空間中艾滋病的社會支持研究——以百度貼吧“HIV吧”為例[J].情報雜志,2015(11).
[3]鄧楚雄,宋雄偉,謝炳庚,等.基于百度貼吧數(shù)據(jù)的長江中游城市群城市網(wǎng)絡(luò)聯(lián)系分析[J].地理研究,2018(6).