易 明,馮翠翠,莫富傳,鄧衛(wèi)華
(1.華中師范大學(xué)信息管理學(xué)院,武漢430079;2.華中農(nóng)業(yè)大學(xué)公共管理學(xué)院,武漢430070)
作為一種典型的協(xié)同信息組織行為,協(xié)同標(biāo)注信息行為是群體用戶根據(jù)各自的需要和理解自由選擇詞匯作為標(biāo)簽對資源進(jìn)行標(biāo)注的信息行為。雖然每個用戶標(biāo)注資源的信息動機(jī)不同,但是其標(biāo)注行為通過協(xié)同標(biāo)注系統(tǒng)的集成便能產(chǎn)生整體效應(yīng),即“涌現(xiàn)”出對應(yīng)某個資源的、被大多數(shù)群體用戶所認(rèn)同的分類標(biāo)準(zhǔn)。因此,協(xié)同標(biāo)注信息行為本質(zhì)上是一種基于群體智慧的協(xié)同信息組織行為。
從目前的研究現(xiàn)狀來看,國內(nèi)外學(xué)者圍繞協(xié)同標(biāo)注信息行為的研究主要涉及內(nèi)涵、影響因素、過程機(jī)理等方面。其中,大部分學(xué)者從行為學(xué)的角度出發(fā),認(rèn)為協(xié)同標(biāo)注是指眾多用戶參與的、反映心理認(rèn)知的過程,提出協(xié)同標(biāo)注信息行為作為一種用戶自發(fā)的群體性行為,是根據(jù)用戶的主觀認(rèn)知實現(xiàn)標(biāo)簽與資源的匹配[1-4]。在影響因素方面,相關(guān)研究成果集中在資源、用戶、標(biāo)簽和系統(tǒng)等四個維度。目標(biāo)資源維度主要關(guān)注資源的內(nèi)容主題[5]、資源形態(tài)[6],以及資源本身及其相互之間的連接、用戶和資源的結(jié)合[7];用戶維度關(guān)注用戶偏好[8]、用戶認(rèn)知[9]、標(biāo)注動機(jī)[10]、標(biāo)注能力[11]等;標(biāo)簽維度被認(rèn)為是標(biāo)簽的主題與質(zhì)量對于用戶的標(biāo)簽使用行為具有顯著影響,系統(tǒng)維度則主要從ATM理論出發(fā)提出標(biāo)注系統(tǒng)感知有用性和感知易用性對協(xié)同標(biāo)注信息行為產(chǎn)生影響[12]。此外,極少數(shù)學(xué)者從群體層面對協(xié)同標(biāo)注信息行為的過程機(jī)理展開了探索,認(rèn)為協(xié)同標(biāo)注信息行為是讓每個用戶都能貢獻(xiàn)其對信息編碼分類的知識,然后系統(tǒng)用統(tǒng)計匯總的方式把最能被眾人接受的分類法凸顯出來[13],最終生成的代表著用戶集中化、大眾化的標(biāo)注詞集在一定程度上客觀地反映了標(biāo)簽變化過程的協(xié)同過濾結(jié)果[14-15],其本質(zhì)是以標(biāo)簽為媒介將用戶隱性知識顯性化[16],通過標(biāo)簽的積累使得群體知識得以涌現(xiàn)[17]。
通過梳理文獻(xiàn)發(fā)現(xiàn),目前,學(xué)者們主要聚焦于對協(xié)同標(biāo)注信息行為影響因素的研究,而且更多的是從個體層面展開,忽視了作為群體層面的協(xié)同標(biāo)注信息行為的協(xié)同性和過程性。所謂協(xié)同性,強(qiáng)調(diào)的是協(xié)同標(biāo)注信息行為是一種典型的協(xié)同信息行為,需要群體用戶之間的協(xié)作才能完成協(xié)同標(biāo)注信息行為的最終目標(biāo)——大眾分類;所謂過程性,強(qiáng)調(diào)的是協(xié)同標(biāo)注信息行為的階段性特征,即大眾分類的形成需要經(jīng)歷群體用戶的協(xié)同過程才能完成。雖然極少數(shù)學(xué)者從群體層面探索了協(xié)同標(biāo)注信息行為的過程機(jī)理,但是相關(guān)研究側(cè)重于理論層面的闡述,尚未構(gòu)建相應(yīng)的理論模型,也缺少對協(xié)同性、過程性等特征的定量探索。因此,本文借鑒群體智慧理論解析協(xié)同標(biāo)注信息行為模型,并以豆瓣電影標(biāo)簽數(shù)據(jù)為例開展實證分析,以期豐富協(xié)同標(biāo)注信息行為的相關(guān)研究。
2004年,Surowiecki出版了The Wisdom of Crowds一書,第一次使群體智慧這個概念成為大眾關(guān)注的焦點[18]。目前,群體智慧已經(jīng)成為Web 2.0的核心要素,在產(chǎn)業(yè)界得到了廣泛應(yīng)用。所謂群體智慧,是指由組成群體的個人貢獻(xiàn)出自己的知識、技能和經(jīng)驗,通過個體間的協(xié)作、靈感互動、相互啟迪等共享機(jī)制,產(chǎn)生的優(yōu)于任何個人的智慧[19]。
雖然群體智慧的重要性與普遍性已經(jīng)得到了廣泛認(rèn)同,但是關(guān)于群體智慧涌現(xiàn)的機(jī)理,不同的學(xué)者有著不同的觀點。Nishimoto等[20]將個人思考模式、合作思考模式、協(xié)作思考模式等有機(jī)融合,提出了群思考模型;在此基礎(chǔ)上,Nunaneker等[21]將個體之間的協(xié)作劃分為聚集、協(xié)調(diào)和協(xié)作三個層次,由此構(gòu)建了群體智慧涌現(xiàn)的協(xié)作過程模型;甘永成等[22]從虛擬學(xué)習(xí)社區(qū)知識建構(gòu)的視角,將集體智慧的螺旋上升周期分為發(fā)散、收斂、凝聚和創(chuàng)新四個階段,并據(jù)此構(gòu)建了集體智慧涌現(xiàn)的四階段模型;Lykourentzou等[23]認(rèn)為協(xié)作內(nèi)容的質(zhì)量和數(shù)量是吸引用戶進(jìn)行群體協(xié)作的原因,同時,用戶量的增長對于內(nèi)容質(zhì)量和數(shù)量又有促進(jìn)作用,由此構(gòu)建了互聯(lián)網(wǎng)用戶協(xié)作創(chuàng)作模型;趙芳等[24]針對滇池可持續(xù)發(fā)展問題呈現(xiàn)在萬維網(wǎng)上的龐雜信息,利用鏈接結(jié)構(gòu)分析方法從中挖掘出主題層次,從定量的角度揭示了由龐大觀點構(gòu)成的復(fù)雜體系中提煉出深層次群體智慧的動態(tài)過程;Hong等[25]研究表明,經(jīng)驗分散化、參與者獨立性和網(wǎng)絡(luò)分散化對群體智慧的涌現(xiàn)有積極的影響,開發(fā)基于人群的、通過考慮人群的多樣性、獨立性、分散性和人群規(guī)模來有效地匯聚人群意見的決策工具對于提升群體行為績效具有重要意義;吳增源等[26]運用Lotka-Volterra模型揭示了開放式創(chuàng)新社區(qū)集體智慧涌現(xiàn)的內(nèi)在機(jī)理,認(rèn)為企業(yè)知識開放是集體智慧涌現(xiàn)的“加速器”,而在不同的生態(tài)關(guān)系中,集體智慧涌現(xiàn)的水平會有所差異。
協(xié)同標(biāo)注信息行為是一個基于群體智慧涌現(xiàn)的分類知識產(chǎn)生過程,這種群體智慧的涌現(xiàn)是一個量變到質(zhì)變的過程。甘永成等提出的四階段模型,對于協(xié)同標(biāo)注信息行為機(jī)理分析有著重要的指導(dǎo)意義。然而,四階段模型中的創(chuàng)新狀態(tài)是指個體乃至群體思維能力的提升,適用情景在于提出和探討新問題,其關(guān)注點在于個體思維能力的升華,與發(fā)散、收斂、凝聚狀態(tài)關(guān)注群體認(rèn)知變化趨勢存在一定差異。因此,發(fā)散、收斂和凝聚三個環(huán)節(jié)才是群體智慧涌現(xiàn)的核心,從而也成為本文構(gòu)建協(xié)同標(biāo)注信息行為模型的關(guān)鍵要素。
基于上述分析,本文認(rèn)為需要將甘永成等提出的四階段模型作適當(dāng)調(diào)整,僅將群體智慧的發(fā)散、收斂、凝聚狀態(tài)納入?yún)f(xié)同標(biāo)注信息行為模型中,最終形成了如圖1所示的模型。其中,宏觀層面包含了初始階段、中級階段和終極階段三個子過程,其描述了協(xié)同標(biāo)注信息行為由量變到質(zhì)變的過程,從而凸顯了協(xié)同標(biāo)注信息行為的過程性;微觀層面包含了發(fā)散、收斂和凝聚三個子環(huán)節(jié),其描述了協(xié)同標(biāo)注信息行為中群體智慧涌現(xiàn)的基本過程,從而凸顯了協(xié)同標(biāo)注信息行為的協(xié)同性。由于微觀層面發(fā)散、收斂和凝聚等子環(huán)節(jié)的相互作用,使得協(xié)同標(biāo)注信息行為在宏觀層面會經(jīng)歷從初始階段到中級階段并最終進(jìn)入終極階段的循序漸進(jìn)過程。
3.1.1 初始階段——雜亂無章
圖1 基于群體智慧理論的協(xié)同標(biāo)注信息行為模型
目標(biāo)資源在協(xié)同標(biāo)注系統(tǒng)中的出現(xiàn)便意味著初始階段的開啟。此時,特定用戶可以基于不同的信息動機(jī)和認(rèn)知對目標(biāo)資源進(jìn)行標(biāo)注,從而推動協(xié)同標(biāo)注信息行為進(jìn)入發(fā)散環(huán)節(jié)。隨著其他用戶的參與,目標(biāo)資源相關(guān)的標(biāo)簽種類、數(shù)量會逐漸增加,少數(shù)標(biāo)簽數(shù)量可能會相對占優(yōu),但總體上規(guī)模相對較少。例如,在某部電影正式上映之前,豆瓣網(wǎng)就會將該電影信息展示在即將上映頁面中,但此時豆瓣網(wǎng)用戶對其關(guān)注度相對較低,與該電影相關(guān)的標(biāo)簽數(shù)據(jù)也相對較少。由于協(xié)同標(biāo)注系統(tǒng)協(xié)同功能的發(fā)揮需要建立在一定數(shù)據(jù)規(guī)模的基礎(chǔ)上,所以初始階段收斂環(huán)節(jié)的作用有限,凝聚效果不明顯,使得初始階段群體用戶的標(biāo)注策略以自建標(biāo)簽為主,導(dǎo)致目標(biāo)資源的分類體系是雜亂無章的。
3.1.2 中級階段——局部共識
隨著標(biāo)注用戶的不斷增加,協(xié)同標(biāo)注信息行為將由初始階段進(jìn)入中級階段,其標(biāo)志是群體用戶針對目標(biāo)資源的分類標(biāo)準(zhǔn)達(dá)成局部共識。協(xié)同標(biāo)注信息行為能否由初始階段進(jìn)入中級階段,關(guān)鍵在于收斂環(huán)節(jié)是否有效,也就是引用其他用戶使用的標(biāo)簽或者接受協(xié)同標(biāo)注系統(tǒng)推薦的標(biāo)簽的標(biāo)注策略是否會不斷增加。隨著目標(biāo)資源的標(biāo)注用戶迅速增加,標(biāo)簽的種類、數(shù)量也在激增,從而形成了較好的基礎(chǔ)數(shù)據(jù)集,為協(xié)同標(biāo)注系統(tǒng)協(xié)同功能的發(fā)揮提供了重要支持。一旦協(xié)同功能發(fā)揮效用,引用標(biāo)簽的概率就會上升,從而推動收斂環(huán)節(jié)的正常運行。例如,在某部電影上映后,豆瓣網(wǎng)用戶的關(guān)注度迅速上升,參與標(biāo)注的用戶持續(xù)增加,該電影資源獲得的標(biāo)注數(shù)據(jù)也越來越多,在協(xié)同功能的支撐下,收斂環(huán)節(jié)將不斷產(chǎn)生重復(fù)標(biāo)簽。隨著時間的推移,可能會出現(xiàn)高頻標(biāo)簽,但由于標(biāo)注用戶還在持續(xù)增加,所以此時的高頻標(biāo)簽只能代表一種階段性的局部共識,而協(xié)同標(biāo)注信息行為也由此進(jìn)入中級階段。
3.1.3 終極階段——全局共識
在后續(xù)標(biāo)注用戶的推動下,協(xié)同標(biāo)注信息行為最終會由中級階段進(jìn)入終極階段,其標(biāo)志是針對目標(biāo)資源的分類標(biāo)準(zhǔn)形成全局共識,即大眾分類的涌現(xiàn)。從實踐角度看,當(dāng)電影網(wǎng)絡(luò)資源開放后,會吸引大量先前想觀看該電影但尚未去影院觀看的用戶在網(wǎng)上觀看電影,這時會導(dǎo)致新一輪用戶數(shù)量的增長,最后會進(jìn)入漫長的緩慢增加階段。雖然此時發(fā)散環(huán)節(jié)也會出現(xiàn),但是能夠產(chǎn)生其他新的高頻標(biāo)簽的可能性已經(jīng)很小,收斂環(huán)節(jié)將成為主流,使得原有的部分局部共識會得到更多用戶的認(rèn)同,從而推動局部共識向全局共識的轉(zhuǎn)化。
3.2.1 發(fā)散——自建標(biāo)簽
在協(xié)同標(biāo)注信息行為中,發(fā)散是指用戶通過自建標(biāo)簽的方式對目標(biāo)資源進(jìn)行標(biāo)注,從而產(chǎn)生不同種類標(biāo)簽。作為Web 2.0的典型應(yīng)用之一,協(xié)同標(biāo)注系統(tǒng)本身就是建立在“無知觀”的假設(shè)基礎(chǔ)上,即任何用戶都不可能對日漸復(fù)雜的對象系統(tǒng)及問題全域有一個全面的把握,其只能按照自己的知識背景對某一領(lǐng)域的某一問題有著一定了解[20]。協(xié)同標(biāo)注系統(tǒng)的參與門檻較低,用戶只需要根據(jù)自己的主觀認(rèn)知使用自然語言來對目標(biāo)資源進(jìn)行標(biāo)注,從而貢獻(xiàn)了其對目標(biāo)資源分類的微知識。由于用戶對目標(biāo)資源認(rèn)知的差異性,無論用戶處在哪個階段,不同用戶針對同一目標(biāo)資源的標(biāo)注結(jié)果也會不盡相同,自建標(biāo)簽會成為用戶的標(biāo)注策略之一,進(jìn)而實現(xiàn)了發(fā)散。
3.2.2 收斂——引用標(biāo)簽
在協(xié)同標(biāo)注信息行為中,收斂是指用戶采取引用他人標(biāo)簽或接受系統(tǒng)推薦標(biāo)簽的方式對目標(biāo)資源進(jìn)行標(biāo)注,從而產(chǎn)生重復(fù)標(biāo)簽。一方面,收斂是由于用戶對相同目標(biāo)資源的認(rèn)知與其他用戶不可避免地呈現(xiàn)相似甚至一致;另一方面,是因為協(xié)同標(biāo)注系統(tǒng)為了促進(jìn)群體智慧的涌現(xiàn),提供了強(qiáng)大的協(xié)同功能予以支持。具體有兩種實現(xiàn)方式:一是協(xié)同標(biāo)注系統(tǒng)利用獨特的方法把目標(biāo)資源的已有標(biāo)簽展示出來,以供其他用戶學(xué)習(xí)、借鑒;二是協(xié)同標(biāo)注系統(tǒng)利用精準(zhǔn)的推薦算法向用戶推薦標(biāo)簽,類似于傳統(tǒng)分類中專家的角色。從而用戶可看到目標(biāo)資源的已有標(biāo)簽以及系統(tǒng)推薦標(biāo)簽,而這些標(biāo)簽本質(zhì)上是群體用戶和協(xié)同標(biāo)注系統(tǒng)貢獻(xiàn)的微知識。一旦用戶在主觀上認(rèn)同了這些微知識,那么就會采取引用標(biāo)簽(包括引用其他用戶使用的標(biāo)簽以及協(xié)同標(biāo)注系統(tǒng)推薦的標(biāo)簽)的標(biāo)注策略,推動收斂的出現(xiàn)。由于協(xié)同標(biāo)注系統(tǒng)協(xié)同功能的存在,使得收斂環(huán)節(jié)在整個協(xié)同標(biāo)注信息行為過程中一直發(fā)揮作用。
3.2.3 凝聚——匯聚共識
在協(xié)同標(biāo)注信息行為中,凝聚是指群體用戶針對目標(biāo)資源的分類標(biāo)準(zhǔn)出現(xiàn)了共識,從而產(chǎn)生高頻標(biāo)簽。換而言之,經(jīng)過發(fā)散和收斂等環(huán)節(jié),群體用戶針對目標(biāo)資源的分類標(biāo)準(zhǔn)出現(xiàn)重疊的情形越來越多,逐步形成了不同程度的共識。如果在局部群體中出現(xiàn)了高頻標(biāo)簽,或者是在目標(biāo)資源的特定維度出現(xiàn)了高頻標(biāo)簽,那么此時產(chǎn)生的就是局部共識;反之,則是全局共識,同時也意味著大眾分類的涌現(xiàn)。事實上,由于收斂的作用,凝聚環(huán)節(jié)貫穿整個協(xié)同標(biāo)注信息行為過程,只是不同階段的體現(xiàn)有所差異。
本文構(gòu)建的基于群體智慧理論的三階段-三環(huán)節(jié)模型,在實證研究中,首先需要驗證三階段、三環(huán)節(jié)是否存在,進(jìn)而探索相關(guān)的變化規(guī)律,具體的目標(biāo)與思路如圖2所示。
4.1.1 引入偏度系數(shù)和Chow檢驗的宏觀解析
偏度是指對一組數(shù)據(jù)的分布偏斜方向和程度的測度。Li等[27]認(rèn)為偏度可以作為決策中表達(dá)投資者偏好的變量;Lee等[28]的研究從偏度角度展示了評論數(shù)量和評論喜歡數(shù)量之間的關(guān)系,其認(rèn)為偏度統(tǒng)計可以被視為一種意見偏度的指標(biāo)。這些研究表明,偏度可以被視為一種反映群體意見趨勢的指標(biāo),可將其借鑒運用到本研究中,即:將偏度視為一種反映協(xié)同標(biāo)注信息行為過程中群體智慧水平變化趨勢的指標(biāo),按時間依次計算標(biāo)簽標(biāo)注次數(shù)的偏度系數(shù),得到偏度系數(shù)時間序列數(shù)據(jù),最終利用Chow檢驗來探測宏觀層面協(xié)同標(biāo)注信息行為的結(jié)構(gòu)性變化,即階段性特征。
1)偏度系數(shù)
數(shù)據(jù)分布偏度的測量值被稱為偏度系數(shù),是描述分布偏離對稱性程度的一個特征數(shù),通常記為Sk。偏度系數(shù)的計算方法有很多,常用的計算公式[29]為
其中,n為樣本數(shù)量;xi為第i個樣本的數(shù)值;xˉ為全體樣本數(shù)值的均值。偏度表明分布偏差的程度,當(dāng)分布左右對稱時,偏度系數(shù)為0;當(dāng)偏度系數(shù)大于0時,重尾在右側(cè),該分布為右偏;當(dāng)偏度系數(shù)小于0時,重尾在左側(cè),該分布為左偏。此外,Sk的絕對值越接近于0,偏斜程度越低;Sk的絕對值越大,偏斜程度就越高。若Sk的絕對值小于0.5,數(shù)據(jù)分布為低度偏度分布;若Sk的絕對值在區(qū)間[0.5,1],數(shù)據(jù)分布為中度偏度分布;若Sk的絕對值大于1,數(shù)據(jù)分布為高度偏度分布。
由于本文需要以天為單位來計算電影標(biāo)簽標(biāo)注次數(shù)的偏度系數(shù),前期標(biāo)簽的數(shù)量很少,而偏度系數(shù)的結(jié)果會受到樣本量大小的影響,故本文采用了Lee等[28]的 修 正 公 式:
其中,n為標(biāo)簽種類;xi為第i個標(biāo)簽的標(biāo)注數(shù);xˉ為全部標(biāo)簽標(biāo)注數(shù)的均值,即全部標(biāo)簽的標(biāo)注數(shù)之和與標(biāo)簽種類數(shù)的商。
2)Chow檢驗
圖2 實證研究的目標(biāo)與思路
Chow檢驗是用于判斷結(jié)構(gòu)在預(yù)先給定的時點是否發(fā)生了變化的一種方法[30]。Chow檢驗的特點在于把時間序列數(shù)據(jù)分成兩部分,其分界點就是檢驗是否已發(fā)生結(jié)構(gòu)變化的檢驗時點。Chow統(tǒng)計量遵循k和N1+N2-2k自由度下的F分布,可以根據(jù)累積F分布計算單側(cè)p值。在此基礎(chǔ)上,利用F檢驗來檢驗由前一部分n個數(shù)據(jù)求得的參數(shù)與由后一部分m個數(shù)據(jù)求得的參數(shù)是否相等,據(jù)此判斷結(jié)構(gòu)是否發(fā)生了變化。式(3)是計算Chow統(tǒng)計量的方法之一:
其中,SSRC為組合數(shù)據(jù)的殘差平方和(給定時點前數(shù)據(jù)+給定時點后數(shù)據(jù));SSR1為給定時點前數(shù)據(jù)中的殘差平方和;SSR2為給定時點后數(shù)據(jù)中的殘差平方和;k為參數(shù)個數(shù);N1為給定時點前數(shù)據(jù)中的觀測數(shù);N2為給定時點后數(shù)據(jù)中的觀測數(shù)。
4.1.2 引入?yún)f(xié)同標(biāo)注信息行為模式的微觀解析
在基于群體智慧理論的三階段-三環(huán)節(jié)模型中,微觀層面包含了發(fā)散、收斂和凝聚等三個子環(huán)節(jié)。其中,凝聚意味著共識的產(chǎn)生,與群體智慧水平是同義語,其變化規(guī)律已在宏觀解析中進(jìn)行了闡述。故微觀解析重在揭示發(fā)散、收斂子環(huán)節(jié)在三階段的變化規(guī)律。為了表征發(fā)散、收斂子環(huán)節(jié),本文借鑒了Langley等[31]提出的描述羊群效應(yīng)模式的三個指標(biāo):個體數(shù)量、蔓延速度、一致程度,提出描述協(xié)同標(biāo)注信息行為的三個指標(biāo):標(biāo)注用戶規(guī)模、標(biāo)注擴(kuò)散速度、標(biāo)注方向一致性。
(1)標(biāo)注用戶規(guī)模,是指截至某天的協(xié)同標(biāo)注信息行為用戶累計數(shù)量。該指標(biāo)按日期依次統(tǒng)計截至當(dāng)天的時間段內(nèi)所有參與協(xié)同標(biāo)注信息行為的用戶的數(shù)量,并以整個協(xié)同標(biāo)注信息行為過程中的用戶累計數(shù)量的平均值作為標(biāo)注擴(kuò)散速度的基準(zhǔn)值。
(2)標(biāo)注擴(kuò)散速度,是指每天的新增標(biāo)注數(shù)量。該指標(biāo)按日期依次統(tǒng)計每天協(xié)同標(biāo)注信息行為中所發(fā)生的標(biāo)注次數(shù),并以整個協(xié)同標(biāo)注信息行為過程中新增標(biāo)注數(shù)量的平均值作為標(biāo)注擴(kuò)散速度的基準(zhǔn)值。
(3)標(biāo)注方向一致性,是指由占據(jù)標(biāo)注總數(shù)80%的標(biāo)簽構(gòu)成的高頻標(biāo)簽群的穩(wěn)定性。該指標(biāo)按日期依次獲取當(dāng)天和當(dāng)天之前的占據(jù)標(biāo)注總數(shù)80%的高頻標(biāo)簽群信息(包括標(biāo)簽個數(shù)和具體的標(biāo)簽構(gòu)成),然后,取同時出現(xiàn)在當(dāng)天高頻標(biāo)簽群與當(dāng)天之前高頻標(biāo)簽群的標(biāo)簽的個數(shù)除以當(dāng)天之前高頻標(biāo)簽群個數(shù)之商,作為標(biāo)注方向一致性的度量值。同樣地,將整個協(xié)同標(biāo)注信息行為過程中同時出現(xiàn)在當(dāng)天高頻標(biāo)簽群與當(dāng)天之前高頻標(biāo)簽群的標(biāo)簽個數(shù)除以當(dāng)天之前高頻標(biāo)簽群個數(shù)之商的平均值作為標(biāo)注方向一致性的基準(zhǔn)值。
將三個指標(biāo)與各自基準(zhǔn)值進(jìn)行比較,若某一指標(biāo)大于其基準(zhǔn)值,則將該指標(biāo)標(biāo)記為“+”;若該指標(biāo)小于其基準(zhǔn)值則標(biāo)記為“-”。根據(jù)各指標(biāo)的標(biāo)記結(jié)果對指標(biāo)進(jìn)行組合,可以得到八種協(xié)同標(biāo)注信息行為模式,如表1所示。需要指出的是,標(biāo)注方向一致性高時,相對應(yīng)的行為模式處于收斂環(huán)節(jié);標(biāo)注方向一致性低時,其所對應(yīng)的行為模式則處于發(fā)散環(huán)節(jié)。
豆瓣電影是中國最大的電影分享與評論社區(qū),其中產(chǎn)生了大量動態(tài)的電影標(biāo)簽數(shù)據(jù)。由于電影宣傳期、影院熱映期和電影網(wǎng)絡(luò)資源開放期的出現(xiàn),使得電影標(biāo)簽數(shù)據(jù)具有獨特的社會性和動態(tài)性,更能滿足本研究的需要。由于豆瓣電影標(biāo)簽數(shù)據(jù)會實時更新,且最多顯示10個頁面的數(shù)據(jù),超出10個頁面的標(biāo)簽數(shù)據(jù)會被系統(tǒng)刪除,因此本文使用R語言自編程序,采取24小時不間斷實時爬取豆瓣電影即將上映板塊中的電影標(biāo)簽數(shù)據(jù),具體采集內(nèi)容包括電影名稱、用戶名稱、用戶ID、標(biāo)注標(biāo)簽、標(biāo)注時間等。采集時間為2018年11月1日—2019年9月30日。通過網(wǎng)絡(luò)檢索獲取電影的影院上映日期和網(wǎng)絡(luò)資源開放日期,發(fā)現(xiàn)上映于2018年12月—2019年6月且網(wǎng)絡(luò)資源于2019年8月31日前開放的電影有158部。對于單部電影而言,在網(wǎng)絡(luò)資源開放之后,當(dāng)標(biāo)注數(shù)量連續(xù)一周為個位數(shù)或零時,認(rèn)為其生命周期結(jié)束[32],即電影的時間長度從有標(biāo)注標(biāo)簽首次產(chǎn)生的那天開始直至生命周期結(jié)束的那天為止。通過對豆瓣電影標(biāo)簽數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)有78部電影標(biāo)簽數(shù)據(jù)不完整,舍去后得到80部電影標(biāo)簽數(shù)據(jù)。同時,由于偏度統(tǒng)計量的計算對數(shù)據(jù)量有要求,故刪去了標(biāo)簽量低于500的22部電影,最終選取了58部電影數(shù)據(jù)。對58部電影數(shù)據(jù)進(jìn)行初步統(tǒng)計發(fā)現(xiàn),參與標(biāo)注的用戶有294946人,共標(biāo)注975579次。
表1 協(xié)同標(biāo)注信息行為模式及其描述
4.3.1 偏度系數(shù)分析結(jié)果
分別計算58部電影的標(biāo)簽標(biāo)注次數(shù)的偏度系數(shù),并繪制偏度系數(shù)散點圖,如圖3所示。由圖3可知,每部電影的偏度系數(shù)均大于1(最小值為1.60),且平均值為5.34,說明每部電影在最終狀態(tài)時都處于高度正偏狀態(tài),協(xié)同標(biāo)注信息行為中的群體智慧達(dá)到了較高水平。
以天為單位,分別計算標(biāo)簽標(biāo)注次數(shù)的偏度系數(shù),并為每一部電影繪制偏度系數(shù)隨時間變化的曲線圖,部分電影的偏度系數(shù)隨時間變化的曲線如圖4所示。其中,橫坐標(biāo)表示電影的日期序號,縱坐標(biāo)表示電影的偏度系數(shù)值。
由圖4可知,標(biāo)簽標(biāo)注次數(shù)的偏度系數(shù)總體呈增長趨勢,且僅在初始階段出現(xiàn)了幾個負(fù)值。由于當(dāng)偏度系數(shù)大于0時,重尾在右側(cè),數(shù)據(jù)分布為右偏,這與標(biāo)簽標(biāo)注次數(shù)的正態(tài)分布曲線長尾在右側(cè)的分布一致。同時,絕大多數(shù)的偏度系數(shù)大于1,說明數(shù)據(jù)分布長期處于高度偏度分布,即引用標(biāo)簽行為是整個協(xié)同標(biāo)注信息行為過程中的常態(tài)。電影的偏度系數(shù)時間分布圖顯示,隨著時間的推移,參與標(biāo)注的用戶開始較為集中地引用一些高頻標(biāo)簽,最終導(dǎo)致有少量標(biāo)簽的引用程度很高,其余大多數(shù)標(biāo)簽的引用程度較低。也就是說,協(xié)同標(biāo)注信息行為最終形成了全局共識。
圖3 58部電影的偏度系數(shù)
4.3.2 Chow檢驗分析結(jié)果
由偏度系數(shù)隨時間變化的曲線圖可知,曲線具有明顯的階段性,且階段的劃分時點為電影的影院上映日期和網(wǎng)絡(luò)資源開放日期。使用Chow檢驗對這兩個時點進(jìn)行驗證,結(jié)果如圖5所示(橫縱坐標(biāo)含義與圖4一致)。其中,圖中的第一條豎線為電影在國內(nèi)影院的上映日期,第二條豎線為電影網(wǎng)絡(luò)資源的開放日期。Chow檢驗結(jié)果顯示,有46部電影兩個斷點在0.05水平上顯著,其中43部電影兩個斷點均在0.001水平上顯著。有6部電影第一個斷點不顯著(第二個斷點在0.001水平上顯著),6部電影第二個斷點不顯著(第一個斷點在0.001水平上顯著),不存在兩個斷點均不顯著的電影。
根據(jù)Chow檢驗結(jié)果,可以認(rèn)為協(xié)同標(biāo)注信息行為具有明顯的階段性特征,電影前期宣傳、影院熱映和電影網(wǎng)絡(luò)資源開放不同階段內(nèi),用戶標(biāo)注信息行為導(dǎo)致了協(xié)同標(biāo)注信息行為中群體智慧的結(jié)構(gòu)性變化,電影上映日期與電影網(wǎng)絡(luò)資源開放日期將用戶標(biāo)注行為過程劃分為三個階段:初始階段、中級階段和終極階段。以電影《白蛇:緣起》為例,對協(xié)同標(biāo)注信息行為初始階段、中級階段和終極階段的特征進(jìn)行分析,相關(guān)數(shù)據(jù)如表2所示。
圖4 部分電影的偏度系數(shù)隨時間變化的曲線圖
在第一個階段,即初始階段,曲線起伏波動較大。初始階段僅有404位用戶參與標(biāo)注,僅占整個協(xié)同標(biāo)注信息行為過程中用戶數(shù)量的2.72%,共標(biāo)注了62個標(biāo)簽。由于自建標(biāo)簽僅考慮標(biāo)簽在某階段內(nèi)是否為首次被標(biāo)注,不考慮后續(xù)是否被繼續(xù)標(biāo)注,即自建標(biāo)簽有可能演化為引用標(biāo)簽。因此,此階段的62個標(biāo)簽應(yīng)全部視為自建標(biāo)簽,但仍有30個標(biāo)簽在首次被標(biāo)注后繼續(xù)被引用了1228次,平均標(biāo)簽引用次數(shù)為40.93。雖然此時出現(xiàn)了不少的引用標(biāo)簽和較高頻次標(biāo)簽,但標(biāo)注次數(shù)達(dá)到整個截至當(dāng)前階段標(biāo)注總次數(shù)的80%,標(biāo)簽數(shù)量占據(jù)了累計標(biāo)簽數(shù)的16.13%,與其他階段相比相對較高,這表明大多數(shù)標(biāo)簽被引用次數(shù)較少,高頻標(biāo)簽數(shù)量較少。結(jié)合圖4可知,此時偏度系數(shù)曲線總體呈上升趨勢,但偏度系數(shù)曲線的波動較大,偏度系數(shù)時間序列數(shù)據(jù)的離散系數(shù)達(dá)到0.26,是三個階段中的最高值。
在第二個階段,即中級階段,曲線快速上升,到達(dá)一定峰值后趨于平緩,并略有下降。如表2所示,在電影上映后的一段時間內(nèi),涌入大量用戶對該電影進(jìn)行標(biāo)注,此時用戶數(shù)量達(dá)10206人,占整個協(xié)同標(biāo)注信息行為過程中用戶數(shù)量的68.8%。此階段共有350個標(biāo)簽被標(biāo)注,自建標(biāo)簽僅24個,但有339個標(biāo)簽累計被引用39759次,引用標(biāo)簽概率高達(dá)96.86%,平均標(biāo)簽引用次數(shù)為117.28,高頻標(biāo)簽比例快速下降到2.57%。這表明在中級階段的標(biāo)注過程中,用戶傾向于引用已有的標(biāo)簽,已經(jīng)初步形成高頻標(biāo)簽群。此階段偏度系數(shù)曲線總上升趨勢加快,偏度系數(shù)時間序列數(shù)據(jù)離散系數(shù)下降到0.16,說明群體意見收斂效果明顯。但需要指出的是,電影資源在熱映期是受用戶關(guān)注度最高的時期,當(dāng)進(jìn)入上映后期,用戶關(guān)注度下降,用戶數(shù)、標(biāo)簽數(shù)增速變緩,偏度系數(shù)趨于穩(wěn)定。
圖5 部分電影的Chow檢驗結(jié)果
表2 電影《白蛇:緣起》不同階段的用戶與標(biāo)簽特征
在第三個階段,即終極階段,曲線重復(fù)中級階段的上升模式,但增長幅度略有降低。如表2所示,此階段用戶占比例28.48%,遠(yuǎn)遠(yuǎn)高于初始階段的用戶數(shù)量,說明在電影網(wǎng)絡(luò)資源開放初期,吸引了大量先前想觀看該電影但尚未去影院觀看的用戶,導(dǎo)致新一輪的用戶數(shù)量猛增。然而,在標(biāo)注中新增的標(biāo)簽往往很少,引用標(biāo)簽是主流趨勢,概率達(dá)到100%。雖然此階段只有213個標(biāo)簽被引用,但已累計被引用54952次,平均標(biāo)簽引用次數(shù)高達(dá)257.99。這表明中級階段形成的大部分高頻標(biāo)簽在此階段繼續(xù)獲得很高的引用次數(shù),群體用戶意見收斂效果更加顯著,偏度系數(shù)繼續(xù)呈現(xiàn)增長的趨勢。電影網(wǎng)絡(luò)資源開放一段時間之后,用戶關(guān)注度將逐步下降,偏度系數(shù)時間序列數(shù)據(jù)的離散系數(shù)降為0.15,偏度系數(shù)增長幅度也相應(yīng)變平緩。從整個協(xié)同標(biāo)注信息行為的周期來看,此時的高頻標(biāo)簽數(shù)為9,僅占累計標(biāo)簽數(shù)的1.83%,表明已經(jīng)形成了穩(wěn)定的代表群體用戶意見的高頻標(biāo)簽群。
4.4.1 八種模式的統(tǒng)計分析
八種模式分別表征了發(fā)散、收斂子環(huán)節(jié),本文計算了每種模式在標(biāo)注行為過程中的占比,以及發(fā)散和收斂的比例關(guān)系,如表3所示。
表3 八種協(xié)同標(biāo)注信息行為模式的出現(xiàn)數(shù)量及占比
同時,進(jìn)一步繪制了發(fā)散和收斂比例的堆積柱形圖,如圖6所示。
圖6 發(fā)散與收斂比例的堆積柱形圖
總體來看,在協(xié)同標(biāo)注信息行為的整個過程中,八種模式均有發(fā)生。從發(fā)散與收斂的角度來看,其最終的比例接近3∶7,這說明在整個協(xié)同標(biāo)注信息行為過程中,是以收斂為主的。具體而言,八種模式的出現(xiàn)比例可大致分為三個等級,緩慢聚合和游行模式的出現(xiàn)比例最高,在20%以上;緩慢蔓延、迅速聚合、冷布朗和急行軍模式的出現(xiàn)比例中等,在10%左右;而迅速蔓延和熱布朗模式的出現(xiàn)比例較低,尤其是熱布朗,其在總體占比中不足2%。
分階段來看,八種模式的出現(xiàn)比例差異很大。
在初始階段中,只出現(xiàn)了前四種模式,且以緩慢聚合、緩慢蔓延模式為主,兩者的占比達(dá)到了92.16%,發(fā)散和收斂的比例接近4∶6。這是因為初始階段參與標(biāo)注的用戶相對來說較少,且用戶在標(biāo)注時會傾向于自建標(biāo)簽,群體用戶觀點發(fā)散顯著。但由于用戶可了解到的只是電影的外部特征信息,信息量有限,用戶在標(biāo)注過程中在以自建標(biāo)簽為主的基礎(chǔ)上,輔之以引用標(biāo)簽,使得從整個初始階段周期來看,蔓延模式將向聚合模式過渡,群體用戶觀點收斂環(huán)節(jié)占優(yōu)。
在中級階段中,雖然八種模式都有出現(xiàn),但出現(xiàn)比例較高的緩慢聚合、迅速聚合和游行這三種模式均屬于收斂環(huán)節(jié),且發(fā)散和收斂的比例接近2∶8。在中級階段中,電影資源的影院熱映會集中涌入大量的用戶對電影進(jìn)行標(biāo)注。雖然仍然會出現(xiàn)一系列的自建標(biāo)簽,但由于標(biāo)注的集中性凸顯,高頻標(biāo)簽已經(jīng)逐步形成,多數(shù)用戶還是會傾向于引用標(biāo)簽,這就導(dǎo)致收斂環(huán)節(jié)優(yōu)勢更加明顯。
在終極階段中,雖然出現(xiàn)了六種模式,但主要以游行、急行軍、冷布朗三種模式為主,其他模式的出現(xiàn)比例不足4%。同時,游行和急行軍模式都是收斂環(huán)節(jié)的,其出現(xiàn)比例超過80%。從發(fā)散與收斂的角度來看,其最終的比例超過2∶8,相對于上一階段而言,發(fā)散與收斂的比例略有上升。隨著電影網(wǎng)絡(luò)資源的開放,會吸引許多前期不愿意去電影院消費的潛在用戶進(jìn)入豆瓣的標(biāo)注系統(tǒng)對該電影進(jìn)行標(biāo)簽標(biāo)注,表達(dá)自我觀點。但因為經(jīng)過了前面的兩個階段,協(xié)同標(biāo)注系統(tǒng)中已經(jīng)形成了局部共識,后續(xù)進(jìn)入的用戶在標(biāo)注時會更加傾向于引用標(biāo)簽,使得群體用戶的觀點收斂作用強(qiáng)勢,將進(jìn)一步凝聚共識、達(dá)成全局共識。
4.4.2 收斂-發(fā)散環(huán)節(jié)的轉(zhuǎn)移分析
本文根據(jù)時間順序統(tǒng)計了八種模式的發(fā)生次序,并計算了這八種模式之間的總體經(jīng)驗轉(zhuǎn)移概率以及分階段的經(jīng)驗轉(zhuǎn)移概率,具體結(jié)果如表4~表7所示。
1)協(xié)同標(biāo)注信息行為中收斂-發(fā)散環(huán)節(jié)的總體轉(zhuǎn)移態(tài)勢分析
由總體轉(zhuǎn)移概率可知,對于緩慢聚合、迅速聚合、游行和急行軍四種反映收斂環(huán)節(jié)的模式,轉(zhuǎn)移概率表明最有可能在下一時期出現(xiàn)相同的模式,即這些模式隨著時間的推移是穩(wěn)定的,表明群體用戶意見隨著時間的推移繼續(xù)保持收斂趨勢。其中,迅速聚合模式隨時間變化最穩(wěn)定(其自身轉(zhuǎn)移概率為75.33%)。相反地,四種反映發(fā)散環(huán)節(jié)的緩慢蔓延、迅速蔓延、冷布朗和熱布朗模式本質(zhì)上是不穩(wěn)定的,其在下一時期既有可能轉(zhuǎn)為自身模式,又有很大的概率轉(zhuǎn)為反映收斂環(huán)節(jié)的其他模式。例如,迅速蔓延模式在下一時期進(jìn)入迅速蔓延模式的概率為33.13%,而進(jìn)入迅速聚合模式的概率卻達(dá)到了43.56%;冷布朗模式在下一時期向自身轉(zhuǎn)移的概率也較高,但更有可能進(jìn)入游行模式;熱布朗模式傾向于在下一時期進(jìn)入急行軍或游行模式。緩慢蔓延、迅速蔓延、冷布朗和熱布朗這四種模式的轉(zhuǎn)移趨勢表明協(xié)同標(biāo)注信息行為所反映的群體意見處于過渡狀態(tài),在群體用戶的認(rèn)知因獲得目標(biāo)資源更多信息而趨于客觀,以及協(xié)同標(biāo)注系統(tǒng)協(xié)同功能的共同作用下,部分用戶意見隨著時間的推移將得到更多的認(rèn)同,使得群體用戶意見將由發(fā)散環(huán)節(jié)向收斂環(huán)節(jié)轉(zhuǎn)移,并最終凝聚共識、實現(xiàn)全局共識。
表4 協(xié)同標(biāo)注信息行為中收斂-發(fā)散環(huán)節(jié)的總體轉(zhuǎn)移概率
表5 初始階段收斂-發(fā)散環(huán)節(jié)的轉(zhuǎn)移概率
表6 中級階段收斂-發(fā)散環(huán)節(jié)的轉(zhuǎn)移概率
表7 終極階段收斂-發(fā)散環(huán)節(jié)的轉(zhuǎn)移概率
2)初始階段收斂-發(fā)散環(huán)節(jié)的轉(zhuǎn)移分析
由初始階段的轉(zhuǎn)移概率可知,在電影上映前的這段時間內(nèi),參與標(biāo)注的用戶比較少,只出現(xiàn)了個體規(guī)模較小的四種模式。但迅速蔓延和迅速聚合模式的出現(xiàn),說明在某些日期,參與標(biāo)注的用戶是比較集中的,這有可能是因為處于電影的宣傳期。就模式之間的轉(zhuǎn)換而言,由于此階段標(biāo)注行為以自建標(biāo)簽為主,緩慢蔓延、緩慢聚合、迅速蔓延以及迅速聚合四種模式都是不穩(wěn)定的,說明此階段發(fā)散環(huán)節(jié)作用顯著。然而,緩慢聚合和迅速聚合模式的出現(xiàn),以及蔓延模式向聚合模式轉(zhuǎn)移的概率較高,說明此階段用戶在自建標(biāo)簽的同時,也會引用標(biāo)簽,收斂環(huán)節(jié)逐漸發(fā)揮作用。
3)中級階段收斂-發(fā)散環(huán)節(jié)的轉(zhuǎn)移分析
中級階段的轉(zhuǎn)移概率情況與總體轉(zhuǎn)移概率情況類似,反映收斂環(huán)節(jié)的緩慢聚合、迅速聚合、游行和急行軍四種模式將繼續(xù)保持自身狀態(tài),而反映發(fā)散環(huán)節(jié)的緩慢蔓延、迅速蔓延、冷布朗以及熱布朗模式則傾向于向自身或另一種反映收斂環(huán)節(jié)的模式轉(zhuǎn)移。對于反映收斂環(huán)節(jié)的緩慢聚合、迅速聚合和游行三種模式而言,其向各自轉(zhuǎn)移的概率比總體轉(zhuǎn)移概率和初始階段轉(zhuǎn)移概率均有提高,急行軍向自身轉(zhuǎn)移的概率也與總體轉(zhuǎn)移概率一樣保持很高的水平;對于反映發(fā)散環(huán)節(jié)的緩慢蔓延、迅速蔓延、冷布朗及熱布朗模式而言,相對于向自身轉(zhuǎn)移,進(jìn)入另外反映收斂環(huán)節(jié)的模式的概率也有所提高。上述分析表明,收斂環(huán)節(jié)在中極階段得到增強(qiáng),群體用戶觀點進(jìn)一步收斂、凝聚。
4)終極階段收斂-發(fā)散環(huán)節(jié)的轉(zhuǎn)移分析
終極階段的協(xié)同標(biāo)注信息行為主要以個體規(guī)模大的四種模式為主,這說明在電影網(wǎng)絡(luò)資源開放后,參與標(biāo)注的用戶已經(jīng)具備了一定的規(guī)模。就模式之間的轉(zhuǎn)移而言,反映收斂環(huán)節(jié)的游行和急行軍模式最為穩(wěn)定,在下一時期將出現(xiàn)相同的模式;反映發(fā)散環(huán)節(jié)的冷布朗和熱布朗模式則更有可能向反映收斂環(huán)節(jié)的游行和急行軍模式轉(zhuǎn)移,冷布朗模式將更有可能進(jìn)入游行模式,熱布朗模式向游行和急行軍模式轉(zhuǎn)移的概率大體相同。上述模式的轉(zhuǎn)移情況與總體轉(zhuǎn)移概率一致,但冷布朗、游行和急行軍三種模式的轉(zhuǎn)移概率值進(jìn)一步提高,熱布朗模式差異不大。另外,此階段也存在迅速蔓延和迅速聚合,但僅向反映收斂環(huán)節(jié)的迅速聚合和急行軍模式轉(zhuǎn)移。終極階段的模式構(gòu)成及其轉(zhuǎn)移概率表明,群體用戶在此階段更加愿意引用高頻標(biāo)簽,凝聚環(huán)節(jié)代替收斂環(huán)節(jié),群體用戶對目標(biāo)資源的分類標(biāo)準(zhǔn)達(dá)成了全局共識。
從表7可以看出,左下方都是沒有數(shù)據(jù)的,這是由于標(biāo)注用戶規(guī)模這一變量只會增加,不能減少,即不能從群體模式(冷布朗、熱布朗、游行和急行軍)轉(zhuǎn)向個體模式(緩慢蔓延、緩慢聚合、迅速蔓延和迅速聚合)。除此之外,可發(fā)生其他任何形式的轉(zhuǎn)移,甚至可以直接從個體規(guī)模小的模式進(jìn)入急行軍,例如,迅速蔓延和迅速聚合模式在下一時期進(jìn)入急行軍的概率遠(yuǎn)遠(yuǎn)高于向其他三種模式轉(zhuǎn)移的概率。但是如果處于緩慢聚合模式,則傾向于先轉(zhuǎn)移為游行模式,然后由游行模式進(jìn)入急行軍模式(如圖7所示)。這表明在協(xié)同標(biāo)注信息行為過程中,進(jìn)入急行軍模式的標(biāo)準(zhǔn)動態(tài)為:首先在方向一致性方面增加,然后增加參與標(biāo)注的用戶數(shù)量,提升擴(kuò)散速度。
圖7 總體上個體模式與群體模式間的轉(zhuǎn)移
(1)Chow檢驗結(jié)果顯示,絕大部分電影的兩個斷點在0.001水平上顯著,表明在電影前期宣傳、影院熱映和資源開放三個不同階段內(nèi),協(xié)同標(biāo)注信息行為群體智慧存在結(jié)構(gòu)性變化。協(xié)同標(biāo)注信息行為包含了雜亂無章的初始階段、局部共識的中級階段和全局共識的終極階段。引入標(biāo)注用戶規(guī)模、標(biāo)注擴(kuò)散速度和標(biāo)注方向一致性三個指標(biāo),所構(gòu)建的協(xié)同標(biāo)注信息行為模式在不同階段的結(jié)構(gòu)及其轉(zhuǎn)移情況很好地表征了發(fā)散、收斂和凝聚等子環(huán)節(jié)?;谌后w智慧理論的“三階段-三環(huán)節(jié)”模型,凸顯了協(xié)同標(biāo)注信息行為群體智慧涌現(xiàn)的過程性和協(xié)同性,合理地解釋了協(xié)同標(biāo)注信息行為的機(jī)理特征。
(2)偏度系數(shù)可以作為反映協(xié)同標(biāo)注信息行為過程中群體智慧水平變化趨勢的指標(biāo),標(biāo)簽標(biāo)注次數(shù)的偏度系數(shù)總體呈增長趨勢,并長期處于高度偏度分布狀態(tài)。這表明引用標(biāo)簽是整個協(xié)同標(biāo)注信息行為過程的常態(tài),最終導(dǎo)致少量反映群體用戶意見的標(biāo)簽被持續(xù)引用標(biāo)注,其余大多數(shù)標(biāo)簽的引用程度較低,群體智慧在協(xié)同標(biāo)注信息行為過程中不斷涌現(xiàn)。
(3)在初始階段的標(biāo)注過程中,參與標(biāo)注的用戶數(shù)量較少,標(biāo)注策略以自建標(biāo)簽為主,尚未形成明顯的高頻標(biāo)簽,群體意見分散,目標(biāo)資源分類體系雜亂無章;在中級階段的標(biāo)注過程中,數(shù)量急速增加的用戶傾向于引用標(biāo)簽,初步形成了高頻標(biāo)簽群,群體用戶意見收斂效果明顯,對目標(biāo)資源分類體系達(dá)成了局部共識;在終極階段的標(biāo)注過程中,出現(xiàn)了新一輪用戶數(shù)量的增長,中級階段形成的大部分高頻標(biāo)簽在此階段繼續(xù)獲得較高的引用次數(shù),群體用戶意見收斂效果更加顯著,形成了穩(wěn)定的代表群體用戶意見的高頻標(biāo)簽群,群體用戶對大眾分類標(biāo)準(zhǔn)形成了全局共識。
(4)八種協(xié)同標(biāo)注信息行為模式在整個協(xié)同標(biāo)注信息行為過程中均有發(fā)生,但緩慢聚合、迅速聚合、游行和急行軍屬于收斂環(huán)節(jié)的模式較為穩(wěn)定,而屬于發(fā)散環(huán)節(jié)的緩慢蔓延、迅速蔓延、冷布朗和熱布朗模式有較大的概率轉(zhuǎn)為屬于收斂環(huán)節(jié)的其他模式。同時,協(xié)同標(biāo)注信息行為模式也不能從群體模式轉(zhuǎn)向個體模式,反映了發(fā)散、收斂和凝聚環(huán)節(jié)的不可逆性,大眾分類體系一經(jīng)形成將進(jìn)入穩(wěn)定狀態(tài)。
(5)發(fā)散與收斂的比例從初始階段的4∶6提高到終極階段2∶8,這說明協(xié)同標(biāo)注信息行為過程以收斂環(huán)節(jié)為主,且收斂程度逐步提高,群體用戶意見經(jīng)歷了由發(fā)散向收斂轉(zhuǎn)移,并最終凝聚共識、涌現(xiàn)大眾分類的過程。
本文構(gòu)建了基于群體智慧理論的協(xié)同標(biāo)注信息行為模型,采用豆瓣電影標(biāo)簽數(shù)據(jù)對模型進(jìn)行實證研究,從宏觀和微觀兩個角度,證實了協(xié)同標(biāo)注信息行為的過程性和協(xié)同性,驗證了本研究方法的科學(xué)性,豐富了協(xié)同信息行為的理論與方法體系。同時,本文所揭示的發(fā)散、收斂和凝聚子過程的變化規(guī)律,對于協(xié)同標(biāo)注系統(tǒng)的深度開發(fā)具有一定的指導(dǎo)意義,例如,可以引入偏度分析功能監(jiān)測群體智慧水平,進(jìn)而通過優(yōu)化協(xié)同標(biāo)注系統(tǒng)協(xié)同功能進(jìn)行動態(tài)干預(yù)。
此外,本研究的方法對于“數(shù)據(jù)-信息-知識-智慧”這一價值鏈的定量探索具有一定參考價值,有利于下一代情報學(xué)體系中智慧情報學(xué)的縱深發(fā)展[33]。然而,本文的理論模型雖然得到了實證研究的進(jìn)一步印證,但所采集的數(shù)據(jù)局限于國內(nèi)單一平臺、單一目標(biāo)資源類型,具有一定的局限性。后續(xù)研究可采集更多實驗數(shù)據(jù),進(jìn)行跨平臺、多類型數(shù)據(jù)的交叉驗證。此外,從標(biāo)注用戶、目標(biāo)資源和標(biāo)注系統(tǒng)等視角探討協(xié)同標(biāo)注信息行為中群體智慧涌現(xiàn)的影響因素和影響機(jī)制,也是值得深入研究的一個難點。