谷斌 黃家良
〔摘 要〕虛擬社區(qū)知識(shí)資產(chǎn)包括文本、圖片等顯性知識(shí)和成員的隱性知識(shí)?;谛问礁拍罘治觯‵CA)和社會(huì)網(wǎng)絡(luò)分析(SNA),提出了一種同時(shí)兼顧二者的知識(shí)組織模型——虛擬社區(qū)成員知識(shí)本體。首先闡明虛擬社區(qū)成員知識(shí)本體內(nèi)涵,分析FCA和本體間的關(guān)系,提出采用FCA構(gòu)建虛擬社區(qū)成員本體具有可行性和適用性。然后指出該過(guò)程的局限性,提出可以采用SNA發(fā)現(xiàn)“意見(jiàn)領(lǐng)袖”突破其局限性。最后,提出了基于FCA和SNA的虛擬社區(qū)成員知識(shí)本體構(gòu)建的流程。
〔關(guān)鍵詞〕虛擬社區(qū)知識(shí)組織;本體;形式概念分析;社會(huì)網(wǎng)絡(luò)分析
DOI:10.3969/j.issn.1008-0821.2015.07.001
〔中圖分類號(hào)〕G203 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2015)07-0003-05
〔Abstract〕Virtual Community knowledge assets includes the explicit knowledge(such as test,picture etc)and the members tacit knowledge.This paper aimed to proposes a knowledge organization model which can organization both explicit knowledge and tacit knowledge.Based on FCA and SNA,this paper proposed the“Virtual Community Member Knowledge Ontology”,which gave consideration to both of them.The Author first elucidated the connotation of ontology of virtual community member knowledge,and analyzed the relationship between FCA and ontology,and believed that its of feasibility and suitability to adapt FCA to create ontology of virtual community member knowledge.However,the limitation of this process is pointed out.To break through the limitation,SNA is adapted in order to find the community opinion leaders.Based on the above principles,this paper at last put forward the process of creating the ontology of virtual community member knowledge based on FCA and SNA.
〔Key words〕virtual community knowledge organization;ontology;FCA;SNA
20世紀(jì)以來(lái),人們能夠在互聯(lián)網(wǎng)上實(shí)現(xiàn)跨地域的溝通,網(wǎng)絡(luò)虛擬世界與現(xiàn)實(shí)世界的生活逐漸融為一體。Howard Rheingold(1993)首次提出了“虛擬社區(qū)(Virtual Community)”這一概念[1],并定義虛擬社區(qū)是“一群主要藉由計(jì)算機(jī)網(wǎng)絡(luò)彼此溝通的人們,他們彼此有某種程度的認(rèn)識(shí)、分享某種程度的知識(shí)和信息、在很大程度上如同對(duì)待朋友般彼此關(guān)懷,從而所形成的團(tuán)體”。此后,虛擬社區(qū)日漸成為人們獲取知識(shí)及交流知識(shí)的重要途徑,引起了學(xué)者們的研究熱潮。雖然虛擬社區(qū)沒(méi)有統(tǒng)一的定義,但可以發(fā)現(xiàn)其中的共同之處,包括網(wǎng)絡(luò)空間、信息技術(shù)、人群、交流互動(dòng)以及人際關(guān)系等[2]。虛擬社區(qū)的主要功能是實(shí)現(xiàn)社區(qū)成員間跨時(shí)空的知識(shí)交流與共享,這些用于交流與共享的知識(shí)以文本、圖片等形式存在于社區(qū)中,其根本來(lái)源則是存在于社區(qū)成員大腦中的知識(shí)。這意味著虛擬社區(qū)成員的知識(shí)對(duì)于虛擬社區(qū)而言是最有價(jià)值的知識(shí)財(cái)產(chǎn),因此對(duì)社區(qū)知識(shí)組織的研究不應(yīng)該僅僅定位于圖片、文本等顯性知識(shí),更應(yīng)該包括社區(qū)成員知識(shí)的組織,從根源上為社區(qū)知識(shí)的交流共享提供基礎(chǔ)。
本體(Ontology)的概念起源于哲學(xué)領(lǐng)域,但20世紀(jì)80年代以來(lái),本體被引入信息領(lǐng)域并逐步應(yīng)用于知識(shí)工程、人工智能、語(yǔ)義網(wǎng)等相關(guān)領(lǐng)域[3],其內(nèi)涵越來(lái)越豐富。在知識(shí)管理領(lǐng)域,本體作為一種新的知識(shí)組織方式能有效解決信息檢索中的查全率和查準(zhǔn)率問(wèn)題及知識(shí)的共享和復(fù)用等問(wèn)題,在知識(shí)組織中具有重要的學(xué)術(shù)意義和廣泛的應(yīng)用價(jià)值[4]。
知識(shí)組織是知識(shí)生產(chǎn)創(chuàng)造過(guò)程中的重要環(huán)節(jié),為知識(shí)交流和知識(shí)創(chuàng)新提供了基礎(chǔ)。本文認(rèn)為,本體是一種有效的虛擬社區(qū)成員知識(shí)組織方式,能夠反映社區(qū)成員知識(shí)間的內(nèi)在隱藏聯(lián)系,更符合知識(shí)發(fā)現(xiàn)的客觀要求,從而促進(jìn)社區(qū)成員間的知識(shí)共享與交流。作者借助形式概念分析理論(FCA)構(gòu)建虛擬社區(qū)成員知識(shí)本體,分析其構(gòu)建過(guò)程的局限性,并采用社會(huì)網(wǎng)絡(luò)分析理論(SNA)突破其構(gòu)建過(guò)程中的局限性,提出了一個(gè)基于FCA和SNA的虛擬社區(qū)成員知識(shí)本體構(gòu)建的流程。
1 形式概念分析與虛擬社區(qū)用戶知識(shí)本體關(guān)系分析
FCA由Wille在1982年提出,用于概念的發(fā)現(xiàn)、排序和顯示,所有的概念連同它們之間的泛化/例化關(guān)系構(gòu)成一個(gè)概念格[5]。近年來(lái),F(xiàn)CA被應(yīng)用于本體構(gòu)建,證明其具有可行性。結(jié)合虛擬社區(qū)及其成員知識(shí)的特點(diǎn),本文認(rèn)為基于FCA構(gòu)建的虛擬社區(qū)成員知識(shí)本體是一種具有可行性和有效性的知識(shí)組織方式,能夠有效優(yōu)化社區(qū)成員的知識(shí)發(fā)現(xiàn)、交流、共享與利用,具有一定的研究和應(yīng)用價(jià)值。endprint
11 虛擬社區(qū)用戶知識(shí)本體
在計(jì)算機(jī)科學(xué)與信息科學(xué)領(lǐng)域,Tom Gruber(1993)把本體定義為“形式化的,對(duì)于共享概念體系的明確而又詳細(xì)的說(shuō)明”。此后,其他學(xué)者也提出“本體提供的是一種共享詞表,是特定領(lǐng)域之中那些存在著的對(duì)象類型或概念及其屬性和相互關(guān)系”;“本體是對(duì)特定領(lǐng)域之中某套概念及其相互之間關(guān)系的形式化表達(dá)”等定義。實(shí)際上,隨著本體理論的發(fā)展,其內(nèi)涵越來(lái)越豐富,在不同的領(lǐng)域具有不同的應(yīng)用模式與價(jià)值,并不限于上述定義中強(qiáng)調(diào)的明確概念、形式化、共享等意義。例如陳向東(2006)基于本體的思想設(shè)計(jì)了一種網(wǎng)絡(luò)環(huán)境下的知識(shí)組織工具——開(kāi)放本體導(dǎo)航工具[6],利用的是本體中強(qiáng)調(diào)的知識(shí)關(guān)聯(lián)思想,而沒(méi)有強(qiáng)調(diào)其推理、共享等作用。因此,首先需要明確文章中“虛擬社區(qū)用戶知識(shí)本體”的意義。本文中的“虛擬社區(qū)成員知識(shí)本體”指的是“一種能夠反映社區(qū)成員知識(shí)概念及其聯(lián)系的概念模型的形式化說(shuō)明”,旨在構(gòu)建一種能夠滿足社區(qū)成員知識(shí)需求,促進(jìn)社區(qū)知識(shí)發(fā)現(xiàn)、交流、共享的知識(shí)組織方式。其內(nèi)涵主要包括3方面:
111 本體中的概念來(lái)自于社區(qū)群體成員擁有的知識(shí)
不同于某個(gè)學(xué)科領(lǐng)域擁有相對(duì)明確的概念范圍,虛擬社區(qū)本身作為一個(gè)社區(qū)成員知識(shí)交流的場(chǎng)所,其知識(shí)根源上來(lái)自于社區(qū)成員的知識(shí),并沒(méi)有明確的領(lǐng)域界限,隨著社區(qū)成員及知識(shí)需求的改變而改變。
112 概念間的關(guān)系由社區(qū)群體成員知識(shí)結(jié)構(gòu)決定
由于虛擬社區(qū)知識(shí)的不確定性,知識(shí)間的聯(lián)系更不可能被固定地定義,但可以由社區(qū)成員的知識(shí)結(jié)構(gòu)反映。例如互為上下層的概念反映了“擁有下層知識(shí)概念的成員也擁有上層知識(shí)概念”。
113 本體中概念的實(shí)例是社區(qū)個(gè)體成員
虛擬社區(qū)的知識(shí)來(lái)自于全體社區(qū)成員,以文本、圖片、視頻等形式展現(xiàn)?,F(xiàn)實(shí)條件下,雖然成員的知識(shí)并不可能完全地表達(dá)出來(lái),但是能夠通過(guò)其知識(shí)活動(dòng)反映其擁有的知識(shí)概念。虛擬社區(qū)成員知識(shí)本體的目的與應(yīng)用決定,本體中概念的實(shí)例為社區(qū)個(gè)體成員。
虛擬社區(qū)存在的核心目的就是讓社區(qū)成員間的知識(shí)得以共享與交流,成員間知識(shí)共享對(duì)虛擬社區(qū)的生存與發(fā)展有重要意義[7]。虛擬社區(qū)與在線信息服務(wù)等其他應(yīng)用的區(qū)別在于其社會(huì)性——成員間的知識(shí)交流與社會(huì)交往。虛擬社區(qū)成員知識(shí)本體正是一種能夠有效組織成員知識(shí)的知識(shí)組織方式,社區(qū)能夠基于此方式實(shí)現(xiàn)成員知識(shí)導(dǎo)航、推薦、搜索等應(yīng)用。
12 基于形式概念分析的虛擬社區(qū)用戶知識(shí)本體構(gòu)建的適用性 FCA又稱為概念格理念,建立在數(shù)學(xué)基礎(chǔ)之上,對(duì)概念、屬性以及關(guān)系等用形式化的語(yǔ)境表述出來(lái),然后根據(jù)語(yǔ)境,構(gòu)造出概念格。概念格是FCA的核心數(shù)據(jù)結(jié)構(gòu),每個(gè)節(jié)點(diǎn)是一個(gè)概念,由外延和內(nèi)涵組成。外延是概念所覆蓋的實(shí)例;而內(nèi)涵是概念的描述,是該概念所覆蓋實(shí)例的共同特征。概念格可以通過(guò)其Hasse圖生動(dòng)簡(jiǎn)潔地體現(xiàn)概念之間的泛化和例化關(guān)系。這種概念格構(gòu)建的過(guò)程是半自動(dòng)化的,需要根據(jù)語(yǔ)境人為地確定由形式概念和形式對(duì)象所組成的形式背景,然后通過(guò)概念格的生成算法或者概念格建格工具(如Con Explorer)生成概念格。
以往的研究表明,基于FCA的虛擬社區(qū)用戶本體構(gòu)建具有可行性。綜合形式概念分析與本體來(lái)看,本體概念的分類關(guān)系及概念格都表現(xiàn)為一種代數(shù)結(jié)構(gòu),也就是格結(jié)構(gòu)。二者之間的這種共性從本質(zhì)上揭示了二者能有緊密聯(lián)系的根本原因,即具有相同的代數(shù)結(jié)構(gòu)[8]。由于這種相通的代數(shù)結(jié)構(gòu),基于FCA的本體構(gòu)建的關(guān)鍵就在于找到一種映射關(guān)系,把概念格中的元素映射到本體中的元素。國(guó)內(nèi)外的學(xué)者已經(jīng)對(duì)此做出了相關(guān)研究,一般有兩種不同的結(jié)合方式:(1)將兩者中的概念等同起來(lái);(2)將本體中的概念和FCA中的屬性進(jìn)行匹配[5]。
結(jié)合本文研究對(duì)象的特點(diǎn),利用FCA構(gòu)建虛擬社區(qū)成員知識(shí)本體除了上述的可行性外,還具有適用性。傳統(tǒng)的本體構(gòu)建過(guò)程中,需要領(lǐng)域?qū)<业膮⑴c是公認(rèn)的事實(shí),其所起作用主要是清晰地確定概念及概念間的關(guān)系。但是對(duì)于虛擬社區(qū)成員知識(shí)本體而言,本體中的概念是由社區(qū)成員的知識(shí)所決定的,不具有清晰的領(lǐng)域界限,概念間的關(guān)系更是難以通過(guò)“領(lǐng)域?qū)<摇辈蹲?。FCA實(shí)質(zhì)是基于領(lǐng)域形式背景的概念聚類過(guò)程,屬于無(wú)指導(dǎo)的學(xué)習(xí)方法,能夠從本質(zhì)上刻畫(huà)了概念之間的上位與下位關(guān)系。將概念格引入本體構(gòu)建過(guò)程中可以解決早期本體構(gòu)建方法中識(shí)別概念之間的關(guān)系困難、手工組織概念到本體費(fèi)時(shí)費(fèi)力和易受開(kāi)發(fā)者的主觀影響等問(wèn)題[9]。因此,利用FCA構(gòu)建虛擬社區(qū)成員知識(shí)本體,能夠有效解決人工構(gòu)建本體時(shí)概念間關(guān)系不清晰的問(wèn)題。
利用FCA構(gòu)建虛擬社區(qū)成員知識(shí)本體的可行性和適用性表明,只要能夠確定虛擬社區(qū)成員知識(shí)的“實(shí)例”和“屬性”,構(gòu)造對(duì)象的形式背景,利用概念格算法或工具構(gòu)造概念格,根據(jù)概念格與本體間的映射規(guī)則,就能夠構(gòu)造構(gòu)建虛擬社區(qū)成員知識(shí)本體。
2 基于社會(huì)網(wǎng)絡(luò)分析和形式概念分析的虛擬社區(qū)用戶知識(shí)本體構(gòu)建原理 從上一節(jié)可以知道,基于FCA的虛擬社區(qū)成員知識(shí)本體構(gòu)建的第一步在于確定虛擬社區(qū)成員知識(shí)的“實(shí)例”和“屬性”,構(gòu)造基于虛擬社區(qū)成員知識(shí)的概念格。但是,由于概念格自身的性質(zhì),該過(guò)程存在一定的局限性。結(jié)合虛擬社區(qū)知識(shí)流動(dòng)的環(huán)境機(jī)制,作者認(rèn)為可以從社會(huì)網(wǎng)絡(luò)分析理論實(shí)現(xiàn)突破。
21 基于形式概念分析的虛擬社區(qū)用戶知識(shí)本體構(gòu)建的局限性 虛擬社區(qū)成員知識(shí)本體的內(nèi)涵表明,相應(yīng)的概念格中“外延”指擁有社區(qū)知識(shí)的社區(qū)用戶,“內(nèi)涵”指社區(qū)成員的群體知識(shí)概念。也就是說(shuō),虛擬社區(qū)成員作為形式背景中的形式對(duì)象,其所擁有的知識(shí)概念作為形式背景中的形式屬性。其中,社區(qū)成員所擁有的知識(shí)概念可以通過(guò)其知識(shí)行為的產(chǎn)物反映(例如成員所發(fā)起的帖子、關(guān)注的話題等),一個(gè)社區(qū)成員可以擁有多個(gè)知識(shí)概念,不同社區(qū)成員間的知識(shí)概念可以重疊合并。
按照上述邏輯,基于FCA的虛擬社區(qū)成員知識(shí)本體構(gòu)建首先把全部社區(qū)成員作為形式對(duì)象,根據(jù)虛擬社區(qū)的實(shí)際情況利用自然語(yǔ)言處理技術(shù)(NLP)或自定義標(biāo)簽技術(shù)等分析其知識(shí)行為產(chǎn)物,獲取每個(gè)成員所代表的知識(shí)概念,即可構(gòu)造基于虛擬社區(qū)成員知識(shí)的形式背景。但是在實(shí)際情況中,虛擬社區(qū)的規(guī)模具有千差萬(wàn)別,規(guī)模相對(duì)較少的社區(qū)擁有數(shù)十個(gè)成員,而規(guī)模大的社區(qū)則可擁有上億個(gè)成員。由于概念格本身的特性,如此大的數(shù)據(jù)規(guī)模將對(duì)所生成的概念格的可讀性和可視性產(chǎn)生十分不利的影響[10]。此外,虛擬社區(qū)中還會(huì)存在所謂的“虛假用戶”,其知識(shí)行為并不符合真實(shí)用戶的知識(shí)情況。因此,上述方法客觀上只適合于成員數(shù)量較少的虛擬社區(qū),對(duì)于成員較多的虛擬社區(qū)則產(chǎn)生不利影響。這種情況下,需要一種能夠滿足一定程度上反映社區(qū)成員知識(shí)結(jié)構(gòu),同時(shí)數(shù)據(jù)量又不能太復(fù)雜的形式背景。endprint
22 社會(huì)網(wǎng)絡(luò)分析在基于形式概念分析的虛擬社區(qū)用戶知識(shí)本體構(gòu)建中的作用 近年來(lái),在網(wǎng)絡(luò)通信、知識(shí)管理、市場(chǎng)營(yíng)銷等領(lǐng)域中興起了對(duì)“意見(jiàn)領(lǐng)袖”的研究興趣。事實(shí)上,意見(jiàn)領(lǐng)袖并不是一個(gè)新名詞,最早是由傳播學(xué)者拉扎斯菲爾德在20世紀(jì)40年代提出的。學(xué)者普遍認(rèn)同,意見(jiàn)領(lǐng)袖是在群體中經(jīng)常為他人提供意見(jiàn)、觀點(diǎn)或建議,并對(duì)他人施加個(gè)人影響的人物[12],他們?cè)诖蟊妭鞑バЧ男纬蛇^(guò)程中起著重要的中介或過(guò)濾的作用,由他們將信息擴(kuò)散給受眾,形成信息傳遞的兩級(jí)傳播。虛擬社區(qū)作為Web20時(shí)代的典型產(chǎn)物,也存在對(duì)社區(qū)知識(shí)的傳遞共享情況發(fā)揮著重要作用的意見(jiàn)領(lǐng)袖。也就是說(shuō),虛擬社區(qū)成員間的知識(shí)交流往往會(huì)通過(guò)“意見(jiàn)領(lǐng)袖節(jié)點(diǎn)”,意見(jiàn)領(lǐng)袖所擁有的知識(shí)概念客觀上很大程度上地反映社區(qū)群體成員的知識(shí)概念及其知識(shí)概念間的聯(lián)系。因此,在基于FCA構(gòu)建虛擬社區(qū)成員知識(shí)本體的過(guò)程中,意見(jiàn)領(lǐng)袖可以作為一種能夠保留大部分信息的簡(jiǎn)化形式對(duì)象,從而突破上述局限性。經(jīng)典的意見(jiàn)領(lǐng)袖的測(cè)量(發(fā)現(xiàn))研究可以:關(guān)鍵人物訪談法、自我報(bào)告法和社會(huì)網(wǎng)絡(luò)法[11]。對(duì)于虛擬社區(qū)而言,前兩種方法都需要浪費(fèi)大量的時(shí)間精力,并且其結(jié)果的可信度更是不可保證,社會(huì)網(wǎng)絡(luò)法是最佳的選擇,實(shí)現(xiàn)這種方法的所依據(jù)的理論就是社會(huì)網(wǎng)絡(luò)分析了。
SNA從20世紀(jì)30年代末正式出現(xiàn),并在最近幾年成為國(guó)內(nèi)社會(huì)科學(xué)熱門(mén)的研究方法。SNA強(qiáng)調(diào)從關(guān)系屬性的角度解析社會(huì)行為或社會(huì)現(xiàn)象的方法論,并提供一套理論研究社會(huì)網(wǎng)絡(luò)的性質(zhì)特征。在虛擬社區(qū)中,成員間的知識(shí)交流活動(dòng)必然會(huì)形成社會(huì)關(guān)系網(wǎng)絡(luò),社區(qū)成員作為網(wǎng)絡(luò)中的節(jié)點(diǎn),成員間的知識(shí)交流關(guān)系作為節(jié)點(diǎn)間的聯(lián)系。虛擬社區(qū)中的意見(jiàn)領(lǐng)袖之所以稱為意見(jiàn)領(lǐng)袖,是因?yàn)槠渑c眾多其他用戶間進(jìn)行知識(shí)交流并建立社會(huì)聯(lián)系,影響著成員間交流的知識(shí)。已有研究也表明可以利用SNA來(lái)實(shí)現(xiàn)虛擬社區(qū)意見(jiàn)領(lǐng)袖的發(fā)現(xiàn)[11-13]。因此,SNA能夠用于發(fā)現(xiàn)虛擬社區(qū)中的用戶領(lǐng)袖,為虛擬社區(qū)成員知識(shí)概念格的構(gòu)造提供數(shù)據(jù)基礎(chǔ),從而在基于FCA的虛擬社區(qū)用戶知識(shí)本體構(gòu)建中起到優(yōu)化作用。
23 基于形式概念分析和社會(huì)網(wǎng)絡(luò)分析的虛擬社區(qū)用戶知識(shí)本體構(gòu)建流程 綜上所述,基于FCA和SNA的虛擬社區(qū)用戶知識(shí)本體構(gòu)建具有一定的可行性,有利于虛擬社區(qū)成員知識(shí)發(fā)現(xiàn)、交流與共享。其構(gòu)建流程框架歸納如下(圖1),具體操作見(jiàn)下文。
(1)利用SNA理論與方法,確定社區(qū)意見(jiàn)領(lǐng)袖的挑選準(zhǔn)則(公式),基于此挑選出合理數(shù)量的意見(jiàn)領(lǐng)袖,并作為形式對(duì)象;
(2)結(jié)合社區(qū)的實(shí)際情況選擇自然語(yǔ)言分析、自定義標(biāo)簽等技術(shù),從意見(jiàn)領(lǐng)袖的知識(shí)活動(dòng)中分析其知識(shí)概念,并作為形式屬性;
(3)以上述形式對(duì)象和形式屬性構(gòu)造形式背景,利用概念格算法或工具生成基于此形式背景的概念格;
(4)根據(jù)“概念格——本體”映射規(guī)則,基于概念格生成虛擬社區(qū)成員知識(shí)本體。
3 虛擬社區(qū)用戶知識(shí)本體構(gòu)建
本節(jié)以第二節(jié)中的虛擬社區(qū)成員知識(shí)本體構(gòu)建流程為整體框架,結(jié)合SNA理論、FCA理論的具體方法與技術(shù),詳細(xì)說(shuō)明該本體構(gòu)建過(guò)程。
31 基于社會(huì)網(wǎng)絡(luò)分析的形式對(duì)象獲取
SNA的數(shù)據(jù)基礎(chǔ)的關(guān)系數(shù)據(jù),因此需要定義虛擬社區(qū)關(guān)系網(wǎng)絡(luò)。對(duì)于虛擬社區(qū)而言,現(xiàn)在最流行的關(guān)系網(wǎng)絡(luò)是成員間的“關(guān)注網(wǎng)絡(luò)”。即通過(guò)社區(qū)成員間的“關(guān)注”關(guān)系,可以形成一個(gè)“二值”、“有向”的社會(huì)網(wǎng)絡(luò),并且意見(jiàn)領(lǐng)袖能夠在該網(wǎng)絡(luò)中有顯著的結(jié)構(gòu)特征。
SNA理論體系一般分為:整體網(wǎng)絡(luò)結(jié)構(gòu)、內(nèi)部子結(jié)構(gòu)和網(wǎng)絡(luò)位置與角色。意見(jiàn)領(lǐng)袖的發(fā)現(xiàn)主要應(yīng)用其中的網(wǎng)絡(luò)位置與角色的微觀層面理論。從以往的研究來(lái)看,一般涉及“中心性”[12]概念和“結(jié)構(gòu)洞”[13]概念。
在SNA中,節(jié)點(diǎn)的中心性意味著節(jié)點(diǎn)的權(quán)力(影響力),中心性越高的節(jié)點(diǎn),其擁有的權(quán)力越大。節(jié)點(diǎn)中心度主要分為點(diǎn)度中心度、中間中心度和接近中心度。其中,點(diǎn)度中心度分為入度中心度和出度中心度。結(jié)構(gòu)洞的概念是由 Ronald SBurt于1992年提出的,指如果在網(wǎng)絡(luò)中的兩個(gè)節(jié)點(diǎn)間不存在連接,而且在他們中間也不存在冗余關(guān)系,則兩個(gè)節(jié)點(diǎn)間的空隙就是結(jié)構(gòu)洞,占據(jù)結(jié)構(gòu)洞的節(jié)點(diǎn)能夠獲得信息利益和控制利益。結(jié)構(gòu)洞通常用網(wǎng)絡(luò)限制度和網(wǎng)絡(luò)有效規(guī)模來(lái)測(cè)量,一般規(guī)律是前者的值小的行動(dòng)者,其后者的值就會(huì)大,存在結(jié)構(gòu)洞的可能性就大。根據(jù)本文的研究背景,意見(jiàn)領(lǐng)袖在虛擬社區(qū)主要表現(xiàn)一方面為受到極大的關(guān)注;另一方面控制傳播知識(shí),因此本文同時(shí)選擇“入度中心度”和“網(wǎng)絡(luò)限制度”作為意見(jiàn)領(lǐng)袖的測(cè)量指標(biāo)。
為平衡兩個(gè)指標(biāo)的權(quán)重,需要對(duì)其作Min-max標(biāo)準(zhǔn)化處理。標(biāo)準(zhǔn)化后,為每個(gè)社區(qū)成員i建立二維向量Xi=(Vi1,Vi2),其中Vi1標(biāo)準(zhǔn)化后的入讀中心度,Vi2為標(biāo)準(zhǔn)化后的網(wǎng)絡(luò)限制度。設(shè)社區(qū)成員數(shù)量為N,以N個(gè)向量Xi為輸入進(jìn)行K-Means聚類分析,獲得C個(gè)成員類別。最后根據(jù)上述理論挑選出符合意見(jiàn)領(lǐng)袖特征的類別,其成員作為意見(jiàn)領(lǐng)袖,其中類別數(shù)量C根據(jù)實(shí)際情況選擇,以控制意見(jiàn)領(lǐng)袖的數(shù)量。
32 基于虛擬社區(qū)意見(jiàn)領(lǐng)袖的形式屬性獲取
虛擬社區(qū)成員的知識(shí)行為產(chǎn)物以文本、圖片、視頻等形式存在,因此可以通過(guò)分析此等產(chǎn)物的知識(shí)概念獲知用戶的知識(shí)概念。
近年來(lái),眾多虛擬社區(qū)采用了自定義標(biāo)簽技術(shù)進(jìn)行知識(shí)組織。社區(qū)成員自發(fā)各種資源的定義標(biāo)簽,再基于數(shù)理統(tǒng)計(jì)挑選出熱門(mén)標(biāo)簽作為資源的知識(shí)概念的反映。對(duì)于非結(jié)構(gòu)化的資源而言,就能利用標(biāo)簽獲取其知識(shí)概念。對(duì)于最常用的社區(qū)文本資源而言,可以借助NLP軟件進(jìn)行切詞、過(guò)濾停用詞、形式化等處理,獲取文本資源內(nèi)容的核心概念。另外一種“自底向上”的社區(qū)常用技術(shù)是社區(qū)成員的“自我描述”,當(dāng)網(wǎng)民注冊(cè)成為虛擬社區(qū)成員時(shí)通常要上傳個(gè)人信息,其中往往包括個(gè)人的興趣、特長(zhǎng)等反應(yīng)個(gè)人知識(shí)的信息,相當(dāng)于為自己“貼標(biāo)簽”。
綜上所述,意見(jiàn)領(lǐng)袖的知識(shí)概念獲取渠道包括兩方面:成員的“自我描述”,及其知識(shí)行為產(chǎn)物的知識(shí)概念。前者一般以關(guān)鍵詞的形式描述,而后者可以通過(guò)產(chǎn)物的標(biāo)簽或者利用NLP技術(shù)獲取,具體方式取決于虛擬社區(qū)的實(shí)際情況。最后,結(jié)合通過(guò)一定的人工介入,經(jīng)過(guò)去重、合并、過(guò)濾等操作篩選出具有代表意義的概念作為知識(shí)概念。endprint
33 概念格構(gòu)建
一個(gè)形式背景K∶=(G,M,I)是由兩個(gè)集合G和M以及G與M間的關(guān)系I組成。G的元素稱為對(duì)象M的元素稱為屬性。(g,m)∈I表示對(duì)象g具有屬性m[11]。以上文中的虛擬社區(qū)意見(jiàn)領(lǐng)袖為形式對(duì)象,以其知識(shí)概念為形式屬性,構(gòu)建單值形式背景(表1)。如第1行第1列的值為1,則表示意見(jiàn)領(lǐng)袖1具有知識(shí)概念1;第1行第2列的值為控制,則表示意見(jiàn)領(lǐng)袖1不具有知識(shí)概念2。在此形式背景基礎(chǔ)上,采用概念格生成工具(如Concept Explorer),就能夠自動(dòng)生成基于FCA和SNA的虛擬社區(qū)用戶知識(shí)概念格了。
34 虛擬社區(qū)用戶知識(shí)本體構(gòu)建
在生成概念格后,構(gòu)建虛擬社區(qū)成員知識(shí)本體的關(guān)鍵在于確定“概念格——本體”映射規(guī)則與方法。國(guó)內(nèi)外學(xué)者[8,14-18]對(duì)此作了詳細(xì)的方法闡述,最常用的方法可以歸納為:(1)去除概念格最底層的節(jié)點(diǎn);(2)概念格節(jié)點(diǎn)映射為本體中的概念,為每個(gè)概念賦予一個(gè)名稱標(biāo)識(shí);(3)形式概念之間的偏序關(guān)系對(duì)應(yīng)本體概念的層次關(guān)系;(4)形式概念的內(nèi)涵映射為本體概念的屬性、外延映射為本體的實(shí)例。具體映射規(guī)則如圖2[15]。
根據(jù)以上方法與規(guī)則構(gòu)建虛擬社區(qū)用戶知識(shí)本體的邏輯模型后,再選擇適當(dāng)本體編輯工具(如JOE、KADS22、protégé等)把本體從自然語(yǔ)言的表示形式轉(zhuǎn)化成機(jī)器可理解的邏輯表達(dá)形式,具體的開(kāi)發(fā)過(guò)程在以往眾多本體構(gòu)建的相關(guān)文獻(xiàn)中已有詳細(xì)闡述,本文不再重復(fù)。
4 結(jié) 論
作為Web20的典型產(chǎn)物之一,虛擬社區(qū)的意義在于實(shí)現(xiàn)社區(qū)成員間跨時(shí)間、跨地域的知識(shí)交流、共享、創(chuàng)新等知識(shí)活動(dòng)。因此,虛擬社區(qū)的知識(shí)資產(chǎn)不僅包括社區(qū)中的文本、圖片、視頻等顯性知識(shí),更包括存在于成員頭腦中的隱性知識(shí)。虛擬社區(qū)的知識(shí)組織必須同時(shí)考慮這兩者。
結(jié)合上述考慮,本文提出一種基于FCA和SNA的虛擬社區(qū)成員知識(shí)本體的構(gòu)建流程,詳細(xì)闡述了其中的關(guān)鍵方法,并認(rèn)為虛擬社區(qū)成員知識(shí)本體是一種能夠同時(shí)兼顧隱性知識(shí)和顯性知識(shí)的有效知識(shí)組織模型。基于SNA獲得社區(qū)意見(jiàn)領(lǐng)袖,以社區(qū)意見(jiàn)領(lǐng)袖作為形式對(duì)象,從社區(qū)成員知識(shí)活動(dòng)產(chǎn)生的顯性知識(shí)獲取知識(shí)概念作為形式屬性,構(gòu)建形式背景,生成概念格,最終基于FCA與本體的映射關(guān)系構(gòu)建本體?;谔摂M社區(qū)成員知識(shí)本體的知識(shí)組織方式,其組織對(duì)象既可以是社區(qū)成員,也可以社區(qū)的顯性知識(shí),在此基礎(chǔ)上可以實(shí)現(xiàn)顯性/隱性知識(shí)導(dǎo)航、知識(shí)檢索、個(gè)性化推薦等應(yīng)用。
參考文獻(xiàn)
[1]Rheingold Howard.The Virtual Community:Homesteading on the Electronic Frontier[M].The MIT Press,2000:3-16.
[2]楊軍節(jié).虛擬社區(qū)的概念、特征與營(yíng)銷啟示探析[J].湖南商學(xué)院學(xué)報(bào),2011,18(3):72-75.
[3]張玉峰,周磊,王志芳,等.領(lǐng)域本體構(gòu)建與可視化展示研究[J].情報(bào)理論與實(shí)踐,2012,(10):95-98,128.
[4]常艷.基于本體的數(shù)字圖書(shū)館知識(shí)組織構(gòu)建模式研究[D].長(zhǎng)春:吉林大學(xué),2008.
[5]周文,劉宗田,陳慧瓊.FCA與本體結(jié)合研究的綜述[J].計(jì)算機(jī)科學(xué),2006,(2):8-12.
[6]陳向東,余錦鳳.一種基于本體的知識(shí)組織工具[J].情報(bào)理論與實(shí)踐,2006,(6):746-749.
[7]徐小龍,王方華.虛擬社區(qū)的知識(shí)共享機(jī)制研究[J].自然辯證法研究,2007,(8):83-86.
[8]劉萍,高慧琴,胡月紅.基于形式概念分析的情報(bào)學(xué)領(lǐng)域本體構(gòu)建[J].圖書(shū)情報(bào)知識(shí),2012,(3):20-26.
[9]滕廣青.基于概念格的數(shù)字圖書(shū)館知識(shí)組織研究[D].長(zhǎng)春:吉林大學(xué),2012.
[10]B甘特爾,R威爾.形式概念分析[M].馬垣,張學(xué)東,遲呈英,等譯.北京:科學(xué)出版社,2007:15-17.
[11]羅曉光,溪璐路.基于社會(huì)網(wǎng)絡(luò)分析方法的顧客口碑意見(jiàn)領(lǐng)袖研究[J].管理評(píng)論,2012,(1):75-81.
[12]李慧,王宗鋒.虛擬社區(qū)中意見(jiàn)領(lǐng)袖的識(shí)別模型研究[J].電化教育研究,2013,(2):42-46.
[13]王陸.虛擬學(xué)習(xí)社區(qū)的社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)研究[D].蘭州:西北師范大學(xué),2009.
[14]滕廣青,畢強(qiáng).基于概念格的異構(gòu)資源領(lǐng)域本體構(gòu)建研究[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2011,(5):7-12.
[15]田維,郭劍毅,余正濤,等.結(jié)合FCA與Jena的領(lǐng)域本體半自動(dòng)構(gòu)建方法研究[J].計(jì)算機(jī)工程與科學(xué),2013,(3):115-120.
[16]Obitko M,Snasel V,Smid J.Ontology Design with Formal Concept Analysis.In:Proceedings of the International Workshop on Concept Lattices and Their Applications(CLA).Ostrava,Czech Republic,2004:111-119.
[17]Haav H M.A Semi-automatic Method to Ontology Design by Using FCA[C].In:Proceedings of the 2nd International CLA Workshop,Concept Lattices and Their Applications.Technical Uni-versity of Ostrava,2004:13-25.
[18]Cimiano P,Hotho A,Stumme G,Tane J.Conceptual knowledge processing with formal concept analysis and ontologies[M]∥Concept Lattices.Springer Berlin Heidelberg,2004:189-207.
(本文責(zé)任編輯:孫國(guó)雷)endprint