国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于時(shí)空域聯(lián)合建模的領(lǐng)域知識(shí)演化脈絡(luò)分析

2017-12-05 11:16金晨謝振平任立園劉淵
智能系統(tǒng)學(xué)報(bào) 2017年5期
關(guān)鍵詞:骨架聚類(lèi)領(lǐng)域

金晨,謝振平,任立園,劉淵

(1.江南大學(xué) 數(shù)字媒體學(xué)院,江蘇 無(wú)錫 214122; 2.江蘇省媒體設(shè)計(jì)與軟件技術(shù)重點(diǎn)實(shí)驗(yàn)室, 江蘇 無(wú)錫 214122)

基于時(shí)空域聯(lián)合建模的領(lǐng)域知識(shí)演化脈絡(luò)分析

金晨,謝振平,任立園,劉淵

(1.江南大學(xué) 數(shù)字媒體學(xué)院,江蘇 無(wú)錫 214122; 2.江蘇省媒體設(shè)計(jì)與軟件技術(shù)重點(diǎn)實(shí)驗(yàn)室, 江蘇 無(wú)錫 214122)

同一領(lǐng)域不同知識(shí)概念之間存在演化關(guān)系,分析演化關(guān)系能有效地梳理領(lǐng)域知識(shí)的發(fā)展脈絡(luò),然而網(wǎng)絡(luò)知識(shí)的碎片化、無(wú)序性、大規(guī)模等特性使得用戶(hù)很難準(zhǔn)確地分析并獲取知識(shí)之間的這種關(guān)系。針對(duì)該問(wèn)題,本文提出一種基于時(shí)空域聯(lián)合建模的領(lǐng)域知識(shí)演化脈絡(luò)分析方法,該方法首先考慮將知識(shí)系統(tǒng)以時(shí)空域聯(lián)合知識(shí)網(wǎng)絡(luò)的形式進(jìn)行表達(dá),隨后采用骨架聚類(lèi)方法提取歷年知識(shí)網(wǎng)絡(luò)演化路徑,并按知識(shí)概念的發(fā)展進(jìn)行演化路徑銜接及路徑分析。以數(shù)字媒體領(lǐng)域知識(shí)為例的實(shí)驗(yàn)分析表明,該方法能有效提取按年份發(fā)展的領(lǐng)域知識(shí)演化路徑,對(duì)于輔助用戶(hù)進(jìn)行領(lǐng)域知識(shí)的理解與學(xué)習(xí),以及個(gè)性化推薦具有顯著的價(jià)值。

知識(shí)演化;演化路徑;知識(shí)網(wǎng)絡(luò);知識(shí)系統(tǒng);時(shí)空域聯(lián)合;骨架聚類(lèi);數(shù)字媒體知識(shí)

領(lǐng)域知識(shí)是一個(gè)隨時(shí)間擴(kuò)展的體系,那些重要的理論定律不斷被引用,新穎的思想和觀點(diǎn)不斷產(chǎn)生,新舊知識(shí)之間始終保持動(dòng)態(tài)的知識(shí)增長(zhǎng)。在這個(gè)過(guò)程中,學(xué)科領(lǐng)域逐步細(xì)化,知識(shí)框架也將發(fā)生改變,但科學(xué)知識(shí)始終保持一個(gè)整體,這其中體現(xiàn)了知識(shí)的演化。知識(shí)之間存在一種建構(gòu)的關(guān)系[1-2],任何新知識(shí)不可能憑空產(chǎn)生,必然基于現(xiàn)有的知識(shí)經(jīng)驗(yàn),可以說(shuō),新知識(shí)是現(xiàn)有知識(shí)的演化和創(chuàng)新。知識(shí)演化體現(xiàn)了知識(shí)之間傳承和發(fā)展的關(guān)系,提取知識(shí)間的這種演化關(guān)系具有十分重要的意義。一方面,科學(xué)知識(shí)的增長(zhǎng),知識(shí)數(shù)量的膨脹,給用戶(hù)準(zhǔn)確有效地獲取所需知識(shí)帶來(lái)了巨大的挑戰(zhàn),知識(shí)演化分析[3-4]能夠幫助用戶(hù)有效地梳理復(fù)雜的知識(shí)關(guān)系,獲悉領(lǐng)域研究熱點(diǎn)及發(fā)展動(dòng)向。另一方面,目前網(wǎng)絡(luò)個(gè)性化知識(shí)服務(wù)已相當(dāng)成熟,然而能體現(xiàn)時(shí)空上演化的知識(shí)服務(wù)卻少有研究,設(shè)計(jì)一種自動(dòng)提取領(lǐng)域知識(shí)演化關(guān)系的方法能夠?yàn)橛脩?hù)生成具有時(shí)間上連續(xù)的演化知識(shí)序列,對(duì)個(gè)性化知識(shí)服務(wù)的改進(jìn)具有一定的價(jià)值。

一對(duì)演化關(guān)系由兩個(gè)實(shí)體概念組成,演化路徑則是演化關(guān)系的連續(xù)序列,包括演化起點(diǎn)、演化終點(diǎn)及演化中間點(diǎn)。例如,1990年數(shù)字媒體領(lǐng)域的一條演化路徑“電視廣播—電視教育—電教媒體—遠(yuǎn)距離教育—電化教學(xué)—計(jì)算機(jī)技術(shù)”,“電視廣播”表示知識(shí)演化起點(diǎn),“計(jì)算機(jī)技術(shù)”表示知識(shí)演化終點(diǎn)??梢钥闯觯?990年數(shù)字媒體領(lǐng)域熱點(diǎn)話(huà)題圍繞傳統(tǒng)媒體,并將傳統(tǒng)媒體廣泛應(yīng)用于教學(xué),整體的演化趨勢(shì)從傳統(tǒng)媒體趨向計(jì)算機(jī)技術(shù)。

為了較好地挖掘知識(shí)間的這種演化關(guān)系,研究者通常采用知識(shí)網(wǎng)絡(luò)來(lái)表示不同形式知識(shí)單元之間的聯(lián)系,并設(shè)計(jì)自動(dòng)化的知識(shí)關(guān)系抽取模型,進(jìn)而獲取有效的知識(shí)信息。根據(jù)知識(shí)單元的不同表現(xiàn)形式,常見(jiàn)的知識(shí)網(wǎng)絡(luò)包括引證網(wǎng)絡(luò)[5-6]、合作網(wǎng)絡(luò)[7-9]、共詞網(wǎng)絡(luò)[10-12]等。此外,可視化文獻(xiàn)分析軟件也廣泛應(yīng)用在研究學(xué)科領(lǐng)域的發(fā)展趨勢(shì)與動(dòng)向。例如,馬費(fèi)成等[4]在引文網(wǎng)絡(luò)的基礎(chǔ)上采用網(wǎng)絡(luò)分析軟件Citespace,以生物醫(yī)學(xué)領(lǐng)域?yàn)槔M(jìn)行了領(lǐng)域主題聚類(lèi)、關(guān)鍵路徑提取、核心文獻(xiàn)分析等研究,實(shí)驗(yàn)分析結(jié)果為學(xué)科發(fā)展提供了較好的理解。但Citespace只有在文獻(xiàn)引文網(wǎng)絡(luò)分析中有較好表現(xiàn),并且對(duì)文獻(xiàn)格式等有一定要求。

本文提出一種基于時(shí)空域聯(lián)合建模的領(lǐng)域知識(shí)演化脈絡(luò)分析方法,在傳統(tǒng)知識(shí)網(wǎng)絡(luò)分析技術(shù)的基礎(chǔ)上引入骨架聚類(lèi)技術(shù)[13-15],針對(duì)網(wǎng)絡(luò)結(jié)構(gòu)中的最短路徑進(jìn)行骨架聚類(lèi)分析,骨架聚類(lèi)效果最優(yōu)的最短路徑視為該知識(shí)網(wǎng)絡(luò)的演化路徑,并根據(jù)時(shí)空上連續(xù)的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行演化路徑銜接,形成連續(xù)年份的知識(shí)演化脈絡(luò)??紤]到近年來(lái)數(shù)字媒體領(lǐng)域發(fā)展之快,影響面之廣,本文實(shí)驗(yàn)以CNKI在數(shù)字媒體領(lǐng)域發(fā)表的期刊文獻(xiàn)作為數(shù)據(jù)來(lái)源,按年份發(fā)展逐年構(gòu)建知識(shí)網(wǎng)絡(luò)并采用骨架聚類(lèi)提取演化路徑,進(jìn)而對(duì)數(shù)字媒體領(lǐng)域的發(fā)展歷程進(jìn)行研究分析。

1 模型框架

本文提出的基于時(shí)空域聯(lián)合建模的領(lǐng)域知識(shí)演化脈絡(luò)分析方法著重考慮兩個(gè)問(wèn)題:如何表示知識(shí)概念之間的演化關(guān)系;如何從復(fù)雜的演化關(guān)系中提取演化路徑。針對(duì)上述問(wèn)題,本文設(shè)計(jì)的模型框架由兩部分組成:1)采用知識(shí)網(wǎng)絡(luò)來(lái)表示知識(shí)概念之間的演化關(guān)系,網(wǎng)絡(luò)節(jié)點(diǎn)表示知識(shí)概念,網(wǎng)絡(luò)邊表示連接兩個(gè)知識(shí)概念存在知識(shí)演化關(guān)系;2)采用“局部聚合,整體關(guān)聯(lián)”的思想進(jìn)行網(wǎng)絡(luò)骨架聚類(lèi)分析。“局部聚合”指骨架節(jié)點(diǎn)能夠作為鄰近節(jié)點(diǎn)的聚類(lèi)中心,形成局部稠密子圖;“整體關(guān)聯(lián)”指各骨架節(jié)點(diǎn)在網(wǎng)絡(luò)圖中是連通的,并且整條骨架上的各節(jié)點(diǎn)聚類(lèi)系數(shù)之和最小,則該骨架認(rèn)為是網(wǎng)絡(luò)圖的一條最優(yōu)知識(shí)脈絡(luò)。

1.1 知識(shí)網(wǎng)絡(luò)模塊

在知識(shí)圖譜領(lǐng)域,知識(shí)網(wǎng)絡(luò)是研究知識(shí)發(fā)展的重要工具[16-20]。知識(shí)網(wǎng)絡(luò)由節(jié)點(diǎn)和邊組成,節(jié)點(diǎn)表示知識(shí)實(shí)體單元,邊表示實(shí)體單元之間的知識(shí)關(guān)聯(lián)。按實(shí)體單元不同,節(jié)點(diǎn)可以是論文、專(zhuān)利、書(shū)籍、關(guān)鍵詞等;按知識(shí)關(guān)聯(lián)不同,邊可以是引證關(guān)系、共現(xiàn)關(guān)系、合作關(guān)系等。本文采用的知識(shí)網(wǎng)絡(luò)是一種改進(jìn)的共詞網(wǎng)絡(luò),以領(lǐng)域關(guān)鍵詞為節(jié)點(diǎn),以演化關(guān)系權(quán)重作為邊。相對(duì)于引證網(wǎng)絡(luò),共詞網(wǎng)絡(luò)能夠更加直觀有效地體現(xiàn)實(shí)體概念在網(wǎng)絡(luò)結(jié)構(gòu)上的演化脈絡(luò)。

本文構(gòu)建的知識(shí)網(wǎng)絡(luò)是一種加權(quán)無(wú)向網(wǎng)絡(luò),目前對(duì)該類(lèi)網(wǎng)絡(luò)的研究主要包括兩方面:1)網(wǎng)絡(luò)節(jié)點(diǎn)在網(wǎng)絡(luò)圖中的重要性評(píng)價(jià),評(píng)價(jià)指標(biāo)主要有節(jié)點(diǎn)詞頻,節(jié)點(diǎn)度(無(wú)向圖中出度入度相等,統(tǒng)稱(chēng)為節(jié)點(diǎn)度),中介中心度等;2)基于節(jié)點(diǎn)連線的網(wǎng)絡(luò)路徑分析,包括最短路徑、關(guān)鍵路徑、平均路徑長(zhǎng)度等。網(wǎng)絡(luò)節(jié)點(diǎn)分析常用于獲取網(wǎng)絡(luò)主題分布,而網(wǎng)絡(luò)路徑分析則用于預(yù)測(cè)領(lǐng)域知識(shí)發(fā)展方向、發(fā)現(xiàn)研究熱點(diǎn)等。

本文構(gòu)建知識(shí)網(wǎng)絡(luò)的過(guò)程主要包括以下3個(gè)步驟。1)獲取網(wǎng)絡(luò)節(jié)點(diǎn):自動(dòng)抽取數(shù)字媒體文獻(xiàn)的關(guān)鍵詞,進(jìn)行關(guān)鍵詞篩選和統(tǒng)計(jì),獲取具有代表性的領(lǐng)域關(guān)鍵詞作為網(wǎng)絡(luò)節(jié)點(diǎn)。2)提取節(jié)點(diǎn)關(guān)系:統(tǒng)計(jì)關(guān)鍵詞在文檔中的共現(xiàn)頻率,基于共現(xiàn)頻率計(jì)算關(guān)鍵詞對(duì)的演化權(quán)重,以演化權(quán)重作為節(jié)點(diǎn)關(guān)系。3)根據(jù)獲取的網(wǎng)絡(luò)節(jié)點(diǎn)以及節(jié)點(diǎn)關(guān)系逐年構(gòu)建知識(shí)網(wǎng)絡(luò),形成相鄰年份網(wǎng)絡(luò)結(jié)構(gòu)關(guān)聯(lián)的時(shí)空域聯(lián)合知識(shí)網(wǎng)絡(luò)。

1.1.1 知識(shí)術(shù)語(yǔ)抽取

隨著自然語(yǔ)言處理領(lǐng)域的快速發(fā)展,領(lǐng)域術(shù)語(yǔ)抽取技術(shù)已取得顯著的成績(jī)[21-23],并且涌現(xiàn)出了一批成熟的術(shù)語(yǔ)抽取系統(tǒng)[24],其中最著名的是中科院漢語(yǔ)分詞系統(tǒng)NLPIR。本節(jié)主要介紹如何使用NLPIR工具進(jìn)行文檔術(shù)語(yǔ)抽取及統(tǒng)計(jì)工作。術(shù)語(yǔ)抽取的具體流程如圖1所示:首先搜集指定領(lǐng)域相關(guān)的文本語(yǔ)料,然后調(diào)用NLPIR系統(tǒng)的KeyExtract_GetKeyWords方法進(jìn)行單篇文檔術(shù)語(yǔ)抽取,并將獲取的關(guān)鍵詞以鍵值對(duì)的形式存入HashMap中,Key表示關(guān)鍵詞,Value表示關(guān)鍵詞出現(xiàn)的次數(shù),從而實(shí)現(xiàn)關(guān)鍵詞次數(shù)統(tǒng)計(jì)。統(tǒng)計(jì)過(guò)程首先提取文檔ti的關(guān)鍵詞集合K,如果關(guān)鍵詞首次出現(xiàn)則存入HashMap,并將Key值設(shè)為1;如果關(guān)鍵詞在HashMap中已存在,則將關(guān)鍵詞對(duì)應(yīng)的Value值累加1;直到統(tǒng)計(jì)完該年所有文檔中的關(guān)鍵詞。最終按Value值對(duì)關(guān)鍵詞進(jìn)行降序排序,獲取頻次較高的前N個(gè)關(guān)鍵詞作為該領(lǐng)域術(shù)語(yǔ)集合。

圖1 術(shù)語(yǔ)抽取流程Fig.1 Term extraction process

1.1.2 時(shí)空域聯(lián)合知識(shí)網(wǎng)絡(luò)構(gòu)建

時(shí)空域聯(lián)合知識(shí)網(wǎng)絡(luò)旨在通過(guò)構(gòu)建空間上連續(xù)層面的知識(shí)網(wǎng)絡(luò)來(lái)表現(xiàn)知識(shí)在時(shí)間上的連續(xù)演化關(guān)系。聯(lián)合知識(shí)網(wǎng)絡(luò)構(gòu)建過(guò)程可分為兩步:首先逐年創(chuàng)建知識(shí)網(wǎng)絡(luò),然后根據(jù)相鄰年份重復(fù)的網(wǎng)絡(luò)節(jié)點(diǎn)自動(dòng)形成空間上連續(xù)的網(wǎng)絡(luò)結(jié)構(gòu)。

構(gòu)建知識(shí)網(wǎng)絡(luò)的核心工作在于提取網(wǎng)絡(luò)節(jié)點(diǎn)之間的關(guān)系權(quán)重,本文將知識(shí)概念之間的演化關(guān)系視為網(wǎng)絡(luò)邊權(quán)重。演化關(guān)系可認(rèn)為是實(shí)體關(guān)系[25-26]的一種,這種關(guān)系是由知識(shí)概念在文檔中的語(yǔ)義距離和共現(xiàn)頻率決定的,距離越小頻率越高則演化強(qiáng)度越大。本文針對(duì)演化關(guān)系給出如下定義:對(duì)于給定的文檔T,文檔知識(shí)概念實(shí)體序列表示為S={s1,s2,s3,…},兩個(gè)實(shí)體概念si和sj在序列S中的語(yǔ)義距離計(jì)算如(1)式:

式中:i和j表示知識(shí)概念在序列中出現(xiàn)的位置,n表示知識(shí)對(duì)在序列中出現(xiàn)的次數(shù)。語(yǔ)義距離越小表明實(shí)體概念si和sj之間的演化強(qiáng)度越大。在實(shí)驗(yàn)過(guò)程中本文設(shè)定語(yǔ)義距離閾值ε,當(dāng)知識(shí)對(duì)在共現(xiàn)序列中位置差小于給定閾值時(shí)認(rèn)為兩個(gè)知識(shí)存在演化關(guān)系,否則認(rèn)為沒(méi)有關(guān)系。如果節(jié)點(diǎn)對(duì)si和sj之間存在演化關(guān)系,則節(jié)點(diǎn)對(duì)在知識(shí)網(wǎng)絡(luò)中必然存在一條關(guān)聯(lián)路徑。演化距離的定義如(2)式所示:

提取演化關(guān)系具體流程如圖2所示:將提取的關(guān)鍵詞導(dǎo)入NLPIR分詞工具,作為用戶(hù)自定義詞典,使分詞工具能夠?qū)崿F(xiàn)粒度較大的分詞。對(duì)單篇文檔進(jìn)行分詞,篩選分詞結(jié)果中的用戶(hù)自定義詞,初步得到文檔關(guān)鍵詞序列S,合并序列中相鄰重復(fù)出現(xiàn)的關(guān)鍵詞,得到相鄰關(guān)鍵詞不重復(fù)的新序列S′。在此基礎(chǔ)上,進(jìn)一步統(tǒng)計(jì)序列S′中兩兩關(guān)鍵詞對(duì)的關(guān)系。例如,si和sj是S′中的兩個(gè)關(guān)鍵詞,按{sij,dij,nij}的格式進(jìn)行存儲(chǔ),sij表示關(guān)系對(duì),dij表示關(guān)系對(duì)在文檔中的語(yǔ)義距離,nij表示關(guān)系對(duì)出現(xiàn)的次數(shù)。進(jìn)一步,統(tǒng)計(jì)所有文檔中出現(xiàn)的關(guān)系對(duì),對(duì)于重復(fù)出現(xiàn)的關(guān)系對(duì),dij值累加,nij值累加。最終得到每一對(duì)關(guān)系的平均語(yǔ)義距離及出現(xiàn)的次數(shù)。根據(jù)式(2)計(jì)算每一對(duì)關(guān)系的演化距離,作為知識(shí)網(wǎng)絡(luò)邊的權(quán)重。

圖2 演化關(guān)系抽取流程Fig.2 Evolutionary relationship extraction process

按照上述方法,我們以關(guān)鍵詞作為知識(shí)網(wǎng)絡(luò)節(jié)點(diǎn),以演化距離作為知識(shí)網(wǎng)絡(luò)邊的權(quán)重,逐年構(gòu)建知識(shí)網(wǎng)絡(luò),并根據(jù)相鄰年份重復(fù)節(jié)點(diǎn)自動(dòng)形成時(shí)空域聯(lián)合知識(shí)網(wǎng)絡(luò)。圖3為連續(xù)3年的時(shí)空域聯(lián)合知識(shí)網(wǎng)絡(luò)結(jié)構(gòu),圓點(diǎn)表示知識(shí)概念,圓點(diǎn)半徑越大表明該知識(shí)在網(wǎng)絡(luò)中的重要性越強(qiáng);節(jié)點(diǎn)間的連線表示演化關(guān)系,權(quán)重越小則節(jié)點(diǎn)距離越近,表明兩個(gè)知識(shí)之間演化強(qiáng)度越大。虛線表示相鄰年份知識(shí)網(wǎng)絡(luò)之間存在重疊的知識(shí)概念,通過(guò)這些重復(fù)的知識(shí)概念來(lái)建立連續(xù)年份之間的知識(shí)演化關(guān)系。

圖3 時(shí)空域聯(lián)合知識(shí)網(wǎng)絡(luò)結(jié)構(gòu)Fig. 3 Space-time domain joint knowledge network structure

1.2 骨架聚類(lèi)分析

基于給定知識(shí)網(wǎng)絡(luò),如何從該知識(shí)網(wǎng)絡(luò)中提取理想的演化路徑是本節(jié)主要討論的問(wèn)題。一條理想的演化路徑可看作若干條網(wǎng)絡(luò)結(jié)構(gòu)骨架的連接,骨架是用于支撐網(wǎng)絡(luò)結(jié)構(gòu)或輪廓的支架,一條理想的骨架應(yīng)具有中心性、連通性等特性。本文提出一種骨架聚類(lèi)的方法提取知識(shí)網(wǎng)絡(luò)中的演化路徑。骨架聚類(lèi)方法的整體思想是“局部聚合,整體關(guān)聯(lián)”。“局部聚合”的目的是將知識(shí)網(wǎng)絡(luò)進(jìn)行聚類(lèi)劃分,每一個(gè)類(lèi)可認(rèn)為是一個(gè)知識(shí)主題,骨架節(jié)點(diǎn)應(yīng)盡可能地分布在不同的知識(shí)主題中,并且該骨架節(jié)點(diǎn)能夠作為主題的一個(gè)聚類(lèi)中心,使得主題聚類(lèi)效果最優(yōu)。“整體關(guān)聯(lián)”的目的是將所有的骨架節(jié)點(diǎn)進(jìn)行連接,整合成一條完整的骨架,理論上整條骨架應(yīng)盡可能全面地覆蓋知識(shí)網(wǎng)絡(luò),并且使得骨架節(jié)點(diǎn)的主題聚類(lèi)效果之和最優(yōu)。

圖4為知識(shí)網(wǎng)絡(luò)演化路徑示意圖,圓點(diǎn)表示知識(shí)節(jié)點(diǎn),連線表示演化關(guān)系。圖4展示了3個(gè)連續(xù)年份的知識(shí)網(wǎng)絡(luò)i,j,k,其中A—B—C—D和O—P—Q—R表示兩條完整的演化路徑。每個(gè)知識(shí)網(wǎng)絡(luò)中提取兩條骨架路徑,如年份i知識(shí)網(wǎng)絡(luò)中實(shí)線A—B和O—P所示。相鄰知識(shí)網(wǎng)絡(luò)間的虛線連接表示上一年演化路徑的終點(diǎn)與下一年演化路徑的起點(diǎn)為同一個(gè)知識(shí),如圖4中B—B、C—C等。

圖4 聯(lián)合時(shí)空域知識(shí)網(wǎng)絡(luò)演化路徑 Fig.4 Evolutionary paths in joint space-time knowledge network

兩個(gè)知識(shí)之間存在許多種可能的演化路徑,其中最短路徑認(rèn)為是最優(yōu)的演化路徑。最短路徑通常用于計(jì)算網(wǎng)絡(luò)圖中一個(gè)節(jié)點(diǎn)到其他節(jié)點(diǎn)的最小路徑代價(jià),在知識(shí)演化網(wǎng)絡(luò)圖中,最短路徑可認(rèn)為是知識(shí)間演化的必然趨勢(shì)。不同的演化起點(diǎn)和演化終點(diǎn)對(duì)應(yīng)不同的最短路徑,因此需進(jìn)一步通過(guò)骨架聚類(lèi)的方法來(lái)分析不同最短路徑對(duì)整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)的演化重要性。

骨架由骨架節(jié)點(diǎn)組成,一個(gè)理想的骨架節(jié)點(diǎn)應(yīng)具有較好的中心性,相鄰節(jié)點(diǎn)簇以骨架節(jié)點(diǎn)為聚類(lèi)中心構(gòu)成一個(gè)知識(shí)主題。節(jié)點(diǎn)聚類(lèi)系數(shù)具體計(jì)算公式如(3)式所示:

式中:CH(s)表示骨架節(jié)點(diǎn)s的聚類(lèi)系數(shù);C表示s所對(duì)應(yīng)的知識(shí)主題;Cn表示主題C包含的節(jié)點(diǎn)數(shù);dis(*,*)表示節(jié)點(diǎn)間的最短路徑。如果CH(s)聚類(lèi)系數(shù)值最小,則節(jié)點(diǎn)s被認(rèn)為主題聚類(lèi)中心,即骨架節(jié)點(diǎn)。進(jìn)一步計(jì)算整條骨架的主題聚類(lèi)系數(shù),根據(jù)骨架節(jié)點(diǎn)聚類(lèi)系數(shù)平均值來(lái)選取最優(yōu)的骨架。具體計(jì)算公式如(4)式所示:

式中Sn表示骨架S包含的骨架節(jié)點(diǎn)數(shù)。如果骨架S的聚類(lèi)系數(shù)平均值SH(S)最小,則認(rèn)為該最短路徑對(duì)應(yīng)的骨架是一條理想演化路徑。

1.3 演化路徑抽取

連續(xù)年份知識(shí)演化路徑提取算法詳細(xì)描述如下:

1)for literatureli∈L|1990≤i≤2016

2)Gi=GetKnowledgeGraph(li)

3)if 1990≤i≤2015

5)ifi=1990

7)if 1991≤i≤2015

9)ifi=2016

10)S′={djs(Vx,Vy)|Vx∈VTi-1,Vy∈Gi};

11)LetCv=SH(s)|s∈S′;

12)SortS′ byCv;

13)get top-kitems ofS′;

14)end

15)S=Link(Si,Si+1);

2 實(shí)驗(yàn)研究

2.1 實(shí)驗(yàn)數(shù)據(jù)

考慮領(lǐng)域的發(fā)展現(xiàn)狀及研究熱點(diǎn),本文以數(shù)字媒體領(lǐng)域作為實(shí)驗(yàn)研究對(duì)象。搜集和處理數(shù)據(jù)的步驟如下:首先數(shù)據(jù)來(lái)源選擇CNKI中國(guó)知網(wǎng),分別以“媒體”和“數(shù)字媒體”作為檢索輸入,以“關(guān)鍵詞”和“摘要”作為檢索項(xiàng),檢索1990~2016年期間發(fā)表的期刊文章。再按年份下載CAJ格式論文,并以“1990-01”的格式保存在相應(yīng)年份的文件夾下。如果某一年發(fā)表的文章數(shù)量較多,則根據(jù)文章的下載量和被引量擇優(yōu)選擇300~500篇。然后,采用CAJViewer自帶的“另存為”功能將CAJ格式轉(zhuǎn)化成TXT格式,便于Java程序進(jìn)行處理。由于早期發(fā)表的部分文章均采用圖片格式保存,導(dǎo)致格式轉(zhuǎn)換出現(xiàn)亂碼,需通過(guò)程序進(jìn)行篩選,去除無(wú)效數(shù)據(jù)。最終,獲取1990~2016年間數(shù)字媒體領(lǐng)域發(fā)表的部分具有代表性的學(xué)術(shù)文章,共計(jì)5 420篇,其中1990年文章數(shù)量最少僅有11篇,2016年最多514篇。這些文章基本能夠代表數(shù)字媒體領(lǐng)域的發(fā)展動(dòng)態(tài)及研究成果。

2.2 實(shí)驗(yàn)分析

實(shí)驗(yàn)部分主要基于知識(shí)網(wǎng)絡(luò)展開(kāi)分析,首先整合數(shù)字媒體領(lǐng)域歷年的期刊文獻(xiàn),構(gòu)建一個(gè)整體的領(lǐng)域知識(shí)網(wǎng)絡(luò),根據(jù)網(wǎng)絡(luò)的詞頻、節(jié)點(diǎn)度來(lái)整體分析數(shù)字媒體領(lǐng)域的核心知識(shí)和研究熱點(diǎn);然后,針對(duì)歷年數(shù)字媒體知識(shí)網(wǎng)絡(luò)進(jìn)行知識(shí)演化分析,并提取演化路徑來(lái)展示數(shù)字媒體領(lǐng)域的發(fā)展歷程。

2.2.1 網(wǎng)絡(luò)節(jié)點(diǎn)分析

首先采用NLPIR分詞工具進(jìn)行數(shù)字媒體領(lǐng)域關(guān)鍵詞提取,實(shí)驗(yàn)從每一篇文檔中擇優(yōu)提取10個(gè)關(guān)鍵詞,并統(tǒng)計(jì)5 420篇文檔中所有關(guān)鍵詞及其相應(yīng)的詞頻,最終篩選獲取詞頻最高的953個(gè)關(guān)鍵詞作為數(shù)字媒體領(lǐng)域的知識(shí)術(shù)語(yǔ)。表1為出現(xiàn)頻數(shù)最高的Top10關(guān)鍵詞,表中展示的“數(shù)字媒體”、“媒體”、“傳統(tǒng)媒體”等關(guān)鍵詞都是數(shù)字媒體領(lǐng)域非常有代表性的知識(shí)術(shù)語(yǔ),這在一定程度上展示了關(guān)鍵詞提取的有效性。

表1數(shù)字媒體領(lǐng)域整合詞頻前十關(guān)鍵詞列表

Table1Mostfrequenttenkeywordsindigitalmediaknowledgedomain

序號(hào)關(guān)鍵詞出現(xiàn)頻數(shù)1數(shù)字媒體8362媒體7083傳統(tǒng)媒體6674信息5425新聞4096傳播3567數(shù)字電視3368網(wǎng)絡(luò)3259廣告31310電視298

進(jìn)一步整合數(shù)字媒體1990~2016年所有的期刊文獻(xiàn),構(gòu)建一個(gè)涵蓋27年知識(shí)發(fā)展的整體知識(shí)網(wǎng)絡(luò)并分析網(wǎng)絡(luò)節(jié)點(diǎn)度。以獲取的953個(gè)知識(shí)術(shù)語(yǔ)作為數(shù)字媒體知識(shí)庫(kù),從5 420篇期刊中提取這些關(guān)鍵詞在文檔中的序列,并根據(jù)式(2)計(jì)算序列中關(guān)鍵詞對(duì)的演化距離,以關(guān)鍵詞作為網(wǎng)絡(luò)節(jié)點(diǎn),演化距離作為網(wǎng)絡(luò)邊構(gòu)建知識(shí)網(wǎng)絡(luò)。

節(jié)點(diǎn)度表示知識(shí)網(wǎng)絡(luò)中節(jié)點(diǎn)擁有的關(guān)系數(shù)量,關(guān)系數(shù)量越大表明該關(guān)鍵詞的重要性越強(qiáng)。圖5為953個(gè)關(guān)鍵詞所擁有的116 274對(duì)知識(shí)關(guān)系,關(guān)鍵詞度數(shù)服從長(zhǎng)尾分布,表明知識(shí)網(wǎng)絡(luò)內(nèi)部擁有小部分節(jié)點(diǎn)度較大的核心知識(shí),大部分節(jié)點(diǎn)度較小的邊緣知識(shí),核心知識(shí)在網(wǎng)絡(luò)中起到“橋梁”的作用,為邊緣知識(shí)建立知識(shí)關(guān)聯(lián)。

圖5 知識(shí)網(wǎng)絡(luò)節(jié)點(diǎn)度分布曲線Fig.5 Knowledge network node degree distribution

表2為部分年份知識(shí)網(wǎng)絡(luò)節(jié)點(diǎn)度前20關(guān)鍵詞列表,分析列表數(shù)據(jù)可知,1990年主要以“電視”、“廣播”、“電化教學(xué)”等傳統(tǒng)媒體關(guān)鍵詞為主,2000年以后“網(wǎng)絡(luò)”、“互聯(lián)網(wǎng)”、“手機(jī)”等關(guān)鍵詞開(kāi)始涌現(xiàn),而具有領(lǐng)域廣泛代表性的“媒體”、“電視”等關(guān)鍵詞在各年份都高頻出現(xiàn),這在一定程度上體現(xiàn)了數(shù)字媒體領(lǐng)域伴隨年份的演化特征。

表2 部分年份知識(shí)網(wǎng)絡(luò)節(jié)點(diǎn)度前20關(guān)鍵詞列表

2.2.2 演化脈絡(luò)分析

實(shí)驗(yàn)給出了數(shù)字媒體領(lǐng)域1990—2016年10條最優(yōu)的演化路徑。首先以1990年作為知識(shí)演化起始年份,從中提取了10條聚類(lèi)效果最優(yōu)的演化路徑,并以該年的10個(gè)演化終點(diǎn)知識(shí)作為下一年的知識(shí)演化起點(diǎn),以此獲取10條連續(xù)的涵蓋數(shù)字媒體領(lǐng)域27年的知識(shí)演化脈絡(luò)。需要指出的是,由于知識(shí)網(wǎng)絡(luò)是一個(gè)無(wú)向圖,某一年的演化路徑無(wú)法體現(xiàn)演化的方向性,演化方向主要體現(xiàn)在連續(xù)年份上知識(shí)的發(fā)展。例如,某一年存在兩條演化路徑A—B—C和C—B—A,演化的下一年將分別以節(jié)點(diǎn)C和節(jié)點(diǎn)A作為演化起點(diǎn),因此在連續(xù)年份的知識(shí)演化上這兩條路徑的知識(shí)演化方向是完全不同的。

表3給出了實(shí)驗(yàn)提取的10條最優(yōu)演化路徑,由于路徑包含大量演化節(jié)點(diǎn),表中僅展示了每一年演化路徑的演化起點(diǎn)和演化終點(diǎn)。例如,1990年演化起點(diǎn)包括“報(bào)紙媒體”、“大眾傳媒”、“廣告”、“數(shù)據(jù)庫(kù)”、“軟件”,演化終點(diǎn)包括“數(shù)據(jù)庫(kù)”、“廣告”、“大眾傳媒”、“軟件”、“電視信號(hào)”,由于中間節(jié)點(diǎn)的不同,這些起始節(jié)點(diǎn)總共組成了10條演化路徑。1991年演化起點(diǎn)包含5個(gè)節(jié)點(diǎn),演化終點(diǎn)包含4個(gè)節(jié)點(diǎn),其中“大眾傳播”和“電視信號(hào)”均演化為“遠(yuǎn)距離教學(xué)”,總路徑數(shù)為5條。直到2010年所有的演化路徑合并為一條,演化終點(diǎn)為“現(xiàn)代傳媒”。進(jìn)入“現(xiàn)代傳媒”時(shí)代之后,數(shù)字化技術(shù)開(kāi)始盛行,包括“數(shù)字廣播”、“數(shù)字影音”、“數(shù)字游戲”等,整個(gè)過(guò)程體現(xiàn)了從“傳統(tǒng)媒體”至“現(xiàn)代傳媒”的一條演化脈絡(luò)。10條演化路徑演化趨勢(shì)基本一致,表明了知識(shí)演化脈絡(luò)的可靠性。

為了更進(jìn)一步地分析演化的細(xì)節(jié),表4展示了1990—2016年一條具有代表性的完整的演化路徑。分析表4可知,數(shù)字媒體領(lǐng)域發(fā)展日新月異,新的事物新的概念不斷涌現(xiàn)。1990—1993年數(shù)字媒體領(lǐng)域主要以傳統(tǒng)媒體為主,包括電視、廣播、報(bào)紙等,并且將傳統(tǒng)媒體廣泛應(yīng)用于教育事業(yè),出現(xiàn)了關(guān)鍵詞“電化教學(xué)”、“教學(xué)媒體”、“遠(yuǎn)距離教育”等;1994年演化終點(diǎn)出現(xiàn)了關(guān)鍵詞“微軟”,這是推動(dòng)數(shù)字媒體領(lǐng)域發(fā)展最重要的企業(yè),這也標(biāo)志著計(jì)算機(jī)技術(shù)與數(shù)字媒體的融合。1995—2000年,計(jì)算機(jī)技術(shù)得到更廣泛的應(yīng)用,包括數(shù)字化處理、圖像處理等,同時(shí)“筆記本電腦”、“互聯(lián)網(wǎng)用戶(hù)”等關(guān)鍵詞的出現(xiàn)標(biāo)志著互聯(lián)網(wǎng)技術(shù)也越來(lái)越成熟;2000年開(kāi)始數(shù)字媒體正式進(jìn)入“數(shù)字時(shí)代”,“數(shù)字廣播”、“數(shù)字電視”、“數(shù)字音樂(lè)”、“數(shù)字信息”等大量出現(xiàn)在人們的視野中;2010年開(kāi)始,數(shù)字媒體領(lǐng)域呈現(xiàn)了多方趨勢(shì)。“游戲產(chǎn)業(yè)”、“網(wǎng)絡(luò)游戲”等關(guān)鍵詞體現(xiàn)了游戲行業(yè)的繁榮發(fā)展;“虛擬世界”、“互動(dòng)體驗(yàn)” “家庭影院”、“智能移動(dòng)終端”等關(guān)鍵詞體現(xiàn)了數(shù)字媒體的發(fā)展將越來(lái)越貼近人們的生活,標(biāo)志著生活智能化和藝術(shù)平民化時(shí)代的到來(lái)。路徑整體演化趨勢(shì)與10條路徑綜合演化的整體趨勢(shì)基本一致,進(jìn)一步表明演化脈絡(luò)的可靠性。

表4 一條完整的代表性數(shù)字媒體知識(shí)演化路徑

3 結(jié)束語(yǔ)

本文提出了一種基于時(shí)空域聯(lián)合建模的領(lǐng)域知識(shí)演化脈絡(luò)分析方法,并對(duì)1990—2016年間5 420篇數(shù)字媒體領(lǐng)域期刊文獻(xiàn)進(jìn)行了研究分析。首先,構(gòu)建了一個(gè)數(shù)字媒體領(lǐng)域的整體知識(shí)網(wǎng)絡(luò),從節(jié)點(diǎn)詞頻、節(jié)點(diǎn)度等分析領(lǐng)域的核心知識(shí)及知識(shí)結(jié)構(gòu)。進(jìn)而,構(gòu)建了一個(gè)時(shí)空域聯(lián)合知識(shí)網(wǎng)絡(luò),并根據(jù)骨架聚類(lèi)算法提取相應(yīng)年份的網(wǎng)絡(luò)骨架,連接形成連續(xù)年份的演化脈絡(luò),并根據(jù)獲取的演化脈絡(luò)對(duì)數(shù)字媒體領(lǐng)域的發(fā)展進(jìn)行深入分析。研究表明,數(shù)字媒體領(lǐng)域的發(fā)展可以概括為,從20世紀(jì)90年代初期的“電視”、“廣播”、“報(bào)紙”等傳統(tǒng)媒體到2000年正式進(jìn)入現(xiàn)代傳媒,各種傳統(tǒng)媒體都向數(shù)字化轉(zhuǎn)型,并由此又衍生出多個(gè)重點(diǎn)領(lǐng)域,包括“數(shù)字游戲”、“數(shù)字動(dòng)漫”、“數(shù)字影音”、“數(shù)字出版”、“數(shù)字學(xué)習(xí)”等。

綜合分析可知,本文方法是領(lǐng)域知識(shí)建模分析的一種新穎手段,不僅具備良好的技術(shù)參考價(jià)值,而且對(duì)個(gè)性化知識(shí)推薦與學(xué)習(xí)具有顯著實(shí)用價(jià)值。

[1]BODNER G M. Constructivism: a theory of knowledge [J]. Journal of chemical education, 1985, 63(10): 873-878.

[2]MCCOURT D M. Practice theory and relationalism as the new constructivism[J]. International studies quarterly, 2016, 60(3): 475-485.

[3]高俊平, 張暉, 趙旭劍, 等. 面向維基百科的領(lǐng)域知識(shí)演化關(guān)系抽[J]. 計(jì)算機(jī)學(xué)報(bào), 2016, 39(10):2088-2101.

GAO Junping, CHEN Hui, ZHAO Xujian. Evolutionary relation extraction for domain knowledge in Wikipedia[J]. Chinese journal of computers, 2016, 39(10): 2088-2101.

[4]馬費(fèi)成, 陳瀟俊, 劉向. 基于科學(xué)知識(shí)圖譜分析的知識(shí)演化研究—以生物醫(yī)學(xué)為例[J]. 情報(bào)科學(xué), 2012, 30(1):1-7.

MA Feicheng, CHEN Xiaojun, LIU Xiang. Study on the knowledge evolution based on mapping scientific domain—a case of the biomedicine field[J]. Information science, 2012, 30(1): 1-7.

[5]劉向, 馬費(fèi)成. 科學(xué)知識(shí)網(wǎng)絡(luò)的演化與動(dòng)力——基于科學(xué)引證網(wǎng)絡(luò)的分析[J]. 管理科學(xué)學(xué)報(bào), 2012, 15(1): 87-94.

LIU Xiang, MA Feicheng. Evolution and dynamics of scientific knowledge network: Based on the study of scientific citation network[J].Journal of management sciences in China, 2012, 15(1): 87-94.

[6]許琦, 馮羽靜. 一種基于專(zhuān)利引證網(wǎng)絡(luò)的知識(shí)流提取方法:隨機(jī)行走中的聚合效應(yīng)[J]. 情報(bào)理論與實(shí)踐, 2015, 38(12): 98-103.

XU Qi, FENG Yujing. A method of knowledge flow extraction based on patent citation network: aggregation effect in random walk[J]. Information theory and practice, 2015, 38(12): 98-103.

[7]黃瑋強(qiáng), 莊新田, 姚爽. 產(chǎn)業(yè)集群廣義創(chuàng)新合作網(wǎng)絡(luò)演化[J]. 東北大學(xué)學(xué)報(bào)自然科學(xué)版, 2012, 33(4): 592-596.

HUANG Weiqiang, ZHUANG Xintian, YAO Shuang. Evolution of generalized innovation network in industry clusters[J]. Journal of northeastern university:natural science, 2012, 33(4): 592-596.

[8]關(guān)世杰, 趙海. 互聯(lián)網(wǎng)技術(shù)領(lǐng)域科研合作網(wǎng)絡(luò)分析[J]. 東北大學(xué)學(xué)報(bào):自然科學(xué)版, 2013, 34(4): 509-511.

GUAN Shijie, ZHAO Hai. Analysis of scientific research cooperation network in internet technology[J]. Journal of northeastern university:natural science, 2013, 34(4): 509-511.

[9]陸浩, 王飛躍, 劉德榮, 等. 基于科研知識(shí)圖譜的近年國(guó)內(nèi)外自動(dòng)化學(xué)科發(fā)展綜述[J]. 自動(dòng)化學(xué)報(bào), 2014, 40(5): 994-1015.

LU Hao, WANG Feiyue, LIU Derong, et al. A summary of development of automation discipline at home and abroad in recent years based on scientific research knowledge[J]. Acta automatica sinica, 2014, 40(5): 994-1015.

[10]張斌. 共詞網(wǎng)絡(luò)的結(jié)構(gòu)與演化:概念與理論進(jìn)展[J]. 情報(bào)雜志, 2014, 33(7):103-109.

ZHANG Bin. The structure and evolution of co-word networks: concept and theoretical progress[J]. Journal of intelligence, 2014, 33(7): 103-109.

[11]張豪鋒, 李海龍. 我國(guó)教育技術(shù)學(xué)研究前沿探討——基于核心期刊關(guān)鍵詞的共詞網(wǎng)絡(luò)與聚類(lèi)分析[J]. 電化教育研究, 2011(10): 26-29.

ZHANG Haofeng, LI Hailong. Frontier study of educational technology research in China-Co-word network and cluster analysis based on keywords in core journals[J]. Eeducation research, 2011(10): 26-29.

[12]吳建南, 鄭燁, 張攀,等. 基于共詞網(wǎng)絡(luò)分析的國(guó)內(nèi)創(chuàng)新驅(qū)動(dòng)研究熱點(diǎn)與趨勢(shì)[J]. 中國(guó)科技論壇, 2014(6):17-23.

WU Jiannan, ZHENG Ye, ZHANG Pan, et al. Research focus and trend of domestic innovation driven research based on co-word network analysis[J]. China science and technology forum, 2014(6): 17-23.

[13]宗瑜, 李明楚, 江賀. 近似骨架導(dǎo)向的歸約聚類(lèi)算法[J]. 電子與信息學(xué)報(bào), 2009, 31(12): 2953-2957.

ZONG Yu, LI Mingchu, JIANG He. Approximation of skeleton-oriented reduction clustering algorithm[J]. Journal of electronics and information technology, 2009, 31(12): 2953-2957.

[14]金萍, 宗瑜, 屈世超,等. 面向不確定數(shù)據(jù)的近似骨架啟發(fā)式聚類(lèi)算法[J]. 南京大學(xué)學(xué)報(bào)自然科學(xué), 2015, 51(1): 197-205.

JIN Ping, ZONG Yu, QU Shichao, et al. Approximate skeleton heuristic clustering algorithm for uncertain data[J]. Journal of Nanjing university:natural sciences, 2015, 51(1): 197-205.

[15]LU Z, SUN X, WEN Y, et al. Skeleton construction in mobile social networks: algorithms and applications[C]//Eleventh IEEE International Conference on Sensing, Communication, and Networking. Singapore, Singapore, 2014: 477-485.

[16]劉向, 馬費(fèi)成, 王曉光. 知識(shí)網(wǎng)絡(luò)的結(jié)構(gòu)及過(guò)程模型[J]. 系統(tǒng)工程理論與實(shí)踐, 2013, 33(7): 1836-1844.

LIU Xiang, MA Feicheng, WANG Xiaoguang. The structure and process model of knowledge network[J]. System engineering theory and practice, 2013, 33(7):1836-1844.

[17]馬費(fèi)成, 劉向. 科學(xué)知識(shí)網(wǎng)絡(luò)的演化模型[J]. 系統(tǒng)工程理論與實(shí)踐, 2013, 33(2): 437-443.

MA Feicheng, LIU Xiang. Evolution model of scientific knowledge network[J]. System engineering theory and practice, 2013, 33(2): 437-443.

[18]劉向,馬費(fèi)成,陳瀟俊,等. 知識(shí)網(wǎng)絡(luò)的結(jié)構(gòu)與演化——概念與理論進(jìn)展[J]. 情報(bào)科學(xué),2011(06): 801-809.

LIU Xiang, MA Feicheng, CHEN Xiaojun, et al. The structure and evolution of knowledge network-concept and theory progress[J]. Information science, 2011(06): 801-809.

[19]PFEIFFER J J, MORENO S, FOND T L, et al. Attributed graph models: modeling network structure with correlated attributes[C]//The International World Wide Web Conference. Seoul, Korea, 2014: 831-842.

[20]CHOI J, YI S, LEE K C. Analysis of keyword networks in MIS research and implications for predicting knowledge evolution[J]. Information and management, 2011, 48(8):371-381.

[21]袁勁松, 張小明, 李舟軍. 術(shù)語(yǔ)自動(dòng)抽取方法研究綜述[J]. 計(jì)算機(jī)科學(xué), 2015, 42(8): 7-12.

YUAN Jinsong, ZHANG Xiaoming, LI Zhoujun. A summary of the study on automatic extraction of terminology[J]. Computer science, 2015, 42(8): 7-12.

[22]GUAN A, WANG Y, YANG L. Automatic term extraction for chinese opera domain ontology[C]//International Conference on Fuzzy Systems and Knowledge Discovery. Zhangjiajie, China, 2015: 1372-1376.

[23]TAO L, WANG X L, GUAN Y, et al. Domain-specific term extraction and its application in text classification[J]. Acta electronica sinica, 2007, 35(2): 328-332.

[24]MTC Castellví, RE Bagot, JV Palatresi. Automatic term detection: a review of current systems[J]. Recent advances in computational terminology, 2008, 52(1): 53-88.

[25]黃勛, 游宏梁, 于洋. 關(guān)系抽取技術(shù)研究綜述[J]. 現(xiàn)代圖書(shū)情報(bào)技術(shù),2013, 29(11): 30-39.

HUANG Xun, YOU Hongliang, YU Yang. A summary of research on relational extraction technology[J]. New technology of library and information service, 2013, 29(11): 30-39.

[26]DEY L, ABULAISH M, SHARMA G. Text Mining through Entity-Relationship Based Information Extraction[C]//International Conferences on Web Intelligence and Intelligent Agent Technology-Workshops. Silicon Valley, USA, 2007:177-180.

金晨,男,1991年生,碩士研究生,主要研究方向?yàn)槿斯ぶ悄?、機(jī)器學(xué)習(xí)、知識(shí)網(wǎng)絡(luò)。

謝振平,男,1979年生,副教授,CCF會(huì)員,博士,主要研究方向?yàn)檠莼J(rèn)知、知識(shí)網(wǎng)絡(luò)、機(jī)器視覺(jué)。

任立園,女,1990年生,碩士研究生,主要研究方向?yàn)闄C(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘。

Evolutionarypathminingofdomainknowledgebyjointmodelinginspace-timedomain

JIN Chen, XIE Zhenping, REN Liyuan, LIU Yuan

(1. School of Digital Media, Jiangnan University, Wuxi 214122, China; 2. Jiangsu Key Laboratory of Media Design and Software Technology, Wuxi 214122, China)

In special technology fields, there might be evolutionary relationships between various knowledge concepts, and these evolutionary relationship can be used to depict the developmental venation of the corresponding technology field. However, the characteristics of fragmentation, disorder, and large scale in domain knowledge systems make it difficult for users to accurately identify these knowledge relationships. To address this problem, in this paper, we propose an evolutionary path mining method based on skeleton clustering and the joint modeling of domain knowledge with respect to the space-time correlation. In this method, first we express the knowledge system as a knowledge network with joint space-time correlations, then we adopt the skeleton clustering method to extract the evolutionary path of the knowledge network. In addition, we analyze the connection between the evolutionary paths based on the development of the knowledge concept. An experimental analysis of the digital media domain shows that the proposed method can effectively extract the evolutionary path of domain knowledge, which has significant value for knowledge learning and personalized recommendation.

knowledge evolution; evolution path; knowledge network; knowledge systems; space-time domain combination; skeleton clustering; digital media knowledge

10.11992/tis.201706023

http://kns.cnki.net/kcms/detail/23.1538.TP.20170831.1058.012.html

TP181

A

1673-4785(2017)05-0735-10

中文引用格式:金晨,謝振平,任立園,等.基于時(shí)空域聯(lián)合建模的領(lǐng)域知識(shí)演化脈絡(luò)分析J.智能系統(tǒng)學(xué)報(bào), 2017, 12(5): 735-744.

英文引用格式:JINChen,XIEZhenping,RENLiyuan,etal.Evolutionarypathminingofdomainknowledgebyjointmodelinginspace-timecorrelationJ.CAAItransactionsonintelligentsystems, 2017, 12(5): 735-744.

2017-06-07. < class="emphasis_bold">網(wǎng)絡(luò)出版日期

日期:2017-08-31.

江蘇省自然科學(xué)基金項(xiàng)目(BK20130161); 國(guó)家自然科學(xué)基金項(xiàng)目(61572236);國(guó)家科技支撐計(jì)劃項(xiàng)目(2015BAH54F01).

謝振平.E-mail :xiezhenping@hotmail.com.

猜你喜歡
骨架聚類(lèi)領(lǐng)域
電子戰(zhàn)領(lǐng)域的爭(zhēng)鋒
電子樂(lè)園·上旬刊(2022年5期)2022-04-09
將現(xiàn)代科技應(yīng)用于Hi-Fi領(lǐng)域 Perlisten S7tse
骨架密度對(duì)炭/炭多孔骨架壓力浸滲銅的影響
2020 IT領(lǐng)域大事記
基于K-means聚類(lèi)的車(chē)-地?zé)o線通信場(chǎng)強(qiáng)研究
領(lǐng)域·對(duì)峙
周博士考察拾零(六十六)日光溫室前屋面開(kāi)機(jī)具作業(yè)門(mén)處骨架的處理方法
基于高斯混合聚類(lèi)的陣列干涉SAR三維成像
博澤引領(lǐng)座椅骨架技術(shù)發(fā)展