,
自然界許多科學(xué)問題和現(xiàn)象都可以抽象成網(wǎng)絡(luò)形式進(jìn)行分析研究。節(jié)點(diǎn)代表不同個體,節(jié)點(diǎn)之間的連邊代表個體之間的關(guān)系。已有許多科學(xué)領(lǐng)域運(yùn)用復(fù)雜網(wǎng)絡(luò)分析的方法對本領(lǐng)域未知的現(xiàn)象進(jìn)行探索分析。在情報學(xué)領(lǐng)域,研究者將期刊、文獻(xiàn)、著者、研究機(jī)構(gòu),甚至是關(guān)鍵詞抽象為節(jié)點(diǎn),將它們之間的關(guān)系,如引用關(guān)系、耦合關(guān)系或共現(xiàn)關(guān)系抽象成連邊,從不同粒度構(gòu)建網(wǎng)絡(luò)進(jìn)行分析研究,以求發(fā)現(xiàn)文獻(xiàn)相關(guān)網(wǎng)絡(luò)中潛在的、未被發(fā)現(xiàn)的規(guī)律,或根據(jù)對這些網(wǎng)絡(luò)的節(jié)點(diǎn)屬性的分析,發(fā)現(xiàn)重要的期刊、文獻(xiàn)、著者等,或用已構(gòu)建的網(wǎng)絡(luò)對未來的情形進(jìn)行預(yù)測等。情報學(xué)領(lǐng)域分析較多的網(wǎng)絡(luò)主要為引用網(wǎng)絡(luò)、合著網(wǎng)絡(luò)和共詞網(wǎng)絡(luò)。
本文將從這三方面分別介紹當(dāng)前情報學(xué)領(lǐng)域利用網(wǎng)絡(luò)屬性分析方法對文獻(xiàn)相關(guān)網(wǎng)絡(luò)進(jìn)行分析、應(yīng)用的研究進(jìn)展,并認(rèn)為可以對論文相似性網(wǎng)絡(luò)的屬性進(jìn)行分析,從網(wǎng)絡(luò)的視角對新的論文評價指標(biāo)進(jìn)行探索。
引用網(wǎng)絡(luò)是情報學(xué)領(lǐng)域最早開始研究的一類文獻(xiàn)相關(guān)網(wǎng)絡(luò)。早在1955年,Garfield[1]就提出可以通過引用關(guān)系連接起來的科學(xué)產(chǎn)品表示科學(xué)事件,由此研究科學(xué)活動的規(guī)律。1965年,D.S.Price[2]借助科學(xué)引文索引1961年的實驗版,繪制出了帶有引文間聯(lián)系的網(wǎng)絡(luò)。此后,有越來越多的研究者在不同粒度層面,根據(jù)不同引用關(guān)系,如直接引用、同被引、引文耦合建立引用網(wǎng)絡(luò),對其進(jìn)行了大量屬性研究,并取得了一定成果。
與文獻(xiàn)有關(guān)的網(wǎng)絡(luò)研究中,最早的是荷蘭科學(xué)家Leydesdorff開展的期刊層面的引用網(wǎng)絡(luò)研究。他利用Journal Citation Reports(JCR)中期刊引用數(shù)據(jù)構(gòu)建期刊相互引用網(wǎng)絡(luò),通過網(wǎng)絡(luò)結(jié)構(gòu)特征和節(jié)點(diǎn)屬性結(jié)合期刊的被引次數(shù)和引用次數(shù),開展期刊評價指標(biāo)構(gòu)建研究。最終,Leydesdorff[3]利用圖論中兩連通成分關(guān)節(jié)點(diǎn)算法,成功地對科學(xué)期刊進(jìn)行了聚類和可視化,顯示出了每種期刊集合中的邊緣和核心結(jié)構(gòu)。
隨著社會網(wǎng)絡(luò)分析方法的廣泛應(yīng)用,Leydesdorff[4]又對期刊引用網(wǎng)絡(luò)的點(diǎn)度中心度、接近中心度和中間中心度等指標(biāo)進(jìn)行分析,發(fā)現(xiàn)中間中心度可作為衡量期刊的跨學(xué)科指標(biāo)。隨后,為了研究跨學(xué)科領(lǐng)域期刊在引用網(wǎng)絡(luò)所處位置的特點(diǎn),Leydesdorff[5]利用SCI和SSCI中2004年的數(shù)據(jù)構(gòu)建期刊層面的引用網(wǎng)絡(luò),再次驗證了節(jié)點(diǎn)的中間中心度可以用來衡量期刊的跨學(xué)科特性。
在期刊層面構(gòu)建引用網(wǎng)絡(luò)并對其進(jìn)行分析的中國學(xué)者主要有岳洪江和劉思峰[6],他們用管理學(xué)的29種經(jīng)典期刊構(gòu)建同被引網(wǎng)絡(luò),分析該網(wǎng)絡(luò)的密度、中心性、K核、中心——邊緣結(jié)構(gòu),發(fā)現(xiàn)管理學(xué)期刊可以歸為四類,每一類都是通過某種期刊與其他類的期刊相聯(lián)系。由此可見,對期刊構(gòu)建引用網(wǎng)絡(luò),可以用來對期刊進(jìn)行聚類分析,并可根據(jù)節(jié)點(diǎn)屬性構(gòu)建期刊評價指標(biāo)。
期刊層面的引用網(wǎng)絡(luò)雖在一定程度上對期刊聚類和評價有指導(dǎo)意義,但并不能反映某一學(xué)科領(lǐng)域具體文獻(xiàn)的引用地位。所以有很多研究者選擇用文獻(xiàn)構(gòu)建引用網(wǎng)絡(luò),從細(xì)粒度層面對某一學(xué)科領(lǐng)域知識網(wǎng)絡(luò)進(jìn)行分析研究。
在文獻(xiàn)層面構(gòu)建引用網(wǎng)絡(luò),較為基礎(chǔ)的研究主要集中在對網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn)和節(jié)點(diǎn)屬性的分析。例如林德明和陳超美等人[7]以《科學(xué)計量學(xué)》中的文獻(xiàn)為數(shù)據(jù)源,建立共被引網(wǎng)絡(luò),分析了該網(wǎng)絡(luò)的度分布、中間中心度分布等,發(fā)現(xiàn)其具有小世界和無標(biāo)度的復(fù)雜網(wǎng)絡(luò)特性,中間中心度分布符合Zipf-Pareto分布;呂鵬輝和張士靖[8]等人利用近110多年來圖書館與情報學(xué)領(lǐng)域85種國際權(quán)威期刊的文獻(xiàn)構(gòu)建引文網(wǎng)絡(luò),根據(jù)節(jié)點(diǎn)中心性指標(biāo),分析了網(wǎng)絡(luò)中的關(guān)鍵文獻(xiàn),并且發(fā)現(xiàn)該引文網(wǎng)絡(luò)的入度有無標(biāo)度特性等。這些研究關(guān)注的是網(wǎng)絡(luò)的靜態(tài)拓?fù)浣Y(jié)構(gòu)特點(diǎn),而引用網(wǎng)絡(luò)的最大特點(diǎn)在于其結(jié)構(gòu)會隨時間不斷變化。研究知識網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn)及演化規(guī)律是厘清知識發(fā)展脈絡(luò)、探測和追蹤創(chuàng)新領(lǐng)域及發(fā)展趨勢的基礎(chǔ)。所以馬費(fèi)成和劉向[9-12]根據(jù)引文網(wǎng)絡(luò)(無環(huán)有向網(wǎng)絡(luò)),利用BA網(wǎng)絡(luò)模型的形成機(jī)制,構(gòu)建了科學(xué)知識演化模型,對科學(xué)知識網(wǎng)絡(luò)的演化和動力學(xué)機(jī)制進(jìn)行了研究。之后,馬費(fèi)成和陳瀟俊等[13]又構(gòu)建了生物醫(yī)學(xué)領(lǐng)域的引文網(wǎng)絡(luò),著重分析了網(wǎng)絡(luò)的主題聚類、關(guān)鍵路徑并識別了網(wǎng)絡(luò)中的權(quán)威和核心文獻(xiàn),為科學(xué)知識的演化與發(fā)展提供了一個較好的理解。
隨著對引文網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn)、節(jié)點(diǎn)屬性和演化規(guī)律認(rèn)識的加深,越來越多的學(xué)者開始嘗試?yán)靡褬?gòu)建的引文網(wǎng)絡(luò),根據(jù)網(wǎng)絡(luò)的結(jié)構(gòu)特征和節(jié)點(diǎn)屬性,對文獻(xiàn)進(jìn)行評價、探測新型知識類團(tuán),甚至對未來的引用行為進(jìn)行預(yù)測,較為突出的主要有日本學(xué)者Naoki Shibata 等人。2007年,Naoki Shibata[14]等人根據(jù)引文網(wǎng)絡(luò)節(jié)點(diǎn)的聚集中心性、接近中心度和中間中心度指標(biāo),調(diào)查一篇學(xué)術(shù)論文將來被引用的影響因素。相關(guān)性分析顯示,被引次數(shù)和節(jié)點(diǎn)的中間中心度指標(biāo)是影響論文未來被引次數(shù)的主要因素。2008年,Naoki Shibata等人[15]分別對氮化鎵領(lǐng)域和復(fù)雜網(wǎng)絡(luò)領(lǐng)域的文獻(xiàn)構(gòu)建引用網(wǎng)絡(luò),使用網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)測量指標(biāo)類內(nèi)節(jié)點(diǎn)度數(shù)和節(jié)點(diǎn)參與系數(shù),成功探測到一個研究領(lǐng)域是否有新的知識類團(tuán)出現(xiàn),并根據(jù)新知識產(chǎn)生后,引文網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)改變的不同,將研究領(lǐng)域分為漸進(jìn)式創(chuàng)新領(lǐng)域和分支式創(chuàng)新領(lǐng)域。2012年,Naoki Shibata等人[16]根據(jù)引文網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)特征,如節(jié)點(diǎn)的中間中心度、節(jié)點(diǎn)的共同鄰居、基于鏈接的jaccard系數(shù)等,以及文獻(xiàn)本身的語義特征和屬性特征(如被引頻次、自引)等,對引文網(wǎng)絡(luò)的節(jié)點(diǎn)之間的鏈接進(jìn)行了預(yù)測。
合著網(wǎng)絡(luò)研究通過作者之間或不同機(jī)構(gòu)之間的合著關(guān)系構(gòu)建合著網(wǎng)絡(luò),以求發(fā)現(xiàn)合著活動中潛在的規(guī)律。對合著網(wǎng)絡(luò)的研究,也是經(jīng)歷了一個由淺入深,由起初對網(wǎng)絡(luò)的結(jié)構(gòu)特征和屬性的基本認(rèn)識到利用合著網(wǎng)絡(luò)構(gòu)建評價科研人員的指標(biāo),甚至對未來合著行為進(jìn)行預(yù)測的過程。
2002年,Barabási等[17]利用數(shù)學(xué)和神經(jīng)科學(xué)領(lǐng)域8年的文獻(xiàn)數(shù)據(jù),分別構(gòu)建了其對應(yīng)的作者合著網(wǎng)絡(luò),對網(wǎng)絡(luò)的小世界和無標(biāo)度特性進(jìn)行了分析研究,發(fā)現(xiàn)作者合著網(wǎng)絡(luò)的演化符合無標(biāo)度網(wǎng)絡(luò)的大度節(jié)點(diǎn)“偏好依附”的特點(diǎn)。2004年,Newman[18]分別對生物學(xué)、物理學(xué)和數(shù)學(xué)領(lǐng)域構(gòu)建作者合著網(wǎng)絡(luò),并分析網(wǎng)絡(luò)的平均距離、聚集系數(shù)等屬性以及網(wǎng)絡(luò)的演化規(guī)律,發(fā)現(xiàn)不同領(lǐng)域的作者合著網(wǎng)絡(luò)的結(jié)構(gòu)不同,生物學(xué)領(lǐng)域的合著現(xiàn)象較其他兩個學(xué)科多。榮先乾等[19]構(gòu)建圖書情報領(lǐng)域作者合著網(wǎng)絡(luò),分析了該網(wǎng)絡(luò)的一系列屬性,如節(jié)點(diǎn)的平均度值、最大連通子圖的直徑、網(wǎng)絡(luò)的平均距離,并把這些參數(shù)值與國外圖書情報領(lǐng)域合著網(wǎng)絡(luò)進(jìn)行比較,發(fā)現(xiàn)國內(nèi)圖情領(lǐng)域合著強(qiáng)度不大,獨(dú)立發(fā)文的作者比較多。呂鵬輝等[20]對國內(nèi)外圖書情報領(lǐng)域的3種合作網(wǎng)絡(luò):作者合著網(wǎng)絡(luò)、機(jī)構(gòu)合作網(wǎng)絡(luò)和國家合著網(wǎng)絡(luò)的網(wǎng)絡(luò)屬性進(jìn)行了比較,發(fā)現(xiàn)作者合著網(wǎng)絡(luò)是非連通的稀疏網(wǎng)絡(luò),作者之間形成了多個研究社團(tuán);而機(jī)構(gòu)和國家合作網(wǎng)絡(luò)的平均距離較短,密度和聚集系數(shù)較高。這些研究都是對合著網(wǎng)絡(luò)結(jié)構(gòu)特征的分析和比較研究,顯示了合著網(wǎng)絡(luò)具有復(fù)雜網(wǎng)絡(luò)的特征。
不同學(xué)科領(lǐng)域、從不同粒度構(gòu)建的合著網(wǎng)絡(luò)、甚至不同國家的合著網(wǎng)絡(luò)結(jié)構(gòu)不同,提示對合著網(wǎng)絡(luò)結(jié)構(gòu)特征的研究可以揭示合著行為的特點(diǎn),這為政策制定者對國家、地區(qū)、高校、機(jī)構(gòu)以及科學(xué)家之間的科研合作行為的宏觀把控有一定的指導(dǎo)意義。
合著網(wǎng)絡(luò)的第一類應(yīng)用研究是根據(jù)合著網(wǎng)絡(luò)網(wǎng)絡(luò)的節(jié)點(diǎn)屬性和結(jié)構(gòu)特征,聯(lián)合復(fù)雜網(wǎng)絡(luò)中重要節(jié)點(diǎn)的評價方法,對合著網(wǎng)絡(luò)中核心科研人員的分析研究。這些研究首先是對節(jié)點(diǎn)中心性指標(biāo)和作者科研績效的相關(guān)度進(jìn)行初步探索。如欒春娟等[21]對2006年世界數(shù)字信息傳輸技術(shù)領(lǐng)域27 572項基本專利的33 480位發(fā)明者合作狀況進(jìn)行計量分析,繪制高產(chǎn)發(fā)明者的合作網(wǎng)絡(luò),通過對網(wǎng)絡(luò)節(jié)點(diǎn)的屬性分析,發(fā)現(xiàn)高產(chǎn)發(fā)明者科研績效與其在合作網(wǎng)中的度值呈明顯正相關(guān)性;Erjia Yan等[22]利用2002-2007年中國圖書情報學(xué)的18種核心期刊的文獻(xiàn),構(gòu)建了作者合著網(wǎng)絡(luò),發(fā)現(xiàn)該網(wǎng)絡(luò)具有復(fù)雜網(wǎng)絡(luò)無標(biāo)度和小世界特性,并對網(wǎng)絡(luò)節(jié)點(diǎn)的中心性指標(biāo)和作者被引頻次相關(guān)性進(jìn)行統(tǒng)計分析,發(fā)現(xiàn)節(jié)點(diǎn)的中心型指標(biāo)和作者的被引頻次高度相關(guān)。
第二類應(yīng)用研究是借鑒了復(fù)雜網(wǎng)絡(luò)中重要節(jié)點(diǎn)評價方法,配合網(wǎng)絡(luò)分析法,構(gòu)建了科研人員評價的新指標(biāo)。如肖連杰等[23]在構(gòu)建科研合作網(wǎng)絡(luò)時,同時考慮節(jié)點(diǎn)和邊的信息,為節(jié)點(diǎn)和邊賦予一定的權(quán)值,將點(diǎn)權(quán)和邊權(quán)相加,用于評價科研合作網(wǎng)絡(luò)中節(jié)點(diǎn)的重要性,且該方法可以識別科研機(jī)構(gòu)的核心人才,對人才流失管理有一定指導(dǎo)意義;Liu XM等[24]用ACM/IEEE的數(shù)據(jù),構(gòu)建了無向無權(quán)作者合著網(wǎng)絡(luò)和有向加權(quán)作者合著網(wǎng)絡(luò),分析了網(wǎng)絡(luò)節(jié)點(diǎn)的中心性指標(biāo),并根據(jù)PageRank指標(biāo)定義了一個新指標(biāo)AuthorRank,與PageRange指標(biāo)相比,AuthourRank考慮節(jié)點(diǎn)之間連邊的權(quán)值,且AuthorRank比節(jié)點(diǎn)中心性指標(biāo)在尋找網(wǎng)絡(luò)中重要著者方面更有優(yōu)勢;Li XL等[25]則根據(jù)有向加權(quán)合著網(wǎng)絡(luò),構(gòu)建了一種可以識別出研究團(tuán)體中后起之秀的指標(biāo)PubRank。PubRank也是借鑒了PageRank指標(biāo)的構(gòu)建思想,但與AuthorRank相比,該指標(biāo)不但考慮了邊的權(quán)值,還根據(jù)科研人員的科研能力為節(jié)點(diǎn)賦予了權(quán)值,且大量實驗證明,該指標(biāo)可以有效識別出合著網(wǎng)絡(luò)中之后表現(xiàn)優(yōu)異的研究人員。
第三類應(yīng)用研究側(cè)重于利用網(wǎng)絡(luò)的凝聚子群分析法探測科研合著網(wǎng)絡(luò)中的不同科研團(tuán)體。如候海燕等[26]根據(jù)Scientometrics 1987-2004年的文獻(xiàn)數(shù)據(jù),建立了作者合著網(wǎng)絡(luò),分析了網(wǎng)絡(luò)的密度、節(jié)點(diǎn)中心性指標(biāo),并結(jié)合聚類分析法與詞頻分析法,用于發(fā)現(xiàn)作者合著的小團(tuán)體、中心團(tuán)體以及大學(xué)科下的子領(lǐng)域;李亮等[27]對《情報學(xué)報》的作者構(gòu)建了合著網(wǎng)絡(luò),分析了網(wǎng)絡(luò)的節(jié)點(diǎn)中心性、凝聚子群以及核心——邊緣結(jié)構(gòu),借此評價作者在合著關(guān)系中的地位,并發(fā)現(xiàn)了合著網(wǎng)絡(luò)中關(guān)系緊密的團(tuán)體。以上研究都顯示,研究者并未將研究局限在對網(wǎng)絡(luò)基本結(jié)構(gòu)屬性的分析上,而是將網(wǎng)絡(luò)分析的方法應(yīng)用于節(jié)點(diǎn)即作者評價指標(biāo)的構(gòu)建,從構(gòu)建網(wǎng)絡(luò)的角度解決一些利用其他方法不能得到最優(yōu)解的問題。
此外,還有一類較為高級的應(yīng)用研究,即利用合著網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)的方法,對未來的合著行為進(jìn)行了預(yù)測。如Pavlov等[28]根據(jù)合著網(wǎng)絡(luò)利用監(jiān)督式機(jī)器學(xué)習(xí)方法對還未出現(xiàn)的合作關(guān)系進(jìn)行了預(yù)測,他們的預(yù)測模型有較高的精確性,可以輔助構(gòu)建和維持良好的合作關(guān)系;于琦等人[29]使用監(jiān)督式機(jī)器學(xué)習(xí)的方法,利用生物醫(yī)學(xué)領(lǐng)域的合著網(wǎng)絡(luò)中的拓?fù)浣Y(jié)構(gòu)特征建立鏈接預(yù)測模型,該模型可以預(yù)測尚未實現(xiàn)的潛在的合作關(guān)系。這類研究為國家的科研管理決策提供了一定的參考依據(jù)。
相比以上兩種網(wǎng)絡(luò),詞共現(xiàn)網(wǎng)絡(luò)(共詞網(wǎng)絡(luò))是一種分析粒度更小的網(wǎng)絡(luò)??梢哉f共詞網(wǎng)絡(luò)是共詞矩陣通過網(wǎng)絡(luò)構(gòu)建方法抽象出的一種網(wǎng)絡(luò),它是整個共詞分析方法體系中的一種類型,偏向于從宏觀角度描述由關(guān)鍵詞表征的科學(xué)知識發(fā)展過程[30]。研究者利用文獻(xiàn)關(guān)鍵詞在文獻(xiàn)中的共現(xiàn)關(guān)系構(gòu)建網(wǎng)絡(luò),主要研究方向分為以下兩類。
一類是對共詞網(wǎng)絡(luò)本身的結(jié)構(gòu)特點(diǎn)和演化規(guī)律的研究。如王曉光[31-32]為了從微觀層面科學(xué)知識網(wǎng)絡(luò)的形成和演化機(jī)理,使用中國管理學(xué)領(lǐng)域5種核心期刊的關(guān)鍵詞數(shù)據(jù)構(gòu)建了共詞網(wǎng)絡(luò),并對該網(wǎng)絡(luò)的密度、聚集系數(shù)、平均距離等網(wǎng)絡(luò)屬性進(jìn)行了計算,發(fā)現(xiàn)該網(wǎng)絡(luò)具有無標(biāo)度和小世界特性,且共詞網(wǎng)絡(luò)的演化符合BA模型,新增節(jié)點(diǎn)傾向于與度值大的節(jié)點(diǎn)相連。
另一類則是對共詞網(wǎng)絡(luò)的應(yīng)用研究,這類研究通過對共詞網(wǎng)絡(luò)結(jié)構(gòu)特征的研究,以求發(fā)現(xiàn)某一學(xué)科領(lǐng)域的知識結(jié)構(gòu)特點(diǎn)、研究前沿等。如魏瑞端[33]利用《情報學(xué)報》和《中國圖書館學(xué)報》中的文獻(xiàn)數(shù)據(jù),構(gòu)建共詞網(wǎng)絡(luò),根據(jù)節(jié)點(diǎn)中心度指標(biāo),判斷學(xué)術(shù)期刊的發(fā)文熱點(diǎn),并根據(jù)共詞網(wǎng)絡(luò)圖比較同一期刊不同時期或不同期刊同一時期研究內(nèi)容的主題結(jié)構(gòu)及其變化情況;劉則淵等[34]利用科學(xué)學(xué)領(lǐng)域中6種主要期刊所收錄的1995-2004年間的所有文獻(xiàn)的關(guān)鍵詞數(shù)據(jù),構(gòu)建共詞網(wǎng)絡(luò)并分析該網(wǎng)絡(luò)的k-core,展示了關(guān)鍵詞的強(qiáng)連接層次,發(fā)現(xiàn)了科學(xué)學(xué)的研究主題和若干研究熱點(diǎn)、并對未來研究方向進(jìn)行了預(yù)測;趙一鳴等[35]根據(jù)1990-2012年圖書館與情報學(xué)領(lǐng)域高頻關(guān)鍵詞構(gòu)建共詞網(wǎng)絡(luò),通過對該共詞網(wǎng)絡(luò)結(jié)構(gòu)屬性的分析,得出了當(dāng)前圖書館與情報學(xué)的研究熱點(diǎn)和演進(jìn)趨勢。
從構(gòu)建網(wǎng)絡(luò)的方法來看,可以根據(jù)不同研究目的構(gòu)建不同網(wǎng)絡(luò)。在進(jìn)行網(wǎng)絡(luò)分析時,研究者一般會根據(jù)研究目的并結(jié)合研究對象的實際特征構(gòu)建相應(yīng)的網(wǎng)絡(luò)。例如,如果研究對象抽象出的節(jié)點(diǎn)之間有信息交流,且信息流動的方法對研究有重要意義,則可以考慮構(gòu)建有向網(wǎng)絡(luò);如果節(jié)點(diǎn)之間的關(guān)系有強(qiáng)弱之分,且這種強(qiáng)弱關(guān)系是研究所關(guān)注的重點(diǎn),則可構(gòu)建加權(quán)網(wǎng)絡(luò)對其進(jìn)行分析。對于引用網(wǎng)絡(luò)的研究,在分析網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn)和演化過程時,可以不考慮邊的權(quán)值,而只考慮連線的方向,構(gòu)建有向無權(quán)網(wǎng)絡(luò)進(jìn)行分析研究。而當(dāng)需要根據(jù)引用網(wǎng)絡(luò)對期刊、文獻(xiàn)的特征進(jìn)行分析時,則可以將期刊或文獻(xiàn)的引用次數(shù)和被引次數(shù)等實際指標(biāo)作為節(jié)點(diǎn)或者邊的權(quán)值進(jìn)行研究。對于合著網(wǎng)絡(luò),雖然合作關(guān)系是相互的,沒有方向的區(qū)別,但在合著網(wǎng)絡(luò)中重要節(jié)點(diǎn)評價的研究中,為了適應(yīng)復(fù)雜網(wǎng)絡(luò)中重要節(jié)點(diǎn)的評價指標(biāo),也可以將無向網(wǎng)絡(luò)當(dāng)做有向網(wǎng)絡(luò)進(jìn)行分析。
此外,也有許多研究者考慮科研人員的科研績效及其在合作關(guān)系中的貢獻(xiàn)大小等,將這些實際指標(biāo)作為合著網(wǎng)絡(luò)中節(jié)點(diǎn)和邊的權(quán)值,構(gòu)建加權(quán)網(wǎng)絡(luò)對合作活動進(jìn)行分析,對科研人員進(jìn)行評價。由于共詞網(wǎng)絡(luò)是從詞共現(xiàn)矩陣抽象得來的,許多研究是通過構(gòu)建無向加權(quán)或無向無權(quán)網(wǎng)絡(luò)對其進(jìn)行分析。對網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)進(jìn)行研究時,也有研究者將共詞網(wǎng)絡(luò)改造成有向網(wǎng)絡(luò),用于進(jìn)一步揭示科學(xué)知識發(fā)展變遷的規(guī)律。由此可見,應(yīng)根據(jù)不同分析目的,構(gòu)建相應(yīng)的網(wǎng)絡(luò)對文獻(xiàn)相關(guān)網(wǎng)絡(luò)進(jìn)行分析研究。
從網(wǎng)絡(luò)中節(jié)點(diǎn)的屬性來看,可以使用不同的粒度,如期刊、作者、文章和關(guān)鍵詞構(gòu)建網(wǎng)絡(luò)。以上文獻(xiàn)相關(guān)網(wǎng)絡(luò)或者是從合著機(jī)構(gòu)、合著者或期刊等較大的粒度構(gòu)建網(wǎng)絡(luò),對網(wǎng)絡(luò)的基本屬性進(jìn)行分析以發(fā)現(xiàn)文獻(xiàn)相關(guān)網(wǎng)絡(luò)的演化規(guī)律或核心節(jié)點(diǎn)等,或者是從文章關(guān)鍵詞這樣較小的粒度構(gòu)建網(wǎng)絡(luò),用以分析某一學(xué)科領(lǐng)域的知識結(jié)構(gòu)特點(diǎn)或用于探索研究前沿等。
已有研究中,從文獻(xiàn)角度構(gòu)建的網(wǎng)絡(luò)主要為引文網(wǎng)絡(luò),節(jié)點(diǎn)之間的連線代表的是文獻(xiàn)之間的引用關(guān)系(直接引用、同被引、引文耦合)。引用關(guān)系是根據(jù)論文作者的主觀意志而使文獻(xiàn)之間能相互聯(lián)系,雖然可以反映節(jié)點(diǎn)間的信息交流,并在一定程度上用于分析知識結(jié)構(gòu)的演化規(guī)律或研究熱點(diǎn)等,但并不能從客觀角度反映論文內(nèi)容之間的實際關(guān)系。因此,如果在文獻(xiàn)層面,能夠根據(jù)文獻(xiàn)本身的內(nèi)容特征,構(gòu)建一種可以反映文獻(xiàn)之間客觀關(guān)系的網(wǎng)絡(luò),并對其進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)特點(diǎn)和屬性的分析,對開展各種研究可能會有更重要的意義。
從研究逐步深入的過程看,通過對以上文獻(xiàn)相關(guān)網(wǎng)絡(luò)的研究進(jìn)展總結(jié),可以發(fā)現(xiàn)對文獻(xiàn)相關(guān)網(wǎng)絡(luò)的研究幾乎都是從基礎(chǔ)的認(rèn)知探索逐漸過度到實際應(yīng)用方面的研究。這些研究主要分為兩個層面,第一個層面是利用社會網(wǎng)絡(luò)和復(fù)雜網(wǎng)絡(luò)分析方法對所構(gòu)建網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn)、節(jié)點(diǎn)屬性以及演化規(guī)律的探索分析,這類研究的開展使研究者對文獻(xiàn)相關(guān)網(wǎng)絡(luò)的靜態(tài)特征和動態(tài)演化規(guī)律有了初步認(rèn)識;第二個層面是在第一個層面的基礎(chǔ)上,對文獻(xiàn)相關(guān)網(wǎng)絡(luò)的應(yīng)用研究。文獻(xiàn)相關(guān)網(wǎng)絡(luò)的應(yīng)用研究又可細(xì)分為三類:第一類是根據(jù)構(gòu)建的網(wǎng)絡(luò),對學(xué)科結(jié)構(gòu)、學(xué)科前沿進(jìn)行探索分析,如對共詞網(wǎng)絡(luò)的應(yīng)用研究;第二類是根據(jù)網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn)和節(jié)點(diǎn)屬性特征,結(jié)合復(fù)雜網(wǎng)絡(luò)中重要節(jié)點(diǎn)的評價方法,構(gòu)建新的科學(xué)評價指標(biāo),如節(jié)點(diǎn)的中間中心度可用來評價期刊的跨學(xué)科特性,而利用PageRank算法構(gòu)建思想,可構(gòu)建出多種從不同角度評價科研合作網(wǎng)絡(luò)中重要節(jié)點(diǎn)的指標(biāo);第三類研究則將網(wǎng)絡(luò)分析方法和機(jī)器學(xué)習(xí)方法相結(jié)合,對未來的科研行為(引用行為、合著行為)進(jìn)行預(yù)測,且都取得了較好的應(yīng)用結(jié)果。
由此可見,通過構(gòu)建網(wǎng)絡(luò),利用網(wǎng)絡(luò)分析的方法,在對文獻(xiàn)相關(guān)網(wǎng)絡(luò)的結(jié)構(gòu)特征和演化規(guī)律進(jìn)行分析的基礎(chǔ)上,結(jié)合其他評價方法,可以構(gòu)建出新的科研評價指標(biāo)或?qū)ξ磥砜蒲行袨檫M(jìn)行預(yù)測。
在未來的研究中,可以根據(jù)已成熟的論文相似性算法,為某一學(xué)科領(lǐng)域或某幾個學(xué)科領(lǐng)域構(gòu)建論文相似性網(wǎng)絡(luò),分析網(wǎng)絡(luò)的各種屬性,探索學(xué)科領(lǐng)域的知識網(wǎng)絡(luò)結(jié)構(gòu)特點(diǎn),并根據(jù)表征重要節(jié)點(diǎn)和普通節(jié)點(diǎn)的網(wǎng)絡(luò)節(jié)點(diǎn)屬性從不同角度發(fā)現(xiàn)關(guān)鍵論文,力求創(chuàng)建一個基于網(wǎng)絡(luò)的新型論文評價指標(biāo)[36]。