吳 江,王凱利,董 克,楊玉潔,易夢馨
(1. 武漢大學信息資源研究中心,武漢 430072;2. 武漢大學信息管理學院,武漢 430072)
網絡分析方法是一種常見的用于處理關聯(lián)數(shù)據(jù)的分析方法。分析思想起源于圖論,其中,社會網絡的研究思想萌芽于涂爾干的社會結構理論和齊美爾的社會互動理論[1],并逐漸形成了定量化的社會網絡分析的獨特范式。1998 年,Watts 和Strogatz 在Nature上發(fā)表了小世界模型的研究論文①https://doi.org/10.1038/30918,開啟了與社會網絡分析密切相關的另一個研究方向——復雜網絡分析?;谶B接主義思想和網絡思維的社會網絡、復雜網絡等研究,共同組成了一個新興的交叉學科,即網絡科學[2],網絡分析方法作為網絡科學的最主要方法已經得到了廣泛應用。
信息計量作為圖書情報學科理論方法體系中的重要組成部分,早期的研究主要從獨立的個體維度展開,如經典的布-齊-洛三大定律,側重于揭示科學文獻信息本身的分布特征。隨著知識交流的不斷發(fā)展和各種信息的爆炸增長,科學信息逐步形成了巨大的知識網絡。從連接視角出發(fā),研究不同知識主體所構成的知識網絡結構形態(tài)、演化機理及其所反映的人類認知空間的特征與演變,逐漸成為信息計量研究的重要趨勢。網絡分析方法被不斷地應用于信息計量領域的研究中,并產生了大量的研究成果。 已有綜述分別從網絡分析方法的原理與機制[3-4]、多類型網絡分析方法[5-8]以及單類型網絡分析方法[9-11]的角度對相關成果進行了歸納與總結。當前,網絡分析方法在信息計量領域的應用已經進入調整期,系統(tǒng)綜述網絡分析方法在信息計量領域中的應用成果,對厘清相關研究的脈絡與現(xiàn)狀,明確未來研究方向,從而推動相關研究的進一步發(fā)展具有現(xiàn)實意義。
網絡分析思維提供了從 “事物+聯(lián)系” 的連接主義思想看待世界的新角度,根據(jù)節(jié)點、連邊和拓撲上的不同含義形成了各種不同的網絡?;诳茖W文獻、專利等知識載體,以及載體中的標題、作者、摘要、關鍵詞、正文、參考文獻等部分,可以構建各種網絡。在信息計量研究領域,連接主義思想和網絡分析方法的應用有較長的歷史。表1 列出了信息計量領域重要網絡概念以及代表性學者,這些概念的提出就是連接主義思想和網絡科學觀在信息計量領域應用的體現(xiàn)。
表1 信息計量領域一些重要網絡相關概念的提出
以Web of Science (WoS) 和CNKI 為 數(shù)據(jù)源,用合作網絡、共詞網絡、共引網絡、耦合網絡、引文網絡、社會網絡分析等信息計量領域中與網絡分析相關的主要關鍵詞進行檢索(檢索日期為2020 年8 月25 日),發(fā)文量的時序統(tǒng)計結果如圖1 所示。從圖中可以發(fā)現(xiàn),在經歷了10 年左右的載文量高速增長后,2014 年以來中文文獻發(fā)文量出現(xiàn)平緩下降的趨勢,英文相關研究的發(fā)文量也在2017 年以后有所下降。網絡分析方法在信息計量領域中的應用研究雖然仍是研究熱點,但已經進入了相應的調整階段,亟須通過明晰網絡分析方法的本質并持續(xù)應用前沿的網絡分析方法技術,以實現(xiàn)更多的創(chuàng)新。
圖1 中英文文獻發(fā)布年度趨勢圖
信息計量領域中網絡分析方法的應用,一般是對知識載體所涉及的知識主體進行特定層次或多層次維度的分析。合作網絡、引文網絡、共引網絡、耦合網絡和共詞網絡等不同網絡,由于網絡節(jié)點不同,網絡連邊含義、連邊的方向和權重的定義存在差異,因此,網絡所反映的整體特性有所不同,應用方向的側重點也有所區(qū)別。為了對計量領域中網絡分析方法的研究與應用進行有序梳理,本研究提出了信息計量領域網絡分析方法的研究框架,如圖2 所示。該框架從知識載體、知識主體和分析層次這三個維度對網絡分析方法在信息計量領域的研究進行劃分。
圖2 信息計量領域應用網絡分析方法的研究框架
就知識載體的維度而言,Price 基于科學文獻知識載體之間的引用關系提出了引文網絡,開啟了后續(xù)網絡分析在信息計量領域中的應用[12]。雖然專利文獻、政策文獻等都可以歸入文獻的范疇,分析單元和分析方法存在類似之處,但與科學文獻相比,分析的側重點卻存在差異,以科學文獻為知識載體的分析方法可以引入專利、政策等網絡分析領域,從而產生專利網絡[13]和政策網絡[14]。
從知識主體維度看,知識主體表現(xiàn)出不同的粒度。作者是科學知識系統(tǒng)中知識的生產者、使用者和傳播者,是最基礎的知識主體之一,也是最小粒度的知識主體,關于作者合作、共引與耦合等相關網絡的研究已有豐富的成果。對機構、國家、地區(qū)和學科等知識主體的分析,實質上是對作者所擁有的機構歸屬、地理位置以及學科領域等屬性的拓展,主要用于反映各知識主體科學研究的分布與水平。
分析層次維度是基于網絡科學角度的一種認知,一直隱含在知識主體與知識載體這兩個傳統(tǒng)信息計量的認知維度中。從連接主義視角來看,微觀層次研究側重于對節(jié)點、連邊性質與特征的認識,如角色、結構、連邊的內涵特征等;中觀層次更多地關注網絡中的社區(qū),針對不同的知識主體得到不同的分析結果,如無形學院、機構合作、知識分布等;宏觀層面上,信息計量領域本身更多的是從統(tǒng)計學角度來描述科學發(fā)展規(guī)律(如經典的三大定律),而網絡分析方法則提供了動力學視角的統(tǒng)一解釋。
以科學文獻知識載體為例,引文網絡可以在各種科學文獻相關的知識主體上通過定義不同類型的節(jié)點和連邊,形成論文引用、作者引用、機構引用、地區(qū)引用、國家引用、學科引用、期刊引用等諸多的有向關系,并組成各種不同的網絡。合作網絡也可以在知識主體維度上進行擴展,從作者合作網絡延伸到機構合作網絡和國家合作網絡等。共引網絡和耦合網絡也同樣可以在知識主體維度上擴展,形成學科共引、學科耦合等不同類別的網絡。對這些信息計量領域不同類型的網絡,可以在宏觀、中觀、微觀等不同層面進行分析,從而基于關聯(lián)數(shù)據(jù)對實際問題進行解釋,支持管理決策。
在宏觀層面,基于不同知識載體中知識主體間的關聯(lián),通過分析各種網絡的整體拓撲特性和演化規(guī)律,網絡分析方法在理解科學合作模式、發(fā)現(xiàn)知識關聯(lián)、研究網絡拓撲結構、識別跨學科主題等研究中得到了廣泛應用,表2 總結了網絡分析方法宏觀應用的代表性研究成果。
表2 網絡分析方法的宏觀應用及其代表性研究
(1) 合作網絡的拓撲結構常被用來理解科學合作模式,結合網絡中心性等指標以及小世界效應、冪律分布等基本統(tǒng)計特征,可以揭示合作網絡在個人[15-16]、機構[17]與國家[18]層面的結構特征,揭示知識主體隨著時間推移的角色變化。此外,科學合作能夠加強知識流動與分享,影響研究績效,這些特性均與網絡拓撲結構息息相關。專利往往被認為是最直觀的創(chuàng)新表現(xiàn),以專利合作構成的網絡得到了廣泛研究,用于探討合作是否推動了知識流動與創(chuàng)新。有學者發(fā)現(xiàn),合作網絡拓撲的動態(tài)性和組織的創(chuàng)新績效具有倒U 形關系,且適當?shù)目缟鐓^(qū)流動對創(chuàng)新績效具有正向影響[19]。
(2) 利用引文網絡發(fā)現(xiàn)學科和學者知識關聯(lián)。一方面,學科關聯(lián)即知識單元間的學科關系,主要是通過學科分類體系來表現(xiàn)的。在學科交叉情況普遍存在的當下,跨學科知識關聯(lián)研究的重要性日益凸顯,Barnett 等[20]對傳播學期刊進行研究發(fā)現(xiàn),在WoS 中僅標注傳播學的期刊比同時標注其他學科的期刊在引文網絡中處于更重要的地位,且中心期刊比邊緣期刊有更多的引用集群;Park 等[21]發(fā)現(xiàn),社會和實驗心理學期刊是該傳播學領域期刊最常用的引用來源。另一方面,學科知識流動網絡為無標度動態(tài)網絡,不同學部間、同一學部內的不同學科間,知識流動強度不同[22]。由于某個特定的研究者在特定時期內也會存在跨學科現(xiàn)象,通過研究者的自引網絡及自引文獻中的合作者和關鍵詞分析,有助于揭示學者研究領域的動態(tài)變化[23];而通過引文網絡分析跨學科團隊中研究者的學科情況,則能探索跨學科團隊的成功機制[24]。
此外,引文網絡拓撲特性及其演化機制研究也是宏觀層面引文網絡分析的重要組成部分。科學文獻網絡表現(xiàn)出較多的統(tǒng)計特性,對這些統(tǒng)計特性加以分析,有助于更好地認識科學文獻系統(tǒng)[25]。學者們對引文網絡的度、聚集系數(shù)、平均路徑長度、度相關性進行研究,發(fā)現(xiàn)引文網絡的入度分布表現(xiàn)出冪律特性[26]、較高的集聚特性和相對較低的路徑長度,且度相關性常表現(xiàn)為負相關關系;隨著時間的推移,網絡拓撲結構會發(fā)生變化,相應的網絡統(tǒng)計性質也會發(fā)生變化,即表現(xiàn)出不同的網絡演化模式[27]。引文網絡作為增長型網絡,文章的引用隨時間近似指數(shù)遞減[28],且網絡中存在首發(fā)優(yōu)勢現(xiàn)象[29];考慮受引文年齡影響的優(yōu)先連接特性,無標度演化模型、隨機演化模型和隨機增長模型等被用來分析和研究引文網絡的演化機制[30]。
(3) 共引網絡的拓撲結構及跨學科迭代創(chuàng)新研究。通過分析共引網絡的拓撲結構可以判斷網絡中節(jié)點角色的創(chuàng)新潛力。例如,在作者共引網絡中,占據(jù)更多結構洞的作者占有更多研究領域的信息資源,其創(chuàng)新潛力更強[31]。國家共引網絡、文獻共引網絡的研究也證實了科學研究中,跨學科現(xiàn)象越來越普遍的猜測,且科學地圖顯示了跨學科研究主要發(fā)生在相鄰學科領域之間[32]。此外,也有學者借助共引關系構建創(chuàng)新網絡,通過分析網絡規(guī)模及創(chuàng)新擴散方向,對比節(jié)點度的大小,將各學科劃分為創(chuàng)新源發(fā)學科、創(chuàng)新采納學科和創(chuàng)新助力學科,用以明確各學科在迭代創(chuàng)新中發(fā)揮的具體作用[33]。
(4) 耦合網絡拓撲性質及學科耦合分析。學術論文之間的耦合關系是科學文獻之間的一種普遍聯(lián)系,分析耦合網絡拓撲性質有助于發(fā)現(xiàn)耦合現(xiàn)象的基本規(guī)律。研究表明,論文耦合網絡的平均距離小,聚類系數(shù)大,呈現(xiàn)明顯的小世界特征;耦合網絡的度正相關,度分布呈指數(shù)分布,且網絡的同配性特征與真實社交網絡的典型特征相一致[34]。此外,各學科內部文獻耦合的網絡密度存在一定的差異,即學科與學科之間的耦合關系密切程度各不相同,這與學科規(guī)模、 論文數(shù)量等的差異緊密相關[35]。
(5) 共詞網絡常被用來進行跨學科領域的知識主題發(fā)現(xiàn)與關聯(lián)分析。越來越多的研究關注多學科知識的融合,因此,分析領域整體研究概況以及各個子領域之間的關系變得非常必要。學者們普遍使用可視化的方式展現(xiàn)學科的演化情況,分析不同主體領域在構成學科過程中的聯(lián)系與融合[36]。共詞網絡還可用于發(fā)現(xiàn)跨學科研究中的潛在研究熱點,學科之間的交互與融合往往促進新研究熱點的產生。例如,Santa Soriano 等[37]通過分析公共管理與戰(zhàn)略情報領域的共詞網絡,發(fā)現(xiàn)了公共關系情報這一新興主題;也有學者利用共詞網絡對比了中外圖書館學科化服務領域的學科結構差異[38]。
由于不同類型網絡可以應用于相同的研究目的,因此,學者們也進行了網絡對比研究,來分析網絡的適用性問題。例如,引用網絡、共引網絡與耦合網絡都能發(fā)現(xiàn)研究熱點、識別研究前沿,學者們通過對比發(fā)現(xiàn),引用網絡可以更快、更早地探測新興研究前沿,耦合網絡次之,共引網絡最慢;在探測精確度方面,耦合比共引精確[39]。共引網絡與耦合網絡相比,耦合網絡具有主動追溯特性,在識別領域研究前沿及發(fā)展趨勢方面更具優(yōu)勢,而共引網絡的被動演化特性則更適用于分析學科演化,并挖掘關鍵性、里程碑式的科學文獻。此外,也有學者關注細分網絡之間的對比研究,例如,作者關鍵詞耦合網絡和作者文獻耦合網絡,并分析其各自的優(yōu)缺點[40];還有學者通過對比作者文獻耦合、作者關鍵詞耦合、作者期刊耦合等五種網絡,挖掘網絡間的潛在相關性[41]。
在中觀層面,各種網絡的社團和模體結構分析在社區(qū)檢測、技術路徑挖掘、科學智力結構研究中得到了廣泛應用。對比宏觀層面的應用研究,中觀層面研究主題的粒度更細,且各網絡的可視化應用更加廣泛。網絡分析方法的中觀應用現(xiàn)狀及其代表性研究成果如表3 所示。
表3 網絡分析方法的中觀應用現(xiàn)狀及其代表性研究
(1) 應用社區(qū)檢測對合作網絡的社區(qū)結構進行研究。通過構建以作者為節(jié)點,以合作關系為邊的領域合作網絡,K-core、層次聚類、成分分析等多種方法被用來提取網絡中的社區(qū),識別領域中主要的合作群體,結合基于網絡拓撲指標的社區(qū)影響力分析[42-43],可以實現(xiàn)對研究熱點變化的挖掘,實現(xiàn)科學主題分析和研究社區(qū)識別的協(xié)同應用。 Yan等[44]以2001—2007 年信息檢索領域的研究為例,結合合作網絡與主體模型,發(fā)現(xiàn)主題可以用社區(qū)形式的進行識別,而社區(qū)是由不斷融入的新主體來增強內部凝聚力,這個結果有助于提升對科學發(fā)展的動態(tài)認識。
(2) 利用引文網絡進行社團劃分、知識演化分析和技術路徑挖掘。社團劃分對分析學科知識結構及其發(fā)展脈絡,揭示學科發(fā)展趨勢有重要意義[45]。目前,社團劃分及知識演化分析已應用于圖書情報[46]、光學[47]、物理學[48]等多個學科領域,以及創(chuàng)新研究[49]、信息行為[50]、數(shù)字醫(yī)學[51]等多個主題領域。專利引文網絡則主要用來分析技術演進[52-53],評估行業(yè)發(fā)展階 段[54],指導行業(yè)發(fā)展[55]。Hummon 等[56]于1989 年首次提出主路徑(main path analysis,MPA) 這一概念,用節(jié)點對投影數(shù)(node pair projection count,NPPC)、搜索路徑鏈接數(shù)(search path link count,SPLC)、搜索路徑節(jié)點對(search path node pair,SPNP) 三個指標衡量引用鏈接對的權重。自此,眾多學者利用文獻、專利數(shù)據(jù)進行主路徑分析研究,學者們基于科學文獻的引用,發(fā)掘知識傳遞與擴散路徑[57],基于專利引用識別關鍵技術及其演化軌跡[58],并就路徑選擇原則、路徑搜尋起點及弧遍歷權重等問題展開了研究。
(3) 共引網絡可揭示學科結構、 識別研究前沿,并分析科學交流模式。共引網絡主要通過繪制科學結構圖的形式揭示科學結構,用圖中節(jié)點的相對位置表示關聯(lián)關系的遠近,用共引關系隨時間的變化描述學科的發(fā)展歷程。許多學者以圖情領域為對象展開了研究,例如,Small[59]從期刊角度進行聚類分析,認為情報學領域在20 世紀70 年代末的學科結構相對松散。共引網絡也可通過最新文獻識別研究前沿; ISI (Institute for Scientific Information)最早將共引聚類用于確定研究前沿[60],后被借鑒至其他學科[61]。同時,共引網絡還可以展示科學交流模式,分析科學交流中的非正式組織——“無形學院”(Invisible College)。有學者利用共引網絡對科學交流效果進行研究[62],并分析知產權、知識管理等領域學術論文的研究群體[63]。
(4) 耦合網絡可進行科學智力結構及競爭情報分析。作者文獻耦合作為耦合網絡的一種,除了用來描述活躍作者的研究活動、衡量學者的影響力情況以外,在中觀層面上也可以用于當前某學科智力結構的探索,并與作者共引相互補充,對學科智力結構做出更全面的展示[64]。通過作者文獻耦合網絡,在探索領域學科前沿的同時,也可以用于分析該領域的研究活力[65]。利用耦合網絡開展競爭情報分析的應用主要出現(xiàn)在專利研究中;將專利文獻耦合與專利引證關系相結合,可以挖掘某主題領域的關鍵技術,獲取技術競爭情報[66]。而專利權人耦合網絡則可用于分析專利權人之間的競爭關系,探究競爭對手及其優(yōu)勢,為企業(yè)發(fā)展提供競爭情報支持[67]。
(5) 共詞網絡被廣泛應用于學科知識結構分析。通過從科學文獻中抽取關鍵詞構建共詞網絡,利用因子分析、聚類分析等方法能夠識別關鍵詞的聚類和層次結構,并依據(jù)聚類集群的結構性指標分析相應主題的發(fā)展程度[71],而關鍵詞的突現(xiàn)被應用于探測研究前沿主題[72],并在數(shù)字圖書館[68]、醫(yī)療健康[69]、推薦系統(tǒng)[70]等領域得到實踐和應用。此外,也有研究關注詞之間的內在邏輯聯(lián)系,從語法層面深入到語義層面,這對于理解研究內容具有重要意義。通過本體語義距離[73]、語義共詞網絡[74]、LDA (latent Dirichlet allocation) 與共 詞 網 絡的 結合[75]等研究,優(yōu)化了共詞網絡的構建方法,并被證實具有更好的社區(qū)集群劃分效果。
揭示學科結構、進行社團劃分是網絡分析方法在中觀層面最重要、最普遍的應用,而可視化技術使研究結果以最簡潔、直觀的形式呈現(xiàn)出來,大大地提高了結果的可讀性。目前,較具影響力的可視化軟件如CiteSpace,可進行某學科或領域的研究熱點、前沿及其演進的知識圖譜分析。此外,VOS‐viewer、Sci2、Gephi、UCINET、Pajek 等也是常用的社會網絡可視化軟件;還有一些工具也在可視化領域得到了較好的應用,例如,HistCite 常用于引文時序分析,BibExcel 常用于清洗數(shù)據(jù)及生成共頻矩陣,SPSS 常用于多元統(tǒng)計分析。同時,越來越多的數(shù)據(jù)庫也提供了檢索結果的可視化功能,例如,可應用于大型數(shù)字圖書館的作者共引分析系統(tǒng)AuthorLink,能夠實現(xiàn)用戶與可視化圖形的交互,降低用戶認知負擔[76];ConceptLink 和PNASLink 系統(tǒng)也是基于共引網絡的信息檢索可視化系統(tǒng),可以實現(xiàn)關鍵詞、作者、期刊檢索的可視化分析[77]。
在微觀層面,通過分析節(jié)點特性及相互之間的關聯(lián),合作網絡、引文網絡、共引和耦合網絡可以進行重要知識主體、知識載體以及關系的識別。合作網絡可以推薦高價值的合作者;引文網絡可進行個性化的引文推薦;共引和耦合網絡可以優(yōu)化信息檢索結果,發(fā)掘潛在合作關系。相關代表性研究成果如表4 所示。
表4 網絡分析方法的微觀應用現(xiàn)狀及其代表性研究
(1) 借助合作網絡開展影響力評價及合作者推薦。通過分析節(jié)點在作者合作網絡中所處結構,可以對引文影響力測度進行補充,對合作者之間的引文進行更為準確地加權。例如,經常合作的兩位作者之間的引文被認為比從未合作的兩位作者之間的引文更有價值[78],可以按照合作者的貢獻程度分配引文權重[79]。事實上,合作者對一篇論文的貢獻是不均等的,學者們深入挖掘了合作網絡的特性,例如,部分研究將第一作者視為文章最重要的貢獻者,進而建立科學協(xié)作有向網絡,通過介數(shù)、Pag‐eRank、SIR 等方法識別出重要的合作者[79]。合作者多樣性與合作影響力雙因素效用函數(shù)被應用于合作網絡的學術新人預測評價[80]。此外,也有學者利用鏈路分析、機器學習等方法開展合作對象的智能預測研究,通過計算每個節(jié)點對的得分來分析其未來連接的可能性[81]。
(2) 引文網絡可被用來發(fā)現(xiàn)重要的知識載體、進行個性化推薦。重要知識載體一般具有較大的影響力,通過節(jié)點度或中介性等社會網絡指標,可識別某主題或學科中的代表性文獻、期刊或代表性作者[82-84]。 由于基于文獻被引數(shù)構建的期刊影響因子、g 指數(shù)和h 指數(shù)等量化指標只考慮了引用次數(shù)而忽略了文獻質量,評價結果存在缺陷,因此,將評價網頁重要性的PageRank 算法引入引文網絡,并將其與引文分析進行對比的研究也層出不窮[85-86]。此外,知識載體個性化推薦也是引文網絡重要應用之一,論文的引用關系及其文本相似性對提升推薦準確性有積極作用;基于引文網絡開發(fā)的文本挖掘系統(tǒng)可以將引文網絡劃分為不同的主題子網絡,并結合引文排序結果和主題分析,將相關性較高的文獻推薦給用戶[87]。也有學者基于引文網絡構建推薦模型,不斷提高模型的準確性[88]。
(3) 利用共引網絡實現(xiàn)科技評價與預測、優(yōu)化信息檢索。共引網絡可用于國家或研究機構的績效評價;通過共引聚類中某國家或機構出版物所占份額,可以衡量其在知識主題研究中的重要性,并分析其競合關系[89]。期刊共引分析則可用于揭示該期刊與所屬學科的親疏關系,以此判斷期刊的專業(yè)性強弱[90]。此外,共引網絡也可用來進行小組、學者、專利等不同對象的績效評價[91-92]。同時,共引網絡作為知識聚類的典型方法之一,可以實現(xiàn)某學科或主題領域文獻、學者、主題的匯集,從而提升信息檢索效率。例如,Rees-Potter[93]利用共引分析方法建立了動態(tài)詞表系統(tǒng),并用于術語詞表的維護和更新;基于共引分析的語義信息檢索模型將語義關系定量化,進一步提高了信息檢索的查全率和查準率[94]。
(4) 利用耦合網絡可以發(fā)掘潛在的合作關系、實現(xiàn)科技評價與預測、開展信息推薦。作者關鍵詞耦合網絡通過關鍵詞將作者聯(lián)結起來,能夠揭示某領域作者間的隱含關系[95],也可以依據(jù)耦合網絡的完整性程度分析作者之間的潛在合作關系[96]。耦合網絡也被應用于作者、期刊、專利等的評價,可用于發(fā)現(xiàn)核心作者和重要期刊[97],識別并預測關鍵技術的發(fā)展方向[98]。作者文獻耦合網絡還被用來跟蹤特定學者在學科發(fā)展中的軌跡,探索作者與所研究主題之間的關系及其對主題的影響[99]。此外,利用耦合關系還可以識別具有相同研究興趣的社區(qū),進而開展信息推薦[100]。
(5) 共詞網絡可以對關鍵詞進行結構度量,分析重要關鍵詞節(jié)點的特征,探索潛在的科學知識熱點[101]。除了應用于科學文獻分析,共詞網絡也被應用在專利分析中,用于技術主題的發(fā)現(xiàn)與創(chuàng)新路徑的識別。構成網絡的關鍵詞既可以從專利題名、摘要中抽取[102],也可以是專利獨有的標識技術領域的手工代碼[103]、專利分類號[104],進一步通過中心性、“m-核” 等分析方法來發(fā)現(xiàn)技術熱點。在政策文獻分析中,利用多維尺度等方法分析共詞網絡,能夠提煉政策核心話語[98],發(fā)現(xiàn)不同時期政策文本的核心主題分布。相關研究利用共詞網絡,分析了科技[105]、創(chuàng)新[106]、人工智能[107]等國家重點關注領域的政策文獻,為進一步解讀相關政策提供了參考。
雖然不同類型的網絡在具體研究內容上的側重點有所不同,但是在應用目的上卻表現(xiàn)出了許多一致性。無論是合作網絡、引文網絡、共被引網絡,還是耦合網絡、共詞網絡,其應用目的主要在節(jié)點,相應研究圍繞節(jié)點的特征分析、節(jié)點的角色識別、重要或關鍵性節(jié)點的評價、節(jié)點所代表知識內容的推薦等來開展。而針對連邊,目前網絡分析中較少將不同類型的連邊同時用于網絡構建,主要側重于對單一類型連邊的分析和預測,例如,通過PageRank 等算法區(qū)分不同引用關系的重要程度,來對引文連邊進行加權[108],利用節(jié)點相似性進行連邊的預測[109]等??傮w而言,在目前的微觀層面研究中,連邊的受關注程度要低于節(jié)點的受關注程度。
本文以信息計量領域中應用的網絡分析方法為研究對象,全面梳理了合作網絡、引文網絡、共引網絡、耦合網絡以及共詞網絡在宏觀、中觀和微觀三個層面上的應用研究。從發(fā)展階段來看,信息計量與網絡科學的結合已經十分緊密,并取得了許多重要的發(fā)現(xiàn)和成果。目前的相關應用研究已逐步進入相對成熟階段,處于尋找新的突破點的過程中,通過對現(xiàn)有研究的梳理和綜述,本文認為未來各分析層面可在以下方面開展進一步探索。
(1) 宏觀層面。首先,知識演化本身具有動態(tài)特性,論文影響力會隨時間波動,學者影響力會因發(fā)表論文數(shù)累積或遞減,學科也是如此?,F(xiàn)有網絡分析方法多以靜態(tài)網絡為主,然而單就靜態(tài)網絡而言,無法揭示網絡的全部信息。因此,結合時間變量,基于動態(tài)網絡結構進行評價分析,能夠更準確、全面地描述學者、期刊、機構等的影響力和變化。同樣地,開發(fā)相應的知識圖譜工具,對動態(tài)視角下的知識演化進行可視化也是一項十分有意義的工作。其次,許多研究發(fā)現(xiàn),兩個或多個網絡能夠優(yōu)化研究結果,因此未來應更重視多網絡融合的應用研究。例如,可將文獻共引和耦合網絡、作者文獻耦合、作者關鍵詞耦合網絡相結合,或將引文網絡與共引網絡、耦合網絡相結合,使得網絡分析從單網絡解構向多網絡融合發(fā)展。
(2) 中觀層面。首先,信息計量領域網絡分析方法的應用要實現(xiàn)從結果的描述向深層次機理探索的發(fā)展;已有研究以分析結果的可視化呈現(xiàn)為主,亟須對分析結果做進一步的深入分析,如挖掘社區(qū)結構的形成機理、探究科學群體發(fā)展的動力機制等問題。未來的研究需要從分析結果、探尋現(xiàn)象發(fā)生的原因,更好地解決領域中的實際問題。其次,在應用網絡分析方法的過程中,應進一步討論網絡構建方法,前期的網絡構建是后續(xù)分析的基礎;除了網絡連邊權重問題外,網絡節(jié)點問題也需要重視。例如,在構建共詞網絡時,需要對網絡節(jié)點所對應的關鍵詞進行語義層面的深度挖掘,避免關鍵詞在不同環(huán)境中的語義差異對網絡分析結果的影響。
(3) 微觀層面。網絡分析應加大對 “節(jié)點” 和“連邊” 研究的深度和廣度。從節(jié)點的角度來看,節(jié)點涉及知識載體與知識主體。從網絡的構建角度來說,未來網絡中的節(jié)點可以從不同類型的文獻層面深入到內容實體,如理論、方法、技術、工具等,從更豐富的視角進行網絡研究與分析;結合不同類型的知識載體構建多模網絡來綜合反映科學知識的發(fā)展,使得相關研究更為準確、客觀。從連邊的角度來看,連邊涉及節(jié)點間的關系。以引用關系為例,就引用范圍而言,隨著Altmetrics 的興起,各種社交媒體中的數(shù)據(jù)可以用來構建更加豐富的引用關系;就引用位置而言,引用行為在某篇文章的引言、綜述、數(shù)據(jù)方法、結果結論等位置均有可能發(fā)生,基于引用位置關系的研究有助于客觀評價引文,更好地實現(xiàn)學術質量及影響力評價。此外,利用多種類型的連邊來構建多層的知識網絡,更加接近于真實的知識網絡,相應的應用研究也應當引起學界的重視。