,
隨著信息爆炸時(shí)代的到來,每年各學(xué)科領(lǐng)域都會有海量的科學(xué)文獻(xiàn)產(chǎn)生,如何從海量的信息資源中識別學(xué)科領(lǐng)域的研究熱點(diǎn)便成為了廣大科研工作者所面臨的難題。共詞分析是將文獻(xiàn)計(jì)量分析法和內(nèi)容分析法相結(jié)合的綜合分析方法[1]。近年來隨著信息可視化技術(shù)的快速發(fā)展、多種可視化軟件的開發(fā),共詞分析方法逐漸融入了多種可視化技術(shù),使分析結(jié)果更加直觀,因而成為監(jiān)測科技動態(tài)的重要方法。目前,很多學(xué)者將共詞分析結(jié)合可視化的方法應(yīng)用到學(xué)科領(lǐng)域熱點(diǎn)的監(jiān)測中,如1992年Law等人以環(huán)境酸化研究為例,利用共詞分析方法繪制了該領(lǐng)域的科學(xué)圖譜[2];1993年Courtial等人對專利文獻(xiàn)進(jìn)行共詞聚類分析,得到食品類專利文獻(xiàn)的研究熱點(diǎn),同時(shí)利用戰(zhàn)略坐標(biāo)顯示研究熱點(diǎn)[3];2001年Ding等從SCI和SSCI中獲取相關(guān)數(shù)據(jù),分析了信息檢索領(lǐng)域的研究主題及發(fā)展變化,并通過關(guān)鍵詞共現(xiàn)分析和多維尺度分析繪制領(lǐng)域地圖[4];2003年Stagmann等人利用主題詞聚類分析對Swanson等人所發(fā)現(xiàn)的非相關(guān)文獻(xiàn)之間隱含關(guān)系的數(shù)據(jù)進(jìn)行研究,并繪制了其研究熱點(diǎn)的戰(zhàn)略坐標(biāo)圖,結(jié)果顯示Swanson等人的研究結(jié)果與詞語在戰(zhàn)略坐標(biāo)中的位置之間存在著一定的聯(lián)系[5];2003年張晗等人利用共詞聚類分析生物信息學(xué)領(lǐng)域的研究熱點(diǎn),同時(shí)繪制了戰(zhàn)略學(xué)標(biāo)圖以定量地分析各研究熱點(diǎn)的發(fā)展階段[6];2005年謝彩霞等人利用關(guān)鍵詞共現(xiàn)分析了1994-2001年我國納米科技論文,展示了我國納米科技研究領(lǐng)域的發(fā)展趨勢[7];2010年王慧將共詞分析和社會網(wǎng)絡(luò)分析結(jié)合,對中美情報(bào)學(xué)學(xué)科熱點(diǎn)進(jìn)行了對比分析研究[8]。
但大多數(shù)研究只選取一種或兩種可視化方法,本文用不同可視化方法監(jiān)測并分析了我國神經(jīng)病學(xué)領(lǐng)域的熱點(diǎn)及其主題的發(fā)展和演進(jìn)態(tài)勢。
本文擬按照圖1所示路線分析監(jiān)測研究熱點(diǎn)。
圖1 研究路線
共詞分析是通過統(tǒng)計(jì)分析反映文獻(xiàn)主題內(nèi)容的專業(yè)術(shù)語、研究文獻(xiàn)內(nèi)在聯(lián)系和學(xué)科結(jié)構(gòu)的方法。通常采用的方法就是從相關(guān)文獻(xiàn)中提取關(guān)鍵詞,并選取高頻詞,兩兩統(tǒng)計(jì)一組關(guān)鍵詞在同一篇文獻(xiàn)中共同出現(xiàn)的頻率,構(gòu)建共詞矩陣,為后面的統(tǒng)計(jì)分析做好準(zhǔn)備。
社會網(wǎng)絡(luò)是指社會成員之間因相互作用而形成的關(guān)系體系,社會網(wǎng)絡(luò)分析就是要對社會網(wǎng)絡(luò)成員之間的關(guān)系進(jìn)行量化研究[8]。在社會網(wǎng)絡(luò)圖中,點(diǎn)表示社會成員,點(diǎn)之間的連線表示成員之間的關(guān)系。本文從整體屬性和個(gè)體屬性兩個(gè)角度選擇指標(biāo)進(jìn)行分析。其中整體屬性的指標(biāo)包括網(wǎng)絡(luò)密度和網(wǎng)絡(luò)平均路徑長度,前者是指整體網(wǎng)絡(luò)中各個(gè)點(diǎn)之間聯(lián)系的緊密程度,后者是指網(wǎng)絡(luò)中任意兩點(diǎn)之間的平均距離;個(gè)體屬性的指標(biāo)包括點(diǎn)度中心度、中間中心度、接近中心度,點(diǎn)度中心度是指網(wǎng)絡(luò)圖中與該節(jié)點(diǎn)直接相連的點(diǎn)的數(shù)目,中間中心度表示網(wǎng)絡(luò)成員對資源控制的程度,接近中心度表示網(wǎng)絡(luò)成員與網(wǎng)絡(luò)其他成員的接近性程度。
在共詞分析基礎(chǔ)上,采用聚類算法對共詞網(wǎng)絡(luò)中各主題間的聯(lián)系強(qiáng)度進(jìn)行運(yùn)算,根據(jù)聚類結(jié)果將相互聯(lián)系相對緊密的主題聚集起來形成相對獨(dú)立的團(tuán)體-類團(tuán)[9]。本文劃分類團(tuán)時(shí)將去掉沒有統(tǒng)計(jì)分析意義的僅由一個(gè)關(guān)鍵詞或兩個(gè)關(guān)鍵詞組成的類團(tuán)[10]和由主題概念不甚關(guān)聯(lián)的關(guān)鍵詞組成的類團(tuán)[11]。類團(tuán)內(nèi)部各關(guān)鍵詞對聚類的貢獻(xiàn)度用“粘合力”衡量,某一關(guān)鍵詞與類團(tuán)內(nèi)其他關(guān)鍵詞的共現(xiàn)次數(shù)越多,其粘合力越大,在類團(tuán)中的地位越突出。在一個(gè)類團(tuán)中,粘合力最大的關(guān)鍵詞稱為中心詞[12]。本文通過計(jì)算類團(tuán)內(nèi)某一關(guān)鍵詞和其他關(guān)鍵詞的絕對共現(xiàn)頻次的平均值得到該關(guān)鍵詞的粘合力值,并根據(jù)每個(gè)類團(tuán)內(nèi)粘合力最大的幾個(gè)關(guān)鍵詞命名類團(tuán)。
戰(zhàn)略坐標(biāo)是在共詞矩陣和聚類的基礎(chǔ)上,描述某學(xué)科領(lǐng)域的內(nèi)部聯(lián)系情況。戰(zhàn)略坐標(biāo)圖是以測度某個(gè)類團(tuán)和其他類團(tuán)之間的外部鏈接強(qiáng)度的中心度為橫軸、以測度某個(gè)類團(tuán)內(nèi)部各關(guān)鍵詞之間的內(nèi)部鏈接強(qiáng)度的密度為縱軸繪制的二維坐標(biāo),原點(diǎn)為中心度平均值和密度平均值的交點(diǎn)[13]。落入四個(gè)象限中的類團(tuán)分別表示不同的含義(圖2)。
圖2 戰(zhàn)略坐標(biāo)圖
數(shù)據(jù)來源于萬方醫(yī)學(xué)網(wǎng),通過“中圖分類號”字段檢索2003-2012年我國作者發(fā)表的神經(jīng)病學(xué)相關(guān)文獻(xiàn),中圖分類號為R741-R748(神經(jīng)病學(xué))、R739.4(神經(jīng)系腫瘤),共檢出103501條文獻(xiàn)記錄(檢索及下載日期為2013-04-01)。為了研究神經(jīng)病學(xué)領(lǐng)域主題的發(fā)展過程,按時(shí)間將記錄分成2003-2007年、2008-2012年兩段,分別有40 258和63 243條文獻(xiàn)記錄。
提取記錄中的時(shí)間和關(guān)鍵詞字段,對關(guān)鍵詞進(jìn)行人工清洗,合并同義詞、近義詞,去掉沒有實(shí)際意義的詞。為簡化統(tǒng)計(jì)過程和減少低頻詞對后續(xù)統(tǒng)計(jì)和可視化造成的不必要干擾,本文截取了高頻詞。利用1973年Donohue提出的高頻低頻詞分界公式截取高頻詞[14]。兩個(gè)階段分別截取到62個(gè)、83個(gè)高頻詞。
本文構(gòu)建了高頻詞的共詞矩陣。在原始共詞矩陣中,兩個(gè)關(guān)鍵詞共現(xiàn)頻次的大小直接受到關(guān)鍵詞詞頻大小的影響,所以原始共詞矩陣所反映的僅僅是一種表象。為了更準(zhǔn)確地揭示關(guān)鍵詞間的共現(xiàn)關(guān)系,需要對原始矩陣進(jìn)行包容化處理,使神經(jīng)病學(xué)領(lǐng)域的核心主題和非核心主題間的分界更明顯。經(jīng)過試驗(yàn),Ochiai系數(shù)法最適合對本文中的原始共詞矩陣進(jìn)行包容化處理[15]。
3.3.1 詞分析
3.3.1.1 社會網(wǎng)絡(luò)指標(biāo)
2003-2007年網(wǎng)絡(luò)密度為0.0112,2008-2012年網(wǎng)絡(luò)密度為0.0098。后一階段的網(wǎng)絡(luò)密度較前一階段略小,表明雖然后一階段的文獻(xiàn)量顯著增長,代表研究熱點(diǎn)的高頻詞增多,但是其各個(gè)研究熱點(diǎn)之間的聯(lián)系略不如前一階段緊密。
2003-2007年網(wǎng)絡(luò)平均路徑長度為1.392,2008-2012年網(wǎng)絡(luò)平均路徑長度為1.418,表明在神經(jīng)病學(xué)社會網(wǎng)絡(luò)中,每一個(gè)關(guān)鍵詞大概只需要通過1-2個(gè)關(guān)鍵詞就能和網(wǎng)絡(luò)中其他關(guān)鍵詞產(chǎn)生聯(lián)系??梢娚窠?jīng)病學(xué)社會網(wǎng)絡(luò)具有小世界效應(yīng),具有迅速的反應(yīng)能力和較高的效應(yīng)[8]。相比之下,前一階段關(guān)鍵詞間的溝通略好一點(diǎn)。
2003-2007年點(diǎn)度中心度的平均值為0.684,2008-2012年點(diǎn)度中心度的平均值為0.806,說明后一階段核心詞在整個(gè)網(wǎng)絡(luò)中發(fā)揮的作用略大于前一階段。兩個(gè)階段中間中心度的平均值分別為11.968和17.133,表明后一階段中間詞在整個(gè)網(wǎng)絡(luò)中發(fā)揮的作用大于前一階段。兩個(gè)階段接近中心度的平均值非常相近,分別為72.822和71.549。
3.3.1.2 社會網(wǎng)絡(luò)圖
利用Ucinet 6和NetDraw繪制兩個(gè)階段的社會網(wǎng)絡(luò)圖(圖3和圖4)。根據(jù)節(jié)點(diǎn)大小和連線的粗細(xì),結(jié)合節(jié)點(diǎn)點(diǎn)度中心度值,還可以判斷出神經(jīng)病學(xué)領(lǐng)域內(nèi)的核心熱點(diǎn),如腦梗死、腦卒中、腦出血、康復(fù)、高血壓、癲癇、腦缺血、磁共振成像、體層攝影術(shù)、X線計(jì)算機(jī)、康復(fù)、治療、再灌注損傷等。
圖3 2003-2007年社會網(wǎng)絡(luò)圖
圖4 2008-2012年社會網(wǎng)絡(luò)圖
3.3.2 類團(tuán)分析
利用SPSS 19.0進(jìn)行聚類,根據(jù)聚類樹圖結(jié)果和篩選,兩個(gè)階段最終分別確定了11個(gè)和12個(gè)類團(tuán)(表1和表2)。
表1 2003-2007年類團(tuán)
表2 2008-2012年類團(tuán)
3.3.2.1 類團(tuán)演變分析
類團(tuán)存在著消失、新生、演進(jìn)及分化現(xiàn)象,從中可以判斷學(xué)科領(lǐng)域內(nèi)研究主題的發(fā)展和變化[16]。本文繪制了前一階段到后一階段的類團(tuán)演變圖(圖5)。從類團(tuán)演化角度看,近幾年微創(chuàng)手術(shù)在神經(jīng)外科中得到廣泛的應(yīng)用。隨著我國人民生活水平的提高,對于神經(jīng)疾病治療效果的期望上升為心理層面。雖然對于頸動脈粥樣硬化與C反應(yīng)蛋白、同型半胱氨酸水平相關(guān)性的研究尚不成熟,但引起了科研人員的廣泛關(guān)注,具有潛在的發(fā)展趨勢。
圖5 類團(tuán)演變圖
3.3.2.2 類團(tuán)地位變化分析
兩個(gè)階段的戰(zhàn)略坐標(biāo)圖見圖6和圖7。圖中各節(jié)點(diǎn)旁的序號分別對應(yīng)表1和表2中的類團(tuán)序號。
對比圖6和圖7,兩個(gè)階段位于第一象限的類團(tuán)相同,分別為“腦梗死的藥物治療”、“高血壓腦出血的手術(shù)(微創(chuàng)手術(shù))”、“腦卒中的康復(fù),腦卒中后致偏癱、抑郁”,它們的中心度和密度都很高。這三個(gè)類團(tuán)始終屬于既核心又成熟的類團(tuán),一直是神經(jīng)病學(xué)領(lǐng)域科研人員研究的重點(diǎn)。
類團(tuán)“兒童癲癇的腦電圖”、“MRI和CT檢查”由第二象限轉(zhuǎn)至第三象限,表明這兩個(gè)主題發(fā)展較慢,密度相對變小,相關(guān)研究有待于進(jìn)一步加強(qiáng)。類團(tuán)“顱內(nèi)動脈瘤并發(fā)蛛網(wǎng)膜下腔出血”由第三象限轉(zhuǎn)至第二象限,密度變大,類團(tuán)名改為“蛛網(wǎng)膜下腔出血后并發(fā)腦血管痙攣,顱內(nèi)動脈瘤后并發(fā)蛛網(wǎng)膜下腔出血”,表明后一階段科研人員對這一主題的關(guān)注和研究逐漸增多,該主題發(fā)展較快,逐漸變得成熟,有繼續(xù)發(fā)展的潛質(zhì)。“腦血管疾病的危險(xiǎn)因素和預(yù)后”由第四象限轉(zhuǎn)至第三象限,類團(tuán)名改為“腦血管疾病的護(hù)理和并發(fā)癥”,說明前一階段中雖然不成熟,但很受關(guān)注的主題在后一階段中受關(guān)注程度降低,科研人員的研究重點(diǎn)有所轉(zhuǎn)變。
新生類團(tuán)“頸動脈粥樣硬化與C反應(yīng)蛋白、同型半胱氨酸水平的相關(guān)性”位于第四象限,中心度較大,密度小。雖然該研究主題內(nèi)部結(jié)構(gòu)松散,尚不成熟,但引起了科研人員的關(guān)注,具有潛在的發(fā)展趨勢。
圖6 2003-2007年戰(zhàn)略坐標(biāo)圖
圖7 2008-2012年戰(zhàn)略坐標(biāo)圖
3.3.3 詞和類團(tuán)綜合分析
社會網(wǎng)絡(luò)分析是從詞的角度分析學(xué)科熱點(diǎn),而戰(zhàn)略坐標(biāo)分析是從類團(tuán)的角度研究學(xué)科熱點(diǎn)。將社會網(wǎng)絡(luò)圖和戰(zhàn)略坐標(biāo)圖整合,得到兩個(gè)階段的復(fù)合網(wǎng)絡(luò)圖分布(圖8和9)。
首先,根據(jù)類團(tuán)所在象限,從復(fù)合網(wǎng)絡(luò)圖中可以很清晰地判斷神經(jīng)病學(xué)領(lǐng)域的核心主題和成熟主題。例如,兩個(gè)階段中既核心又成熟的類團(tuán)都是1,2,3號類團(tuán),說明他們始終是神經(jīng)病學(xué)的研究核心和熱點(diǎn),得到了科研人員的廣泛關(guān)注,并已經(jīng)發(fā)展得很成熟。
其次,復(fù)合網(wǎng)絡(luò)圖譜還可以直觀地展現(xiàn)類團(tuán)內(nèi)及類團(tuán)間的聯(lián)系。戰(zhàn)略坐標(biāo)圖中中心度越大的類團(tuán),和其他類團(tuán)的聯(lián)系越密切,在復(fù)合網(wǎng)絡(luò)圖中該類團(tuán)和其他類團(tuán)的連線越多、越粗;戰(zhàn)略坐標(biāo)圖中密度越大的類團(tuán),其內(nèi)部成員的聯(lián)系越緊密,在復(fù)合網(wǎng)絡(luò)圖中其內(nèi)部各個(gè)節(jié)點(diǎn)之間的連線越多、越粗。例如,第一象限中類團(tuán)內(nèi)、類團(tuán)間的連線更多、更粗,第三象限中類團(tuán)內(nèi)和類團(tuán)間的連線更少、更細(xì)。
圖8 2003-2007年復(fù)合網(wǎng)絡(luò)圖
圖9 2008-2012年復(fù)合網(wǎng)絡(luò)圖
從詞、類團(tuán)及二者結(jié)合的角度分析學(xué)科領(lǐng)域熱點(diǎn)時(shí)具有不同的特點(diǎn),獲得不同的領(lǐng)域熱點(diǎn)信息。
從詞的角度分析領(lǐng)域熱點(diǎn)時(shí),既可以定量地分析學(xué)科領(lǐng)域中各關(guān)鍵詞間聯(lián)系的緊密程度、關(guān)鍵詞間溝通的難易程度以及核心關(guān)鍵詞,也可以通過社會網(wǎng)絡(luò)圖定性和直觀地展示學(xué)科領(lǐng)域中各關(guān)鍵詞間的聯(lián)系,但關(guān)鍵詞是孤立的點(diǎn),不能代表領(lǐng)域的研究主題。
從類團(tuán)的角度分析領(lǐng)域熱點(diǎn)時(shí),既可以定量地揭示各研究主題在領(lǐng)域中的地位,也可以揭示研究主題的發(fā)展及其地位的改變,但無法分析類團(tuán)內(nèi)部各關(guān)鍵詞間的具體聯(lián)系。
從詞和類團(tuán)結(jié)合的角度,將戰(zhàn)略坐標(biāo)圖和社會網(wǎng)絡(luò)圖結(jié)合的,得到的復(fù)合網(wǎng)絡(luò)圖,既可以展示研究主題的地位,也可以直觀地揭示類團(tuán)間以及類團(tuán)內(nèi)各關(guān)鍵詞間的聯(lián)系及研究主題的發(fā)展與地位。因此綜合運(yùn)用詞和類團(tuán)分析方法,繪制復(fù)合網(wǎng)絡(luò)圖可以直觀地展示從詞、類團(tuán)角度分別獲得的領(lǐng)域熱點(diǎn)信息,彌補(bǔ)單獨(dú)使用某一方法在分析學(xué)科領(lǐng)域熱點(diǎn)時(shí)的不足,在領(lǐng)域熱點(diǎn)監(jiān)測中具有重要意義。
本文尚存在不足。首先,只檢索了萬方醫(yī)學(xué)網(wǎng)的相關(guān)文獻(xiàn),由于該數(shù)據(jù)庫收錄范圍的局限性[17],不能全面獲得我國神經(jīng)病學(xué)領(lǐng)域的相關(guān)文獻(xiàn),分析結(jié)果難免有失偏頗;其次,用高頻詞代表研究熱點(diǎn)具有一定的合理性,其缺點(diǎn)在于某些最新研究主題的詞頻較低,僅依靠高頻詞無法監(jiān)測到最新的研究熱點(diǎn)。今后將結(jié)合監(jiān)控暴發(fā)詞的方法來探測學(xué)科熱點(diǎn),從而更加準(zhǔn)確、客觀地揭示學(xué)科的新熱點(diǎn)。