文/王小梅 韓濤 王俊
中國科學(xué)院國家科學(xué)圖書館 北京 100190
繼《科學(xué)結(jié)構(gòu)地圖2009》后,《科學(xué)結(jié)構(gòu)地圖2012》(圖1)近期即將出版。該書由潘教峰、張曉林等著,科學(xué)出版社出版。該書不僅可視化地展現(xiàn)了科學(xué)研究的宏觀結(jié)構(gòu)和復(fù)雜關(guān)系,還為觀察、分析和探索科學(xué)發(fā)展趨勢提供了新視角和新工具。
科技界一直非常重視對科學(xué)結(jié)構(gòu)和科學(xué)發(fā)展趨勢的分析。但是,在傳統(tǒng)研究環(huán)境下,科學(xué)家們主要通過檢索和分析相關(guān)文獻來了解學(xué)科發(fā)展,通過追蹤同行的研究活動來掌握學(xué)科趨勢和研究熱點,通過專家調(diào)研、研討以及專門的規(guī)劃研究來進一步判斷可能的突破方向。例如,日本在歷次技術(shù)預(yù)見中采用德爾菲法進行的大規(guī)模專家調(diào)研,中科院、國家基金委等組織系列專家組進行學(xué)科態(tài)勢分析。這些方法仍然是認知科學(xué)結(jié)構(gòu)及其發(fā)展趨勢的重要手段,但它們也日益受到新的科技創(chuàng)新需求的強烈挑戰(zhàn)。
當(dāng)前,科技創(chuàng)新已進入多學(xué)科交叉融匯的研究階段,例如由納米技術(shù)、生物技術(shù)、信息技術(shù)和認知技術(shù)交叉融匯所產(chǎn)生的NCBI(nano-bio-info-cogno)研究領(lǐng)域,以及麻省理工學(xué)院院長Susan Hockfield近年提出的物理、工程和生命學(xué)科融匯將產(chǎn)生的第三次生物科學(xué)革命。同時,貫穿從實驗室到應(yīng)用環(huán)境(From bench to bed)整個創(chuàng)新價值鏈的轉(zhuǎn)換型研究也將基礎(chǔ)科學(xué)問題、核心技術(shù)、應(yīng)用技術(shù)、市場化個性化應(yīng)用方法乃至應(yīng)用中的政策、規(guī)則、倫理、管理等問題相互關(guān)聯(lián)起來。而且,當(dāng)前我們面臨著的許多重大問題,如全球氣候變化、資源可持續(xù)發(fā)展、人類健康、環(huán)境保護與修復(fù)、人口老齡化等,都涉及到包括科學(xué)、技術(shù)、社會、經(jīng)濟乃至政治等多方面的復(fù)雜的相互動態(tài)影響的多重因素。在這樣的情況下,重大創(chuàng)新突破的啟動點往往來自所熟悉領(lǐng)域外的、復(fù)雜交叉關(guān)聯(lián)的“其他”因素(那個沒有注意到甚至沒有意識到的“亞馬遜蝴蝶”)。但是,限于傳統(tǒng)的專業(yè)訓(xùn)練以及相應(yīng)的認知坐標(biāo)系,限于檢索文獻或跟蹤業(yè)內(nèi)同行的習(xí)慣方法,我們往往很難“觀察到”不熟悉但相關(guān)的領(lǐng)域,更難把握它們之間的復(fù)雜結(jié)構(gòu)和相互影響,往往難以發(fā)現(xiàn)隱藏在復(fù)雜關(guān)系下的正在積蓄顛覆性壓力的結(jié)構(gòu)化矛盾、可能的致變因素和潛在的發(fā)展趨勢。
圖1 《科學(xué)結(jié)構(gòu)地圖2012》封面
隨著科技信息和科學(xué)研究的數(shù)字化,科技創(chuàng)新中的各類知識對象,例如文獻、專利、機構(gòu)、人員、項目、設(shè)施、產(chǎn)品,幾乎全部信息化、數(shù)字化,形成反映科學(xué)活動的海量數(shù)據(jù)。人們逐步發(fā)展出利用這些數(shù)據(jù)來揭示大問題領(lǐng)域、大時間跨度、多維度關(guān)系上的科學(xué)結(jié)構(gòu),并將科學(xué)結(jié)構(gòu)作為對科學(xué)布局、相互作用及演變趨勢進行描述和分析的工具。起初,科學(xué)結(jié)構(gòu)工具依賴對科研機構(gòu)或科研產(chǎn)出(論文、專利等)的分類統(tǒng)計來描述,可以按領(lǐng)域類別、地域、項目投入或影響力的布局來展現(xiàn);后來,人們更多利用一些內(nèi)在指標(biāo)來揭示內(nèi)容關(guān)系,例如文獻共詞、作者共著、論文共引或共被引等,并發(fā)展出許多分析關(guān)聯(lián)強度、集聚效應(yīng)、關(guān)系性質(zhì)的方法。
在這些努力的推動下,“科學(xué)結(jié)構(gòu)”本身的作用也發(fā)生著重大變化。它不僅能夠幫助我們把握大問題尺度上和復(fù)雜融匯環(huán)境下的知識結(jié)構(gòu)和各種隱性關(guān)系,而且逐步幫助我們揭示演變趨勢、鑒別發(fā)展規(guī)律、挖掘結(jié)構(gòu)矛盾、發(fā)現(xiàn)影響因子和潛在合作對象等。在動態(tài)的和可視化的試驗與演繹基礎(chǔ)上,可支持科學(xué)發(fā)展的預(yù)警和優(yōu)先領(lǐng)域的遴選。這樣,科學(xué)結(jié)構(gòu)地圖本身就成為研究科學(xué)發(fā)展的工具,成為探索甚至試驗科學(xué)發(fā)展趨勢工具。
《科學(xué)結(jié)構(gòu)地圖2009》和《科學(xué)結(jié)構(gòu)地圖2012》主要利用科學(xué)論文同被引關(guān)系分析和描述科學(xué)結(jié)構(gòu)地圖,并運用復(fù)雜網(wǎng)絡(luò)分析法、社會網(wǎng)絡(luò)分析法輔助確定重點研究領(lǐng)域和合作競爭趨勢。
論文引證是科學(xué)家信息交流的直接表現(xiàn),客觀體現(xiàn)了知識的相互作用及其流動、融匯和演變。同被引是指一組論文共同被其他論文引用,反映了這組在學(xué)科分類、發(fā)表期刊、作者機構(gòu)、項目甚至主題詞等方面看似毫無關(guān)聯(lián)的論文可能存在著某種關(guān)系,而且這種關(guān)系隨著這組論文同時被其他論文引用的次數(shù)逐漸增加而不斷被證實和加強。因此,同被引現(xiàn)象反映了科研內(nèi)容和科研活動的聚合過程和聚合關(guān)系,反映了科學(xué)知識結(jié)構(gòu)的演變與自組織,可以超越傳統(tǒng)的分類方法來了解科學(xué)結(jié)構(gòu)及其變化。日本科技政策研究所(NISTEP)從2002年起,利用同被引分析每兩年制作一次科學(xué)地圖,應(yīng)用到日本各次技術(shù)預(yù)見活動中;SciTech Strategies公司也開始提供商業(yè)化的科學(xué)地圖分析服務(wù)。我們以《科學(xué)結(jié)構(gòu)地圖2012》為例,說明科學(xué)結(jié)構(gòu)地圖的主要應(yīng)用。
通過表征科學(xué)知識流動的論文引證及其聚合關(guān)系揭示科學(xué)知識結(jié)構(gòu)。該工作以湯森路透科技集團的基本科學(xué)指標(biāo)庫(ESI)為信息源,提取了從2004年1月至2010年4月的按學(xué)科分類的8529個研究前沿,對這些研究前沿內(nèi)的高被引論文進行同被引分析,生成了由同被引關(guān)系內(nèi)在關(guān)聯(lián)起來的各個高被引論文簇所代表的132個研究領(lǐng)域,并根據(jù)它們之間的關(guān)聯(lián)關(guān)系繪制了整個科學(xué)結(jié)構(gòu)地圖(圖2)。同時,通過對論文簇關(guān)鍵詞的分析以及領(lǐng)域?qū)<业呐凶x,確定了這些“隱性”研究領(lǐng)域的名稱及內(nèi)涵。課題組還分析了《科學(xué)結(jié)構(gòu)地圖2009》和《科學(xué)結(jié)構(gòu)地圖2012》的動態(tài)變化,利用課題組開發(fā)的多時間窗聚類結(jié)果演化分析方法,判斷兩個不同結(jié)構(gòu)中不同聚類之間的重疊演變情況,鑒別相關(guān)聚類(領(lǐng)域)的產(chǎn)生、消失、延續(xù)、分化、合并,體現(xiàn)了知識進化理論中的知識“遺傳繼承”現(xiàn)象,揭示科學(xué)知識演化趨勢。
圖2 科學(xué)結(jié)構(gòu)地圖
通過結(jié)構(gòu)關(guān)系及其變化揭示熱點或潛在熱點領(lǐng)域。熱點或潛在熱點領(lǐng)域一直是科技界和科技決策者關(guān)心的重要問題,《科學(xué)結(jié)構(gòu)地圖》系列專著利用多種方法來遴選熱點或潛在熱點。最直接的方法是找出那些論文被引頻次及其年均增長率高于整體平均值的“熱點”研究前沿和包含“熱點”研究前沿數(shù)量超過整體平均分布的“熱點”研究領(lǐng)域。但是,僅僅依靠當(dāng)前活動頻次不足以發(fā)現(xiàn)“潛在”的熱點領(lǐng)域,課題組又引入了“樞紐研究領(lǐng)域”來幫助辨別某個領(lǐng)域?qū)ζ渌I(lǐng)域的作用力度。樞紐研究領(lǐng)域是指那些在其他研究領(lǐng)域間(尤其是在多個跨學(xué)科的研究領(lǐng)域間)起著知識關(guān)聯(lián)橋梁作用的領(lǐng)域,一方面通過研究領(lǐng)域的中介中心性(可簡要表示為通過該研究領(lǐng)域的最短關(guān)聯(lián)路徑數(shù))來表示,另一方面通過計算所連接的其他領(lǐng)域的學(xué)科關(guān)聯(lián)數(shù)(可簡要表示為被同被引連接的其他領(lǐng)域分屬的學(xué)科數(shù)量)來計算,那些中介中間性和學(xué)科關(guān)聯(lián)數(shù)都居于前20%的研究領(lǐng)域就是樞紐研究領(lǐng)域。
通過學(xué)科多樣性和網(wǎng)絡(luò)凝聚性揭示知識整合的廣度和強度。研究領(lǐng)域的學(xué)科交叉性體現(xiàn)了認知的異質(zhì)性、研究的多樣化,可以通過分析研究領(lǐng)域核心論文所屬不同學(xué)科數(shù)量、分布均衡度和學(xué)科相似性3個方面來描述研究領(lǐng)域的學(xué)科異質(zhì)性。研究領(lǐng)域的網(wǎng)絡(luò)凝聚性描述研究領(lǐng)域的論文關(guān)聯(lián)網(wǎng)絡(luò)的主題相似度和結(jié)構(gòu)緊密度,反映該領(lǐng)域的知識整合程度,可通過同被引關(guān)系網(wǎng)絡(luò)的平均鏈接強度來表示。我們利用學(xué)科多樣性和網(wǎng)絡(luò)凝聚性(圖3)兩個維度來反映學(xué)科交叉的程度以及潛在的知識整合能力,并通過形象的方式來展示各個研究領(lǐng)域的所屬學(xué)科、是否為交叉領(lǐng)域以及各學(xué)科、各研究領(lǐng)域知識整合的廣度和強度。
圖3 交叉領(lǐng)域的學(xué)科多樣性和網(wǎng)絡(luò)凝聚性分布
通過國家科學(xué)研究的結(jié)構(gòu)和相互關(guān)系揭示知識合作與競爭趨勢。各國在各研究領(lǐng)域中有不同的投入、成果和影響,可以反映國家在不同領(lǐng)域的相對優(yōu)勢。該系列專著通過不同國家在研究大類和研究領(lǐng)域中的核心論文份額與施引論文份額來表現(xiàn)這些國家的研究活躍程度,列出了世界前30個國家在整個科學(xué)研究以及粒子物理與宇宙學(xué)、凝聚態(tài)物理、納米科技、合成與應(yīng)用化學(xué)、地球科學(xué)、生物學(xué)、醫(yī)學(xué)等研究大類中的活躍程度;還根據(jù)在各個研究領(lǐng)域是否有高被引科研論文、這些高被引科研論文比例是否高于世界均值,描述了中國(圖4)、美國、英國、德國、法國、日本、澳大利亞、韓國、俄羅斯、印度、巴西、南非在上述研究領(lǐng)域的相對活躍程度及其變化趨勢。《科學(xué)結(jié)構(gòu)地圖2012》描述了代表性國家在全部核心論文中的國際合著率,反映國際合作的總體趨勢;進一步地,描述了代表性國家在科學(xué)結(jié)構(gòu)地圖中各個研究領(lǐng)域的國際合著率及其變化。將國家在各個領(lǐng)域的核心論文數(shù)和國際合著率結(jié)合起來,將其與國際平均值比較,可以發(fā)現(xiàn)哪些核心論文數(shù)高于平均值但國際合著率低于平均值的國家(自主創(chuàng)新強但國際依賴性低)和哪些核心論文數(shù)低于平均值但國際合著率高于平均值的國家(自主創(chuàng)新能力可能較弱,國際依賴性較強);還新增了機構(gòu)合著網(wǎng)絡(luò)分析,從更微觀的角度展現(xiàn)科學(xué)研究合作的特征。
圖4 中國核心論文和施引論文
目前科學(xué)結(jié)構(gòu)地圖相關(guān)工作僅僅是對科學(xué)結(jié)構(gòu)分析能力的初步應(yīng)用。如前文所述,《科學(xué)結(jié)構(gòu)地圖》可以作為深入研究科學(xué)發(fā)展趨勢的工具,幫助我們揭示規(guī)律、發(fā)現(xiàn)矛盾、預(yù)警演變、發(fā)掘重要影響因子、發(fā)掘潛在合作對象等。除進一步解決大數(shù)據(jù)量、稀疏關(guān)系和大跨度間接連接等影響全科學(xué)空間分析精度和效率的問題,支持全譜段多層級貫通分析外,我們還將科學(xué)結(jié)構(gòu)地圖工具化,從靜態(tài)、獨立的分析發(fā)展到動態(tài)、關(guān)聯(lián)的分析,從描述性分析深入到解釋性、揭示性、評價性應(yīng)用。
所謂科學(xué)結(jié)構(gòu)的動態(tài)性關(guān)聯(lián)化分析,包括兩個方面的動態(tài)展開。一方面,將多年度科學(xué)結(jié)構(gòu)地圖關(guān)聯(lián)起來進行分析,著重考察科學(xué)結(jié)構(gòu)的演變趨勢,考察在這些演變當(dāng)中的趨勢以及突變、異變、阻滯等現(xiàn)象,分析這些現(xiàn)象背后的影響因素,揭示科學(xué)發(fā)展中的規(guī)律。另一方面,突破目前科學(xué)結(jié)構(gòu)地圖利用引文數(shù)據(jù)所導(dǎo)致的相對滯后影響,將依據(jù)過去引文數(shù)據(jù)的科學(xué)結(jié)構(gòu)地圖與當(dāng)前論文產(chǎn)出分析結(jié)合起來,考察科學(xué)結(jié)構(gòu)的現(xiàn)期變化;可以將科學(xué)結(jié)構(gòu)地圖與當(dāng)前科研項目分析結(jié)合起來,考察科學(xué)研究產(chǎn)出結(jié)構(gòu)與科學(xué)研究投入結(jié)構(gòu)的關(guān)系;還可將科學(xué)結(jié)構(gòu)地圖與基于專利的技術(shù)結(jié)構(gòu)分析結(jié)合起來,考察科研成果轉(zhuǎn)移轉(zhuǎn)化的趨勢和問題;這樣,更深入和更全面地反映科技結(jié)構(gòu)變化,探查各方面因素的影響。
所謂科學(xué)結(jié)構(gòu)的解釋性、揭示性分析,是希望《科學(xué)結(jié)構(gòu)地圖》不僅能幫助我們看到是什么,還幫助我們回答為什么。例如,當(dāng)我們發(fā)現(xiàn)科學(xué)領(lǐng)域發(fā)生、分化或重合時,我們希望鑒別引起、推動這些變化的深層因素,而這些“推動”因素可能是某個新概念、新方法、新工具、新的應(yīng)用場景、新的參加機構(gòu)或人員等。《科學(xué)結(jié)構(gòu)地圖》所依據(jù)的文獻內(nèi)容中已經(jīng)包含了這些信息,如何挖掘和描述這些信息,如何分析判斷這些因素對于科學(xué)結(jié)構(gòu)中各個領(lǐng)域及其關(guān)系的作用性質(zhì),對我們發(fā)現(xiàn)甚至預(yù)警“推動”因素及其導(dǎo)致或可能導(dǎo)致的變化,都非常重要。在科學(xué)結(jié)構(gòu)的評價性分析上,希望能在目前的按照產(chǎn)出情況及其影響力進行基本水平評價的基礎(chǔ)上,嘗試根據(jù)各個研究領(lǐng)域的產(chǎn)出與影響差異性,根據(jù)在科學(xué)結(jié)構(gòu)中引領(lǐng)新領(lǐng)域、引領(lǐng)新合作的能力,來評價國家和機構(gòu)的科學(xué)競爭力和發(fā)展?jié)摿Γ⑴c其他分析方法結(jié)合嘗試未來突破性和未來競爭力的評價。
當(dāng)然,《科學(xué)結(jié)構(gòu)地圖》作為一種數(shù)據(jù)密集型研究工具,我們對它的了解和應(yīng)用剛剛起步。未來,它將是一個開放的科學(xué)結(jié)構(gòu)地圖知識服務(wù)平臺,連接描述科學(xué)技術(shù)各個環(huán)節(jié)的各種海量數(shù)據(jù),連接多元化的需求、方法與工具,形成科學(xué)結(jié)構(gòu)、科學(xué)發(fā)展趨勢的分析、探索、試驗和預(yù)警能力。