蘇芳荔 常人杰
數字人文,是對人文學科與計算之間的重合地帶進行研究、創(chuàng)新的領域[1]26。從20世紀80年代初開始到20世紀末獲得較快發(fā)展,主要集中在文本分析與編目、語言特征、教學支持和學習環(huán)境、結構化數據分析的影響等方面[2]190,如將古典文學資料轉為數字形式的珀爾修斯項目、提出了文獻在文化歷史學家工作中的角色問題的暗影之谷(The Valley of The Shadow)項目等[3]55。數字人文的研究為人文學科提供新的視角,產生新的問題并進行解答。數字人文研究所涉及的領域較多,在研究對象方面也呈現著多學科特征。
知識的產生與傳承離不開知識擴散,同時,知識擴散還可以促進知識創(chuàng)新?,F在,我們處在互聯(lián)網時代,信息需求量旺盛,所接觸的數據大部分都來自于各種網站與數據庫,可供選擇的數據源較多且獲取方便。對于大量的信息需求,研究知識擴散的規(guī)律可以幫助降低獲取知識的成本,并大大提高效率。引用關系即代表知識擴散[4]31。 “ 基于引文的知識擴散 ” 是指知識在研究性文獻中的轉移[5]13。也有學者的研究把知識擴散分為組織知識擴散和學科知識擴散[6]48??傮w而言,知識擴散可以幫助學科的知識傳承并且還可以幫助學科創(chuàng)新。
1.數據選擇與獲取。Web of Science 是世界上最廣泛的學術信息資源數據庫,包括在各個研究領域影響力最大的核心學術期刊。以Web of Science 上2009—2018年收錄的有關數字人文的文獻為對象,從引文分析角度,對數字人文領域跨學科知識擴散的現狀進行分析研究。
本研究選取Web of Science 核心合集為研究數據庫,在主題字段中以 “ digital humanity ” or “ digital humanities ” 作為主題詞進行檢索,文獻類型限定為 “ article ” ,時間范圍限定為2009—2018,索引數據庫包括SCI-EXPANDED、SSCI、A&HCI、CPCI-S、CPCI-SSH、BKCI-S、BKCI-SSH、ESCI、CCR-EXPANDED、IC。共獲得1710條文獻數據,對檢索所得文獻記錄進行下載,保存為原始文獻集。原始文獻總計被引6246 次,篇均被引3.65次,施引文獻共4775 篇。打開原始文獻檢索結果頁面引文分析中的施引文獻記錄,對施引文獻記錄進行下載,定義為施引文獻集。
2.知識擴散指標。被引頻次受時間因素影響較大,在進行知識擴散分析時還需要考慮到時間因素的影響。知識擴散指標包括知識擴散廣度、知識擴散強度與知識擴散速度。
(1)知識擴散廣度(KDB)。廣度值是指某一領域文獻被引用總次數與統(tǒng)計時間段內的年數的比值。公式為:
Ni為統(tǒng)計時間內的被引總數,Ypub表示從統(tǒng)計起點到終點的年數。學科的知識擴散是一個逐漸積累上升的一個過程,累積擴散廣度KDB*反映了一個學科知識擴散的累積狀況,其計算公式如下:
其中Ni為第i年的被引次數。該指標能夠更好地反映出學科知識擴散廣度的積累發(fā)展情況,根據公式計算得到數字人文領域的累積擴散廣度KDB*。
(2)知識擴散強度(KDI)。A 學科被B 學科引用的數量除以總被引次數叫做A 學科對B 學科的知識擴散強度,簡稱KDI,其計算公式為:
其中Ni為A 學科被B 學科引用的數量,∑Ni為A學科的總被引次數。
(3)知識擴散速度(KDS)。知識擴散速度(KDS)的計算公式為:
其中,Pcit表示不同引用期刊總數,Ypub表示從統(tǒng)計起點到終點的年數。
1.跨學科知識擴散分布。數字人文領域擴散學科中,圖書情報學、計算機科學等占有較大比重,學科擴散速度越來越快,擴散學科越來越多,擴散多樣性好。學科交叉融合背景下,學科的邊界正在逐漸被打破,通過互相合作實現學科間互利共贏、知識創(chuàng)新和優(yōu)勢互補,學科間的互相滲透能夠細分出更多的交叉學科,實現學科的發(fā)展。學科知識的擴散不僅能通過合作等方式達成,也能通過引用和被引達成。一個學科通過引用其他學科的知識來發(fā)展自己的研究。數字人文知識擴散次數最多的學科多屬于人文與社會科學領域,圖書情報學對數字人文知識的吸收為19.23%,是最大的知識吸收學科,遠遠高于排在第二位的人文計算(374 次,9.58%),在知識擴散接收方中占據核心地位。2009—2018年,數字人文領域文獻共被201 個學科引用,我國圖書情報學學科交叉能力快速增長,但綜合影響力仍然有限。
2.知識擴散測度。
(1)知識擴散廣度(KDB)分析。知識擴散廣度是從范圍的角度對科研領域的知識擴散進行描述,指某一學科領域文獻的被引用次數除以年數的商。學科的知識擴散是一個逐漸積累上升的過程,累積擴散廣度KDB*是一個對于知識擴散的修正指標,反映了一個學科知識擴散的累積狀況。通過該指標能夠更好地反映出學科知識擴散廣度的積累發(fā)展情況,根據公式計算得到數字人文領域的累積擴散廣度KDB*。數字人文相關研究的年度知識擴散廣度如表1。
表1 數字人文領域逐年知識擴散廣度
可以看出,數字人文領域知識擴散廣度在十年間總體呈現上升趨勢,隨著大數據時代的到來,學科之間的知識交流增加,越來越多的學者開始關注數字人文與學科的融合。
(2)知識擴散強度(KDI)分析。知識擴散強度是從指定路徑上的頻次的角度對知識擴散進行描述,指定路徑上的擴散次數越多,知識擴散強度越大。Liu 和Rousseau 定義了 “ 學科擴散廣度 ” ,A 學科被B 學科引用次數與總被引次數的比值為A 學科對B 學科的知識擴散強度。知識擴散強度可以體現本學科對其他學科的影響程度,2009—2018 十年間數字人文領域知識在不同學科的擴散強度如表2 所示(見下頁)。
由表2 可知,受數字人文知識影響最大的學科是圖書情報學,擴散強度達到了0.120,其次為人文計算、教育研究。總體來看,數字人文知識對人文與社會科學領域學科的影響程度較大。值得注意的是,計算機相關學科雖然沒有排在擴散學科高位,但是計算機科學在數字人文領域知識擴散接收方中也占據著重要地位。
表2 數字人文領域知識擴散學科強度TOP20
(3)知識擴散速度(KDS)分析。知識擴散速度描述的角度是從單位時間內運動距離。對于擴散目標來說,所耗時間越短,擴散速度越快。知識擴散速度會影響到知識創(chuàng)新的進步,知識擴散的速度越快,會使知識共享與融合更加快捷和廣泛,降低知識創(chuàng)新成本,從而加速科技發(fā)展。2009—2018年數字人文領域1710 篇論文共被2025 個不同期刊引用。數字人文領域2009—2018十年間的知識擴散速度見表3。
表3 數字人文領域每年知識擴散速度
知識擴散的速度可以用來衡量知識發(fā)展的快慢。加快知識擴散的速度,可以有效減少可用知識流失。提高知識擴散的速度可以減少獲取知識所需的時間,提升知識利用效率。表3 表明,知識擴散速度整體呈明顯的逐年增長趨勢,知識擴散速度越快,代表數字人文領域知識的利用率越高。
主路徑是在某一領域的引文網絡中具有最高遍歷值的一條引文路徑,計算的是一篇文獻與其他文獻連接時的需要程度。主路徑分析方法可以幫助有效地識別領域的知識變化,是一種基于 “ 連通性 ” 降低知識網絡復雜程度,提取關鍵路徑的定量和可視化方法,對于探測技術發(fā)展路徑具有重要意義。
本文首先利用Histcite 中的Graph Maker 作圖分析功能,采用搜索路徑計數(SPC),識別出2009—2018年數字人文研究領域研究內容知識擴散的主路徑主要有三條且較獨立,包含12 個節(jié)點,大多處于知識擴散網絡的核心位置。知識擴散的過程中,新知識產生后隨著其不確定性的降低,知識接受者會先迅速增加然后逐漸下降,圖中知識擴散主路徑呈現由分散到聚合的趨勢,表明數字人文研究逐漸成熟,界定更加清晰,形成核心研究領域。三條主路徑的信息見表4、5、6(見下頁)。
路徑1:由數字人文研究的方法論到與歷史學科結合的 “ 數字歷史 ” 的變化。數字人文本就是一個數字技術在科學研究領域普及的背景下,人文學科開始使用快速發(fā)展的網絡技術來進行研究而發(fā)展起來的跨學科領域。由表4 中可以得出路徑1 的情況,原始數據時間段內,人文學科由如何與電子科學進行融合的方法論研究,數字化的趨勢愈演愈烈,研究者需要相應的工具來進行研究工作,開始注重實踐當中數字化研究的基礎設施的發(fā)展方向,然后開始關注領域發(fā)展出現的問題與爭議, “ 數字歷史 ” 受到關注。眾所周知,數字人文是一個文科與工科的交叉學科,其研究內容與范圍受技術發(fā)展的影響很大。從目前國際數字人文研究趨勢來看,基于GIS 的歷史地理可視化是數字人文目前所受關注較多的研究方向。
路徑2:由對數字人文領域學科的譜系研究到數字人文與圖書館的結合研究,與歷史學科結合的數字歷史的變化。該路徑早期對數字人文進行譜系研究,探討其發(fā)展等理論性研究,然后開始關注圖書館與數字人文研究之間進行融合的現實性研究。
路徑3:由數字人文對人文學科的影響到數字人文學科與人文學科、圖書館的結合。早期關注點仍然在于數字技術與人文學科的融合方面,擔心數字技術正在對人文學科產生不利的影響,然后開始關注數字人文是否能促進人文學科的發(fā)展以及數字人文與高等教育的關系,最后落腳點在圖書館與數字人文研究之間進行融合的現實性研究。
整體看來,數字人文領域的總趨勢是由對學科自身特點及發(fā)展趨勢等理論研究,發(fā)展為與學科進行融合發(fā)展的研究,如數字圖書館與數字歷史。從目前國際數字人文研究趨勢來看,數字圖書館、數字歷史都是數字人文研究前沿。
數字人文領域知識擴散跨學科性越來越顯著,到2018年已擴散至160 個學科。擴散速度也是呈明顯增長趨勢,呈現了活躍的知識擴散勢頭。數字人文領域知識擴散的路徑主要有三種趨勢,總趨勢是由對學科自身特點及發(fā)展趨勢等理論研究,發(fā)展為與學科進行融合發(fā)展的研究,如數字圖書館與數字歷史。從目前國際數字人文研究趨勢來看,數字圖書館、數字歷史(歷史地理可視化)都是數字人文研究前沿。數字人文領域的研究脈絡在不斷細分和深化,歷史學相關研究集中度較高,并有研究逐漸深化的趨勢。
表4 數字人文領域知識擴散路徑1
表5 數字人文領域知識擴散路徑2
表6 數字人文領域知識擴散路徑3