楊新涯 文佩丹
(1. 重慶大學圖書館,重慶 400044;2. 重慶大學人文社會科學高等研究院,重慶 400044)
“數(shù)字人文”(Digital Humanities)就是利用計算機及其相關(guān)技術(shù),以更加直觀和可視化的形式來創(chuàng)新傳統(tǒng)紙質(zhì)文獻、音視頻等研究內(nèi)容和方法[1-2]。近年來,隨著人工智能、大數(shù)據(jù)等技術(shù)的不斷發(fā)展,數(shù)字人文越來越凸顯出其在人文研究、新文科發(fā)展方面的優(yōu)勢,進而成為新的研究熱點,鑒于此,圖檔博領(lǐng)域也開始關(guān)注數(shù)字人文及其與數(shù)字人文的關(guān)系,并逐漸開展相關(guān)研究和實踐。圖書館特別是高校圖書館作為支持科學研究的重要機構(gòu),在數(shù)字人文時代如何更好地幫助學者高效、深入地開展人文研究,體現(xiàn)其在支撐學科發(fā)展中的擔當和作為,是當前值得探討和研究的重要內(nèi)容。筆者認為,圖書館在數(shù)字人文中發(fā)揮作用,首先就要明確圖書館在其中的角色定位,進而才能以角色為核心,看到問題和差距,并展開相關(guān)服務(wù)。
對于數(shù)字人文的研究,目前圖書館和圖書館人的視角重點聚焦在以下方面。
(1)國內(nèi)外圖書館數(shù)字人文發(fā)展現(xiàn)狀及趨勢研究。吳麗萍[3]以《我國圖書館數(shù)字人文研究現(xiàn)狀及展望》為題,總結(jié)了我國圖書館數(shù)字人文的研究主題,并在研究展望中指出關(guān)注圖書館數(shù)字人文的角色和功能研究。尚曉倩[4]以《歐洲研究型圖書館數(shù)字人文發(fā)展現(xiàn)狀及啟示》為題進行研究,通過組建工作組對歐洲研究型圖書館協(xié)會(Association of European Research Libraries)開展有關(guān)圖書館數(shù)字人文發(fā)展狀況的問卷調(diào)查,基于調(diào)查結(jié)果總結(jié)出歐洲研究型圖書館數(shù)字人文發(fā)展特點及對我國圖書館開展數(shù)字人文工作的啟示,在啟示中指出找準定位,促進數(shù)字人文活動價值最大化的觀點。胡靜等[5]對國內(nèi)外數(shù)字人文研究進行對比分析,總結(jié)國內(nèi)圖書情報領(lǐng)域數(shù)字人文研究的特征和不足,提出我國研究的努力方向。
(2)國外高校數(shù)字人文項目分析。其中,比較典型的包括對加拿大[6]、美國[7-9]等高校數(shù)字人文項目的研究。通過分析,普遍認為我國數(shù)字人文實踐還處于起步階段,與國外數(shù)字人文研究存在較大差距,國外的數(shù)字人文項目可為我國數(shù)字人文實踐提供參考和借鑒。
(3)數(shù)字人文平臺等基礎(chǔ)設(shè)施的構(gòu)建研究。主要包括對圖像庫[10]、手稿特色資源庫[11]、語義支撐平臺[12]等的構(gòu)建研究。通過對數(shù)字人文技術(shù)體系和研究工具的構(gòu)建,部分圖書館也逐漸有了一些數(shù)字人文的實踐案例,如上海圖書館的“上海年華”等。
也有少量關(guān)于圖書館在數(shù)字人文中角色定位或發(fā)展策略的研究。其中具有代表性的如李如鵬[13]對數(shù)字人文下圖書館的角色進行探討,認為在數(shù)字人文項目中,圖書館可為學者和技術(shù)專家搭建溝通平臺,在數(shù)字人文參與者中間具有協(xié)調(diào)的獨特作用;朱娜[14]對數(shù)字人文的興起及圖書館的角色進行研究,提出圖書館在數(shù)字人文研究和實踐中可扮演資源提供者、內(nèi)容策展人、學科聯(lián)絡(luò)員、課程輔導員、咨詢顧問與研究空間提供者等角色;汪莉[15]指出數(shù)字人文需要的不是支持者和服務(wù)者,而是合作者,圖書館需要在新的學術(shù)環(huán)境中重新定位圖書館學術(shù)角色。
從以上文獻調(diào)研可以看出,數(shù)字人文的確已經(jīng)得到國內(nèi)圖書館界的廣泛關(guān)注,但是相關(guān)研究和實踐均處于初始狀態(tài),圖書館人正積極對數(shù)字人文特別是國外數(shù)字人文的發(fā)展趨勢和項目管理進行分析和探索,以從中找到圖書館在數(shù)字人文中的定位和發(fā)展路徑。
對于圖書館學科來講,數(shù)字人文其實并不陌生。筆者認為,數(shù)字人文的核心是計算科學,即對海量的文獻進行數(shù)據(jù)化后,采用人文學科的方法論進行數(shù)據(jù)處理和研究。從這一點上講,圖書館其實早已開展類似的工作,如利用文獻開展深度的情報挖掘,Web of Science、Scopus、Scival、ESI、InCites、DLL等平臺和工具,利用引文、核心期刊評價體系等進行數(shù)據(jù)計算與數(shù)據(jù)分析,都可視為圖書館學科的數(shù)字人文基礎(chǔ)。
以近兩年備受推崇的Elsevier公司的SciVal分析平臺為例,利用主題詞方法,將全球科研內(nèi)容聚類為10萬個主題,并以這10萬個主題為基礎(chǔ),將某一研究領(lǐng)域或?qū)W科的文獻增長和衰減趨勢繪制成一個氣泡圖。如筆者利用該平臺對材料學科進行分析,近5年材料科學的主題共計13 686個,從氣泡圖中進一步分析可知,中國材料科學的研究偏向于與化學化工相關(guān)的方向,而美國除化工之外,更偏向于與生物學方向的交叉。
同時,進一步對重慶大學材料學科的研究主題進行分析,全球材料學主要研究領(lǐng)域的主題詞共計3 779個,其中重慶大學參與的共計407個(不含僅有1~2篇研究成果的主題)。根據(jù)重慶大學的參與程度和主題的前沿性,將407個主題進行劃分和組合,如圖1所示,可以清晰地看出重慶大學材料學科研究主題與前沿主題的對應(yīng)關(guān)系,從而幫助學校和學科找到自身在研究熱點和冷點中的地位,為學校和學科發(fā)展提供可靠的數(shù)據(jù)依據(jù)。
圖1 重慶大學材料科學研究情況
筆者認為,圖書館在數(shù)字人文的發(fā)展中主要扮演著兩個角色,這兩個角色是基于圖書館和人文學者之間的分工產(chǎn)生的。第一個角色叫“我負責食材,你負責灶臺”,第二個角色叫“我負責數(shù)據(jù),你負責模型”。
圖書館一定要盡可能地收集學者所需要的文獻資源,并且把資源進行數(shù)據(jù)化,這是數(shù)字人文研究最核心的問題。對于圖書館來說,最艱難也最重要的事情是數(shù)字文獻資源的整理,即將所有紙質(zhì)文獻和電子文獻以元數(shù)據(jù)的形式錄入,并且在元數(shù)據(jù)的基礎(chǔ)上進行必要的資源組織,以便應(yīng)用于人文學者的研究。
資源是圖書館開展科研服務(wù)的基礎(chǔ)和根本,在數(shù)字人文時代,僅擁有資源顯然不夠,將資源進行數(shù)據(jù)化才是關(guān)鍵,這也是圖書館應(yīng)該做的最基礎(chǔ)的工作。可以形象地把圖書館的文獻資源比喻為沙漠,文獻中的每一個知識點或關(guān)鍵詞就是遼闊沙漠中的一粒沙子。圖書館應(yīng)該思考如何將細小的知識點抽取出來,并進行數(shù)據(jù)化;而怎么治沙,怎么對知識點進行分割和組合以及怎么應(yīng)用知識點做更深層次的研究,都是學者的任務(wù)。
基于以上兩個基本角色,在數(shù)字人文背景下,圖書館還需要實現(xiàn)一個角色的轉(zhuǎn)變,即一定要從資源服務(wù)體系變?yōu)閿?shù)據(jù)服務(wù)體系,而且要構(gòu)建圖書館的“數(shù)據(jù)生產(chǎn)體系”。如圖2所示,數(shù)據(jù)生產(chǎn)體系主要包括學術(shù)數(shù)據(jù)(含文獻資源數(shù)據(jù))、事實數(shù)據(jù)、用戶數(shù)據(jù)、用戶行為數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù),另外還可包括來自互聯(lián)網(wǎng)的數(shù)據(jù)等。
圖2 圖書館的數(shù)據(jù)生產(chǎn)體系
在明確圖書館數(shù)字人文角色的基礎(chǔ)上,梳理重慶大學圖書館已經(jīng)開展的相關(guān)工作和實踐,一方面,了解目前圖書館在數(shù)字人文發(fā)展中的大致進展;另一方面,也希望能為未來圖書館深化數(shù)字人文研究和服務(wù)提供更多思路和方向。
重慶大學圖書館于2016年9月開始自主研發(fā)“全流程電子資源管理系統(tǒng)”,系統(tǒng)采用圖書館學的思想和方法,具有完整的分類和著錄等流程,將采購流程、元數(shù)據(jù)管理、網(wǎng)絡(luò)服務(wù)、利用服務(wù)全部納入規(guī)范管理。以該系統(tǒng)為依托,重慶大學圖書館分批分次將所購買的全部文獻資源書目數(shù)據(jù)進行數(shù)據(jù)化,目前“紙本+電子”文獻元數(shù)據(jù)已達2.2億條,其中期刊文獻共計165 614 527條,占比78.7%;圖書共計8 117 789條,占比3.9%;其他如專利、會議、學位論文等共計36 517 740條,占比17.4%。
情報與智庫服務(wù)也是研究的重點。重慶大學圖書館在這方面已經(jīng)構(gòu)建了一整套服務(wù)體系,包括以資源庫的角色服務(wù)讀者,以情報員的角色服務(wù)院系和團隊,以及以智庫的角色服務(wù)學校決策者和管理者。
針對不同類型的讀者,開展精準推送。如對于研究型讀者,推送科技查新、查收查引、科研動態(tài)和基于AI的學術(shù)頭條等;對于學習型讀者,開展基于用戶畫像的文獻資源情報推送;對于非讀者,則進行文獻服務(wù)動態(tài)推送。對院系和研究團隊,圖書館扮演積極參與的情報員。針對院系決策者,圖書館開展機構(gòu)科研產(chǎn)出報告、研究團隊發(fā)展態(tài)勢與影響力以及競爭對標等各類情報服務(wù);針對學科與團隊負責人,圖書館提供學術(shù)熱點和冷點分析報告、學科前沿報告、重大(重點)項目定題以及知識產(chǎn)權(quán)(培訓、專利導航)等服務(wù)。對于學校決策者,圖書館又扮演智庫的角色。針對職能部門,圖書館提供各學科和團隊的科研產(chǎn)出報告、人才評估報告等;針對學校領(lǐng)導,圖書館提供全球研究態(tài)勢情報、國際對標情報、學科貢獻度分析報告以及學術(shù)影響力分析報告等。
在實踐過程中,圖書館還存在兩個較大的問題,一是忽視數(shù)字特藏建設(shè),二是嚴重缺乏圖像、音視頻等多媒體資源。這兩個問題,重慶大學圖書館都計劃在“十四五”期間解決。
(1)忽視數(shù)字特藏建設(shè)。數(shù)字特藏,筆者認為既可以是獨有的數(shù)字館藏,如拍一張獨一無二的照片并進入館藏;也可以是獨有館藏的數(shù)字化,如將中山大學的徽州文書、上海圖書館的家譜進行數(shù)字化等。身處數(shù)字時代,我們正在錯過很多資源,如曾經(jīng)流行的軟盤、膠卷、隨身聽、傳真機、Mp3等,都是從我們經(jīng)常使用到現(xiàn)在逐步消失。筆者于2018年參觀國立維多利亞與亞伯特博物館(Victoria & Albert Museum),發(fā)現(xiàn)2011年推出的微信表情包已經(jīng)進入博物館。而反思圖書館過去的資源體系,大多采用商業(yè)采購的方式獲取,卻一直在忽略我們身邊的數(shù)字環(huán)境及其產(chǎn)物的收藏和整理。這些獨特的資源隨著時間的推移,都可能會成為人文學者研究當時社會變遷或時代發(fā)展的重要素材。因此,作為保留社會記憶、人類記憶的圖書館,亟需重新審視數(shù)字特藏建設(shè)的重要性。
(2)多媒體文獻資源缺失。如華為技術(shù)有限公司創(chuàng)始人任正非,1963年就讀于重慶建筑工程學院(已并入重慶大學),于1968年畢業(yè)離校,整理歷史資料,發(fā)現(xiàn)留存的關(guān)于他當年在學校的學習生活的多媒體資源非常少。又如,城中村、地方文化的消失和城市歷史的變遷,導致傳承地域文化的聲音或影像逐步消失。這些正在消失的資源都是開展數(shù)字人文研究的重要基礎(chǔ)。對于圖書館來講,聲音文獻如何保存?珍貴電子文件私密存儲卻無處典藏?學者人類學、社會學研究的第一手資料從哪里獲???這些問題都值得思考和探討。
上述這些問題,雖然僅是作為一個學術(shù)的假設(shè)提出,但事實上,如果圖書館繼續(xù)忽略數(shù)字特藏建設(shè),不能構(gòu)建起完整的資源體系,可能真的難以支撐數(shù)字人文的研究。
(1)持續(xù)開展數(shù)據(jù)收割。重慶大學圖書館用了3年時間積累了接近3億條數(shù)據(jù)(含運行數(shù)據(jù)),并且在“十四五”期間還會持續(xù)致力于知識基礎(chǔ)設(shè)施體系的建設(shè)。包括數(shù)據(jù)標準、基礎(chǔ)知識庫、人名庫、機構(gòu)庫、學術(shù)關(guān)鍵詞庫的建設(shè),以及基于數(shù)據(jù)標準和數(shù)據(jù)庫建立關(guān)聯(lián)數(shù)據(jù)和知識圖譜等。同時,也將嘗試進行文獻的全文數(shù)據(jù)化。這些都是圖書館未來努力的方向,將有助于支撐數(shù)字人文的研究。
(2)加強數(shù)字特藏建設(shè)。重慶大學圖書館已經(jīng)啟動重慶大學數(shù)字記憶項目,在“十四五”期間,將全面收集重慶大學自1929年建校以來的所有文獻、圖片、聲音和各類檔案,并進行深度標引和展示,從而構(gòu)建起一個完整的采購、收藏和服務(wù)生態(tài)體系。
(3)進一步深化學科支持。在學科支持方面,主題方法是圖書館行業(yè)長期使用的,但目前的學科分析平臺和工具,其數(shù)據(jù)分析普遍基于外文核心期刊,圖書館可以構(gòu)建一個基于所有文獻的全文主題詞抽取模型,優(yōu)化分析策略。同時,還可基于數(shù)據(jù)構(gòu)建場景化的科研和決策支持體系,如提供學科科研動態(tài)、博碩士選題、投稿引導、精準人才引進、學者績效全方位評價、學科評估、競爭情報、學科趨勢等全方位的數(shù)字化服務(wù),只有這樣才能真正實現(xiàn)圖書館“望遠鏡+顯微鏡”的功能。
通過以上3個方面的努力,圖書館將會構(gòu)建起更完整的資源體系,提供更豐富的數(shù)據(jù)化文獻,學者將可運用資源的元數(shù)據(jù)去開展更多科學研究,并且免去傳統(tǒng)手工、煩瑣的資料收集和整理工作,提升科研效率和準確性。數(shù)字人文研究和實踐,是智慧圖書館建設(shè)的重要內(nèi)容,甚至是其中一個全新的篇章。圖書館將通過不斷探索和實踐,逐漸認清自身的角色、找到合適的發(fā)展路徑、順應(yīng)數(shù)字人文發(fā)展潮流,落實和踐行“文獻支撐”的宗旨,最大程度助力科學研究和學科創(chuàng)新發(fā)展。