王秋云,龍 歡
(湖南圖書館,湖南 長沙 410000)
古籍?dāng)?shù)字化是指以古籍文獻(xiàn)保護(hù)與利用為主要目的,利用數(shù)字化掃描與輸入技術(shù)、OCR光學(xué)識別技術(shù)、字處理技術(shù)、網(wǎng)絡(luò)技術(shù)、智能化處理技術(shù)等現(xiàn)代信息技術(shù)對古籍進(jìn)行加工處理,使其轉(zhuǎn)換成計(jì)算機(jī)可識別的字符[1—3]。我國古籍?dāng)?shù)字化已經(jīng)歷了40余年的發(fā)展,在古籍?dāng)?shù)據(jù)庫建設(shè)、數(shù)字化技術(shù)等方面形成了大量的研究與實(shí)踐成果[3],有力地支撐著古籍的檢索、查詢、閱讀、標(biāo)注等需求。但隨著古籍研究需求的持續(xù)深化,傳統(tǒng)古籍?dāng)?shù)字化成果在助力古籍研究與利用等方面也暴露出一些不足。一是古籍文獻(xiàn)數(shù)字化深度不夠。以古籍保護(hù)為主要目的的影像古籍?dāng)?shù)字化產(chǎn)品仍占較高比例。根據(jù)相關(guān)統(tǒng)計(jì),我國現(xiàn)存古籍約20萬種,其中,利用掃描技術(shù)形成的影像古籍?dāng)?shù)字產(chǎn)品有8萬種,而文本數(shù)字化的古籍產(chǎn)品僅有3—4萬種[4—5]。影像古籍?dāng)?shù)字產(chǎn)品是古籍原件的電子化直接代替,難以支撐細(xì)粒度的全文檢索、主題檢索等高級檢索方式。二是當(dāng)前古籍?dāng)?shù)字化對古籍學(xué)術(shù)研究的支持力度不足。從古籍全文數(shù)據(jù)庫來看,仍以非結(jié)構(gòu)化數(shù)據(jù)存儲為主,以全文檢索為主要知識獲取方式,無法實(shí)現(xiàn)文本分析、規(guī)律發(fā)現(xiàn)與知識提取等古籍文獻(xiàn)深度挖掘與利用[6—8]。中國社會科學(xué)院教授鄭永曉曾指出:當(dāng)前古籍?dāng)?shù)據(jù)庫發(fā)展面臨的主要瓶頸是除全文檢索外,無法支撐學(xué)者完成其他工作[5,9]。三是古籍文獻(xiàn)內(nèi)容挖掘有待進(jìn)一步深入。目前,古籍?dāng)?shù)字化仍以古籍掃描、古籍文字識別與錄入技術(shù)研究為主,大數(shù)據(jù)技術(shù)、人工智能與古籍?dāng)?shù)字化深入融合的切入點(diǎn)并不明確[10—12]。
數(shù)字人文是在計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)科技普及的基礎(chǔ)上,以多媒體表達(dá)為輔助,借助各項(xiàng)新興技術(shù)支持開展的以人文學(xué)科為對象的新興領(lǐng)域,是對傳統(tǒng)人文學(xué)科在數(shù)據(jù)信息時代的自然延伸與不斷創(chuàng)新和發(fā)展[13]。從本質(zhì)上來講,數(shù)字人文是以新技術(shù)為手段,挖掘古籍、檔案、文獻(xiàn)等傳統(tǒng)資料中的新觀點(diǎn)或?qū)εf觀點(diǎn)的數(shù)據(jù)化驗(yàn)證。數(shù)字人文理論與技術(shù)融入古籍較早,此類研究最初體現(xiàn)在紅學(xué)研究領(lǐng)域。之后,古籍領(lǐng)域的研究者開始探索將數(shù)字人文的理論與技術(shù)應(yīng)用到古籍?dāng)?shù)字化工作中,延伸古籍文獻(xiàn)的價值[14—18]。為進(jìn)一步討論數(shù)字人文對我國古籍領(lǐng)域的意義與價值,筆者從古籍?dāng)?shù)字人文研究與實(shí)踐2個方面對古籍?dāng)?shù)字人文相關(guān)理論研究與建設(shè)實(shí)踐進(jìn)行系統(tǒng)梳理與分析。首先,從研究趨勢、研究影響力、合著情況以及研究主題等方面揭示我國古籍領(lǐng)域開展數(shù)字人文研究現(xiàn)狀及特點(diǎn);其次,結(jié)合古籍?dāng)?shù)字人文實(shí)踐,從建設(shè)理念、應(yīng)用技術(shù)、人才結(jié)構(gòu)與服務(wù)模式4個方面研判我國古籍領(lǐng)域開展數(shù)字人文的實(shí)踐特點(diǎn);再次,立足當(dāng)前古籍?dāng)?shù)字化工作開展情況,提出下一個階段古籍領(lǐng)域深化數(shù)字人文應(yīng)用的工作路徑。
當(dāng)前,部分研究學(xué)者從技術(shù)視角出發(fā),將古籍?dāng)?shù)字人文理解為古籍文本數(shù)據(jù)化、古籍?dāng)?shù)據(jù)的可視化,未體現(xiàn)數(shù)字人文對古籍研究的價值提升。為更加全面地揭示古籍?dāng)?shù)字人文的研究與實(shí)踐,本文將研究對象聚焦為應(yīng)用數(shù)字人文技術(shù),挖掘古籍文獻(xiàn)中新觀點(diǎn)或驗(yàn)證已有觀點(diǎn)的研究以及技術(shù)手段。筆者以中國知網(wǎng)為檢索數(shù)據(jù)源,設(shè)置檢索詞為“古籍”“數(shù)字人文”,采用組合檢索的方式,時間與應(yīng)用領(lǐng)域不限。獲取文獻(xiàn)后,對文獻(xiàn)的來源、內(nèi)容進(jìn)行分析,剔除不相關(guān)文獻(xiàn),最終獲得目標(biāo)文獻(xiàn)28篇。
研究文獻(xiàn)按時間分布可直接反映出該方向的發(fā)展趨勢(見圖1)。如圖1所示,古籍領(lǐng)域開展數(shù)字人文研究于2016年起步,雖然后續(xù)發(fā)展中有波動性下降,但整體呈現(xiàn)出明顯的上升趨勢。結(jié)合發(fā)文期刊、研究內(nèi)容等來看,一是古籍?dāng)?shù)字人文具有較強(qiáng)的發(fā)展?jié)摿?。古籍?dāng)?shù)字人文論文超過半數(shù)發(fā)表在《中國圖書館學(xué)報》《圖書情報工作》《圖書館學(xué)研究》等核心期刊上,反映出古籍?dāng)?shù)字人文雖然研究起步較晚,但表現(xiàn)出了一定的研究活力與研究潛力,形成了新的學(xué)術(shù)增長點(diǎn)。二是結(jié)合內(nèi)容分析,先前古籍?dāng)?shù)字化研究學(xué)者多關(guān)注古籍掃描、分詞、檢索等技術(shù),以古籍保護(hù)為主要目的。2016年后,部分研究逐漸從古籍?dāng)?shù)字化的視角中逐漸脫離出來,向利用數(shù)字人文挖掘古籍文獻(xiàn)價值的“增強(qiáng)古籍研究”階段邁進(jìn),值得更進(jìn)一步的關(guān)注。
圖1 古籍?dāng)?shù)字人文研究論文發(fā)表趨勢分析
論文被引數(shù)是指該論文被其他論文引用的次數(shù),可直接體現(xiàn)出論文的影響力。研究論文被引數(shù)對考察該領(lǐng)域的研究質(zhì)量和研究特點(diǎn)具有重要意義。筆者統(tǒng)計(jì)了古籍?dāng)?shù)字人文研究論文的總被引數(shù)、總下載數(shù)、篇均被引數(shù)、篇均下載數(shù)等指標(biāo),通過分析上述指標(biāo)考察古籍?dāng)?shù)字人文研究影響力。同時,表1將其與古籍?dāng)?shù)字化研究高被引論文(前200篇)的計(jì)量指標(biāo)進(jìn)行對比分析。
表1 古籍?dāng)?shù)字人文研究與古籍?dāng)?shù)字化研究論文計(jì)量指標(biāo)對比分析
一般來講,高被引論文影響力較高,研究時間較早。如表1所示,古籍?dāng)?shù)字人文研究相較于古籍?dāng)?shù)字化研究起步較晚,但卻在較短時間內(nèi)獲得了較高的影響力與關(guān)注度。從單篇論文來看,部分古籍?dāng)?shù)字人文研究論文雖發(fā)表時間不長,但被引數(shù)較高。例如,2013年范佳的《“數(shù)字人文”內(nèi)涵與古籍?dāng)?shù)字化的深度開發(fā)》[14]被引數(shù)為75次,下載數(shù)為3 131次,遠(yuǎn)高于古籍?dāng)?shù)字化研究論文的指標(biāo)值。從整體來看,古籍?dāng)?shù)字人文研究論文篇均被引數(shù)為11.96次,篇均下載數(shù)為1 038.57次,而古籍?dāng)?shù)字化研究論文的篇均被引數(shù)為1.16次,篇均下載數(shù)為214.41次。前者在篇均被引數(shù)、篇均下載數(shù)上均遠(yuǎn)遠(yuǎn)超過后者。這進(jìn)一步說明了古籍?dāng)?shù)字人文在較短時間內(nèi)產(chǎn)生了較大影響,并引起了廣泛的傳播。
論文合著研究是學(xué)科發(fā)展的必然趨勢,也是學(xué)科創(chuàng)新的重要路徑,分析研究人員的合作情況能夠了解學(xué)科發(fā)展的特征。目前,古籍?dāng)?shù)字人文研究學(xué)者分別來自武漢大學(xué)、四川大學(xué)、北京大學(xué)、中國社會科學(xué)院、南京農(nóng)業(yè)大學(xué)等研究機(jī)構(gòu)。通過利用合著關(guān)系繪制的合作網(wǎng)絡(luò)可以看出:一是目前古籍?dāng)?shù)字人文研究團(tuán)隊(duì)較為分散、獨(dú)立,跨地域、跨學(xué)科的合作研究較少;二是研究團(tuán)隊(duì)中研究者的專業(yè)背景較為多樣、復(fù)雜,反映出古籍?dāng)?shù)字人文研究技術(shù)性、數(shù)據(jù)性、交叉學(xué)科性等特點(diǎn)。
關(guān)鍵詞可體現(xiàn)學(xué)術(shù)論文的研究主題和核心內(nèi)容,通過匯總分析關(guān)鍵詞可管窺特定領(lǐng)域的研究內(nèi)容、研究熱點(diǎn)以及知識體系。結(jié)合中國知網(wǎng)的主題標(biāo)注、論文關(guān)鍵詞對古籍?dāng)?shù)字人文研究主題進(jìn)行分類匯總,形成表2。可以看出,我國古籍?dāng)?shù)字人文研究主要從三方面展開,分別為:傳統(tǒng)古籍?dāng)?shù)字化技術(shù)、古籍?dāng)?shù)據(jù)化技術(shù)以及古籍研究價值提升。研究對象分別為圖書館古籍?dāng)?shù)據(jù)、醫(yī)藥古籍、古代文學(xué)、方志古籍、歷史古籍以及檔案等內(nèi)容。
表2 研究方向以及子主題
隨著技術(shù)的進(jìn)一步發(fā)展,一些高校和研究機(jī)構(gòu)將信息技術(shù)進(jìn)一步應(yīng)用于古籍研究中,如對古籍文獻(xiàn)開展語義畫像、要素關(guān)聯(lián)、語義查詢等相關(guān)研究,并形成一系列實(shí)踐項(xiàng)目。本節(jié)以古籍?dāng)?shù)字人文實(shí)踐成果為切入點(diǎn),從實(shí)踐項(xiàng)目的建設(shè)理念、建設(shè)主體、應(yīng)用技術(shù)、人才結(jié)構(gòu)、研究機(jī)構(gòu)、服務(wù)模式等維度分析古籍?dāng)?shù)字人文的實(shí)踐特點(diǎn)[9,12,19—20]。
數(shù)字人文項(xiàng)目具有廣泛的歷史回溯性與深度關(guān)聯(lián)性。中國國家圖書館副館長、國家古籍保護(hù)中心副主任張志清曾指出:要活化古籍,需要建設(shè)涵蓋人、地、事、史、制度、典故、名物的知識網(wǎng)絡(luò),與當(dāng)今文化要緊密銜接。與傳統(tǒng)古籍?dāng)?shù)字化項(xiàng)目不同,古籍?dāng)?shù)字人文項(xiàng)目建設(shè)重點(diǎn)進(jìn)一步向古籍的文本內(nèi)容挖掘傾斜,研究對象從古籍的字詞層面分析,如文字識別、版本比對、特殊字符識別等,轉(zhuǎn)向?qū)浞ㄌ卣?、語義特征、語用特征進(jìn)行深度分析,關(guān)注點(diǎn)由外部特征向內(nèi)部特征轉(zhuǎn)變,旨在利用文本挖掘、自然語言處理、機(jī)器學(xué)習(xí)等技術(shù)實(shí)現(xiàn)古籍文本中的要素提取,并借助地理信息系統(tǒng)、知識圖譜、關(guān)聯(lián)數(shù)據(jù)等技術(shù)對古籍中的人物、事物等要素的互動關(guān)系、發(fā)展趨勢進(jìn)行可視化展示,發(fā)現(xiàn)特定時間段演變的內(nèi)在規(guī)律[1,8,11,14]。例如,清華大學(xué)唐杰AMiner團(tuán)隊(duì)的“半個世紀(jì)以來頂級學(xué)者遷徙”項(xiàng)目為1.3億研究者半個世紀(jì)以來的職業(yè)變化進(jìn)行畫像,從中探索文化的變遷。又如,《宋元學(xué)案》知識圖譜系統(tǒng)提取《宋元學(xué)案》的人物、地點(diǎn)、著作等要素及其關(guān)聯(lián)關(guān)系,形成知識圖譜并進(jìn)行可視化展示。
古籍人文平臺呈現(xiàn)出一定的數(shù)字人文基礎(chǔ)設(shè)施屬性,面向研究人員提供相應(yīng)的服務(wù)。通過梳理,典型的服務(wù)模式涉及在線數(shù)據(jù)服務(wù)、可視化服務(wù)、古籍整理分析服務(wù)3種。其中,在線數(shù)據(jù)服務(wù)可提供數(shù)據(jù)檢索、專題數(shù)據(jù)庫瀏覽、數(shù)據(jù)下載等服務(wù),或通過API接口提供古籍基礎(chǔ)數(shù)據(jù)。例如,清華大學(xué)數(shù)字人文門戶網(wǎng)站作為提供學(xué)術(shù)交流、實(shí)踐、資源獲取的平臺,該平臺數(shù)據(jù)以方便獲取處理的結(jié)構(gòu)化數(shù)據(jù)為主,可實(shí)現(xiàn)按需導(dǎo)出、API數(shù)據(jù)調(diào)用等功能??梢暬?wù)提供GIS、知識圖譜、關(guān)聯(lián)數(shù)據(jù)等服務(wù),目前,《宋元學(xué)案》知識圖譜系統(tǒng)、唐宋文學(xué)編年地圖、中國文學(xué)地理學(xué)信息平臺等典型的系統(tǒng)均將處理過的數(shù)據(jù)以地圖、知識圖譜等形式展示出來(見表3)。古籍整理服務(wù)提供命名實(shí)體識別、文本挖掘等基礎(chǔ)性技術(shù)工具,使古籍?dāng)?shù)字人文具備技術(shù)基礎(chǔ)設(shè)施與基本條件(見表4)。
古籍?dāng)?shù)字人文項(xiàng)目建設(shè)主體呈現(xiàn)多樣性、跨界性特征。古籍?dāng)?shù)字人文研究通常涉及古籍、人文等領(lǐng)域,也涉及技術(shù)開發(fā)、算法模式、系統(tǒng)研發(fā)工作,需要來自多個領(lǐng)域的專業(yè)人員參與研究。例如,復(fù)旦大學(xué)歷史地理研究中心的中國歷史地理信息平臺與首都師范大學(xué)的絲綢之路歷史地理信息開放平臺由西安云圖信息技術(shù)有限公司提供的技術(shù)支持,“漢典重光”古籍?dāng)?shù)字化平臺由互聯(lián)網(wǎng)巨頭阿里巴巴和國內(nèi)外多所知名大學(xué)、圖書館共同建設(shè)。
從人才隊(duì)伍來看,古籍?dāng)?shù)字人文研究繼承了數(shù)字人文交叉學(xué)科的屬性,在人才的需求方面比傳統(tǒng)的古籍?dāng)?shù)字化專業(yè)更多元,要求技術(shù)更復(fù)雜。在人才需求方面,古籍?dāng)?shù)字人文實(shí)踐工作不僅需要掌握古籍知識、人文知識,還需要計(jì)算機(jī)信息技術(shù)、數(shù)據(jù)科學(xué)技術(shù)[28—36]。從目前數(shù)字人文研究機(jī)構(gòu)來看,其人才隊(duì)伍支撐均體現(xiàn)了人才多元化、專業(yè)綜合化的特點(diǎn)。例如,浙江大學(xué)數(shù)字人文研究中心團(tuán)隊(duì)成員既有人文社會科學(xué)專業(yè),又有理工科學(xué)專業(yè),分別來看文學(xué)院、地理信息科學(xué)研究院、計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院等多個院系或部門。武漢大學(xué)數(shù)字人文研究中心的成員主要來自信息管理學(xué)院、信息資源研究中心、遙感實(shí)驗(yàn)室、文學(xué)院、歷史學(xué)院、計(jì)算機(jī)學(xué)院等,團(tuán)隊(duì)的研究方向既涉及知識圖譜、本體設(shè)計(jì)等算法層面技術(shù),又涉及科研數(shù)據(jù)集成、數(shù)字資產(chǎn)管理等資產(chǎn)層面技術(shù),甚至還有3D建模仿真、虛擬現(xiàn)實(shí)以及圖形設(shè)計(jì)等方向。北京大學(xué)數(shù)字人文研究中心研究團(tuán)隊(duì)既有計(jì)算機(jī)科學(xué)、人工智能等領(lǐng)域的研究學(xué)者,也有歷史學(xué)、語言文學(xué)、外國語等人文社科與語言學(xué)領(lǐng)域的研究學(xué)者。
從機(jī)構(gòu)形態(tài)上來看,目前以邏輯組織為主,通過招集不同學(xué)科的研究人員,形成可解決交叉學(xué)科問題的跨學(xué)科組織。例如,南京大學(xué)高研院數(shù)字人文創(chuàng)研中心以南京大學(xué)人文社會科學(xué)高等研究院為依托,結(jié)合歷史學(xué)、地理學(xué)、計(jì)算機(jī)科學(xué)、信息管理學(xué)等南京大學(xué)校內(nèi)多學(xué)科資源,形成一個跨學(xué)科的研究組織。
古籍?dāng)?shù)字人文技術(shù)實(shí)踐具有綜合性與集成性特點(diǎn),通常開發(fā)一個數(shù)字人文平臺需要多種不同的技術(shù)集成應(yīng)用。例如,在《宋元學(xué)案》知識圖譜系統(tǒng)開發(fā)過程中就融合了實(shí)體識別、文本挖掘、知識圖譜、可視化等多種技術(shù)。首先,利用命名實(shí)體識別技術(shù)提出《宋元學(xué)案》人物、時間、地點(diǎn)、著作等實(shí)體信息;其次,利用關(guān)系分析、關(guān)聯(lián)數(shù)據(jù)、文本挖掘、本體技術(shù)以及知識圖譜等探尋實(shí)體間的關(guān)聯(lián);再次,利用可視化技術(shù)等進(jìn)行綜合展示。如表5所示,古籍?dāng)?shù)字人文多涉及以下三類技術(shù)體系:一是資源數(shù)字化技術(shù)。是指利用圖像識別、文本識別、命名實(shí)體識別、本體構(gòu)建等技術(shù),對古籍原始文獻(xiàn)進(jìn)行識別、集成、清理、處理和分析,從中提取有價值的信息和知識。二是數(shù)據(jù)管理類技術(shù)。使用統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、文本挖掘等技術(shù),對數(shù)據(jù)進(jìn)行分析和建模,以發(fā)現(xiàn)數(shù)據(jù)中的模式和關(guān)聯(lián)。古籍?dāng)?shù)字人文研究以非結(jié)構(gòu)化的文本處理為主,更偏向于數(shù)據(jù)挖掘技術(shù)、自然語言處理技術(shù)協(xié)助學(xué)者開展統(tǒng)計(jì)、比較、分析等工作。三是展示類技術(shù)。利用GIS、知識圖譜、VR技術(shù)實(shí)現(xiàn),將古籍?dāng)?shù)據(jù)進(jìn)行可視化展示,將復(fù)雜的數(shù)據(jù)用直觀的方式進(jìn)行呈現(xiàn)。
第一,關(guān)注古籍?dāng)?shù)字人文基礎(chǔ)性技術(shù)研究,進(jìn)一步加強(qiáng)古籍全文數(shù)據(jù)庫建設(shè)。古籍?dāng)?shù)字人文關(guān)鍵點(diǎn)在于新一代信息技術(shù)在古籍文本中的深度應(yīng)用,對古籍?dāng)?shù)據(jù)進(jìn)行知識加工。當(dāng)前,所形成的古籍?dāng)?shù)字人文產(chǎn)品以檢索、查詢、可視化等功能為主,語義層面較少。主要原因有兩方面,一是從實(shí)踐角度來講,我國現(xiàn)存古籍?dāng)?shù)據(jù)庫量多,但總體數(shù)字化程度較低、以文本形式進(jìn)行數(shù)字化的古籍?dāng)?shù)量少,難以對古籍?dāng)?shù)據(jù)庫進(jìn)行深入挖掘;二是從研究層面來講,面向數(shù)字人文的古籍實(shí)踐案例研究較多,但面向特殊語言的實(shí)體識別、分詞技術(shù)、自動翻譯、自動提取等基礎(chǔ)性技術(shù)研究較少,導(dǎo)致推動古籍全文數(shù)據(jù)庫建設(shè)的技術(shù)動力不足。在后續(xù)工作中,學(xué)者應(yīng)進(jìn)一步將研究重點(diǎn)聚焦于命名實(shí)體識別、本體抽取等基礎(chǔ)性技術(shù)研究,同時,強(qiáng)化古籍全文數(shù)字庫建設(shè),為新一代信息技術(shù)在古籍文本中的深度應(yīng)用提供數(shù)據(jù)源與技術(shù)積累。
第二,加快研究范式轉(zhuǎn)變,形成研究與實(shí)踐相互促進(jìn)的良性循環(huán)。古籍?dāng)?shù)字人文是古籍?dāng)?shù)字化在新一代信息技術(shù)背景下發(fā)展的產(chǎn)物,是人工智能、數(shù)據(jù)挖掘等新一代信息技術(shù)發(fā)展到一定階段后應(yīng)用于古籍文獻(xiàn)研究的具體體現(xiàn)。傳統(tǒng)信息技術(shù)多以輔助古籍?dāng)?shù)字化檢索、查詢等為主體,對古籍研究起到支撐作用,而新一代信息技術(shù)對于古籍?dāng)?shù)字化將發(fā)揮引領(lǐng)發(fā)現(xiàn)新知識、新規(guī)律的作用。當(dāng)前從研究領(lǐng)域來看,多數(shù)學(xué)者仍以人工分析為主要手段,存在對傳統(tǒng)研究的路徑依賴現(xiàn)象,無法發(fā)揮新一代信息技術(shù)引領(lǐng)驅(qū)動數(shù)據(jù)人文發(fā)展的作用。在后續(xù)工作中,要充分認(rèn)識大數(shù)據(jù)、數(shù)據(jù)挖掘、數(shù)據(jù)可視化等新一代信息技術(shù)對傳統(tǒng)古籍?dāng)?shù)字化研究范式的影響,將數(shù)字人文推向更加客觀的定量研究,采用主題建模、數(shù)據(jù)檢索與分析、實(shí)體識別等技術(shù),重塑古籍?dāng)?shù)字化研究范式與人文知識體系。同時,研究人員應(yīng)加強(qiáng)對古籍?dāng)?shù)字人文產(chǎn)品的應(yīng)用,逐步優(yōu)化數(shù)字人文產(chǎn)品,形成研究與實(shí)踐相互促進(jìn)的良性循環(huán)。
第三,拓展研究和實(shí)踐群體,逐步擴(kuò)大社會力量參與的深度與廣度。古籍?dāng)?shù)字人文的實(shí)踐和研究均體現(xiàn)出多學(xué)科融合、多行業(yè)參與的發(fā)展特點(diǎn)。例如,復(fù)旦大學(xué)歷史地理研究中心中國歷史地理信息平臺、絲綢之路歷史地理信息以及“漢典重光”古籍?dāng)?shù)字化平臺等具有一定影響力的項(xiàng)目都有互聯(lián)網(wǎng)企業(yè)的深度參與與技術(shù)支撐。在研究方面,數(shù)據(jù)人文研究課題與項(xiàng)目多體現(xiàn)交叉學(xué)科的背景,涉及學(xué)科領(lǐng)域廣、專業(yè)背景多樣。后續(xù),在古籍?dāng)?shù)字人文實(shí)踐中,應(yīng)探索更靈活可行的管理模式,吸引互聯(lián)網(wǎng)公司積極參與項(xiàng)目的早期設(shè)計(jì)、中期開發(fā)、后期實(shí)施以及迭代升級等全生命周期工作。
第四,優(yōu)化和健全人才培養(yǎng)機(jī)制,突出“新技術(shù)”要求。近年來,隨著數(shù)字圖書館的建設(shè),圖書館已引進(jìn)和培養(yǎng)了一批具有信息技術(shù)專業(yè)的人才,但主要集中在數(shù)據(jù)庫、Web建設(shè)等傳統(tǒng)信息化方面,缺乏對大數(shù)據(jù)分析、數(shù)據(jù)挖掘、可視化技術(shù)等新一代信息技術(shù)相關(guān)人才的引進(jìn),制約了古籍?dāng)?shù)字人文的深入研究。在后續(xù)工作中,圖書館在招聘新進(jìn)人員時應(yīng)重點(diǎn)考慮新一代信息技術(shù)的背景,重點(diǎn)引進(jìn)具有圖情專業(yè)與計(jì)算機(jī)專業(yè)雙重背景的技術(shù)人才,此外,持續(xù)對圖書館古籍工作人員進(jìn)行系統(tǒng)的、有計(jì)劃的培訓(xùn),使其充分、全面認(rèn)識數(shù)字人文的基礎(chǔ)理論,更加適應(yīng)古籍?dāng)?shù)字化發(fā)展數(shù)字人文新階段下的新要求。
當(dāng)今數(shù)字人文蓬勃發(fā)展,本文將古籍?dāng)?shù)字化與數(shù)字人文結(jié)合起來,對推動古籍?dāng)?shù)字化工作進(jìn)入更深知識服務(wù)層次的理論研究與建設(shè)實(shí)踐進(jìn)行梳理分析并提出實(shí)踐路徑,以便進(jìn)一步挖掘古籍的時代價值,讓書寫在古籍里的文字都活起來。