(廣州大學(xué)圖書(shū)館,廣東 廣州,510006)
在媒體環(huán)境下,數(shù)字人文研究方興未艾。從2001年英國(guó)布萊克威爾出版公司(Blackwell Publishing) 將出版的新書(shū)《數(shù)字計(jì)算指南》(A Companion to Humanities Computing)擬更名為《數(shù)字人文指南》(A Companion to Digital Humanities),正式提出了“數(shù)字人文”(Digital Humanities)的表述[1-2],距今不足20年。這期間,數(shù)字人文研究正成為新的人文社科和數(shù)字技術(shù)相結(jié)合的研究熱點(diǎn)。截至2019年1月底,國(guó)際數(shù)字人文中心網(wǎng)絡(luò)(Center Net)統(tǒng)計(jì)的全球數(shù)字人文中心達(dá)到了201個(gè)[3]。在國(guó)內(nèi),數(shù)字人文研究盡管起步稍晚,但發(fā)展卻十分迅猛。在研究機(jī)構(gòu)方面,2011年,中國(guó)大陸首個(gè)數(shù)字人文研究中心——武漢數(shù)字人文研究中心在武漢大學(xué)成立,隨后,南京大學(xué)等高校相繼成立了數(shù)字人文研究中心或類似的研究機(jī)構(gòu),至2018年6月,北京大學(xué)已連續(xù)舉辦了3屆數(shù)字人文論壇;在研究成果方面,筆者在中國(guó)知網(wǎng)以“數(shù)字人文”為主題進(jìn)行檢索,從2005年廖祥忠在《現(xiàn)代傳播》刊物上發(fā)表《“超越邏輯”:數(shù)字人文的時(shí)代特征》開(kāi)始,至2018年底,主題為數(shù)字人文的研究論文達(dá)到389篇,其中2018年就發(fā)表了174篇。
這些研究成果對(duì)數(shù)字人文的研究包羅萬(wàn)象,然而,對(duì)于什么是數(shù)字人文,它的定義、概念仍然沒(méi)有一個(gè)準(zhǔn)確的定論,不同的研究者從自己的研究角度給出了不同的定義。例如,布雷特·鮑利(Brett Bobley)認(rèn)為,數(shù)字人文是一個(gè)圍繞著技術(shù)與人文學(xué)術(shù)諸多不同活動(dòng)的傘狀概念,包含的主題涉及資料的開(kāi)放獲取、知識(shí)產(chǎn)權(quán)、工具研發(fā)、數(shù)字圖書(shū)館、數(shù)據(jù)挖掘、原生數(shù)字資源保存、多媒體出版、可視化、GIS、數(shù)字重建媒介學(xué)習(xí)等諸多方面[4]。美國(guó)伊利諾伊香檳分校圖書(shū)情報(bào)學(xué)院院長(zhǎng)安斯沃斯教授則指出,數(shù)字人文是“一種代表性的實(shí)踐,一種建模的方式,或者說(shuō)就是一種擬態(tài)、一種推理、一個(gè)本體論約定。這種代表性的實(shí)踐可一分為二,一端是高效的計(jì)算,另一端是人文溝通”[5]。而武漢大學(xué)數(shù)字人文研究中心主任王曉光認(rèn)為數(shù)字人文“更重要的是在傳統(tǒng)的人文研究范式之外,提供更多更新穎的問(wèn)題、方法、工具和平臺(tái),推動(dòng)人文研究范式變革與創(chuàng)新。此外,數(shù)字人文還是對(duì)數(shù)字革命這一單向的、不可逆轉(zhuǎn)的社會(huì)趨勢(shì)的回應(yīng)”[6]。因此,作為不斷發(fā)展的數(shù)字時(shí)代的新興產(chǎn)物,要對(duì)數(shù)字人文進(jìn)行一個(gè)標(biāo)準(zhǔn)的定義是不科學(xué)的,也是不嚴(yán)謹(jǐn)?shù)模且粋€(gè)不斷發(fā)展的概念,其內(nèi)涵與內(nèi)容都在不斷地發(fā)展之中。
數(shù)字人文研究為人文學(xué)科的發(fā)展帶來(lái)了新的契機(jī),推動(dòng)著人文學(xué)科的發(fā)展。但在研究中,也出現(xiàn)一些偏頗之處,或者說(shuō)研究的誤區(qū)。一是過(guò)度推崇數(shù)字化造成了對(duì)人文學(xué)科屬性的削減。我們知道,數(shù)字人文的出現(xiàn)和發(fā)展,一定程度上發(fā)展和革新了人文學(xué)科的核心價(jià)值,也因此使得部分人文學(xué)者開(kāi)始對(duì)數(shù)據(jù)中心論、重圖輕文、重制作輕思想、重編碼輕創(chuàng)作推崇備至。但是依賴和過(guò)分強(qiáng)調(diào)數(shù)字化,只有一種結(jié)果,就是將人文學(xué)科推往偏技術(shù)、保守的、純實(shí)驗(yàn)室的實(shí)踐研究模式,人文學(xué)者的思辨和批判性思維遭到摒棄,這就使得數(shù)字人文并未成為人文學(xué)科與理工學(xué)科之間的溝通橋梁,反而實(shí)質(zhì)疏遠(yuǎn)了兩者的關(guān)系[7]。二是在“數(shù)字人文”實(shí)踐的過(guò)程中,存在自以為是的閉門研究,脫離了具體的人文學(xué)科研究情況和人文社會(huì)活動(dòng)場(chǎng)景,而人文學(xué)科的研究或創(chuàng)作帶有非常強(qiáng)的個(gè)人色彩,而且沒(méi)有固定的套路,人文研究所要使用的數(shù)據(jù)集、工具軟件或平臺(tái)一般是小眾的,而且指向性非常明確。上述數(shù)字人文實(shí)踐,往往造成只是數(shù)字人文項(xiàng)目推動(dòng)者的狂歡,而沒(méi)有真正意義上的更多受眾[8]。數(shù)字人文研究中上述誤區(qū)的出現(xiàn),過(guò)分強(qiáng)調(diào)了數(shù)字技術(shù)的重要性,卻忽視了人文才是數(shù)字人文實(shí)施、發(fā)展的目的和根本。因此,探討數(shù)字人文的性質(zhì)、特點(diǎn),厘清數(shù)字人文的本質(zhì)屬性顯得尤為迫切。
屬性,是事物所具有的性質(zhì)、特點(diǎn)。一門學(xué)科或者一個(gè)研究領(lǐng)域要不斷地推動(dòng)發(fā)展,既需要對(duì)其定義和內(nèi)涵進(jìn)行發(fā)展中的闡釋,也需要厘清其屬性,這是推動(dòng)學(xué)科或領(lǐng)域發(fā)展的必然要求,否則就會(huì)妨礙學(xué)科或領(lǐng)域研究的發(fā)展。那么,數(shù)字人文又具有什么屬性呢?數(shù)字人文的產(chǎn)生和升起,一個(gè)最重要的原因是數(shù)字技術(shù)的產(chǎn)生和不斷發(fā)展。數(shù)字人文的前身,人文計(jì)算( Humanities Computing)的起源,是意大利神父羅伯托·布薩(Roberto Busa)與IBM公司合作,以計(jì)算機(jī)為平臺(tái)、數(shù)字為載體編撰拉丁文的意大利典籍[9]。隨著數(shù)字化技術(shù)、數(shù)據(jù)管理技術(shù)、數(shù)據(jù)分析技術(shù)、可視化技術(shù)、VR/AR技術(shù)和機(jī)器學(xué)習(xí)技術(shù)等數(shù)字時(shí)代新技術(shù)的不斷出現(xiàn)和發(fā)展,也推動(dòng)著“人文計(jì)算”向“數(shù)字人文”發(fā)展,并不斷拓展數(shù)字人文的研究領(lǐng)域和研究?jī)?nèi)容。數(shù)字人文依賴和發(fā)展的基礎(chǔ),正是不斷發(fā)展的技術(shù)[10]33。在科學(xué)研究中,技術(shù)被視為研究的一種方法和手段,得到了廣泛的應(yīng)用,網(wǎng)絡(luò)時(shí)代的技術(shù)應(yīng)用正滲透到各學(xué)科研究中。數(shù)字人文的產(chǎn)生和發(fā)展,正是學(xué)科研究中泛技術(shù)化現(xiàn)象的重要特征[11]。因此,從這個(gè)角度而言,數(shù)字人文具有工具屬性,并且工具屬性是數(shù)字人文最根本和最重要的屬性。
按照《現(xiàn)代漢語(yǔ)詞典》的解釋,工具有兩種層面的解釋:進(jìn)行生產(chǎn)勞動(dòng)時(shí)所使用的器具;比喻用以達(dá)到目的的事物。如語(yǔ)言是人們交流思想的工具[12]。所謂數(shù)字人文的工具屬性,是數(shù)字人文的本質(zhì)特征,它是一種人文學(xué)科研究者在開(kāi)展研究時(shí)借助其實(shí)現(xiàn)自己的研究設(shè)想、推動(dòng)學(xué)科發(fā)展的一種工具,也是人們?yōu)閷?shí)現(xiàn)人文社會(huì)活動(dòng)目標(biāo)的一種工具,包括數(shù)字技術(shù)思路、技術(shù)方法、技術(shù)手段。從這個(gè)意義出發(fā),數(shù)字人文不能稱之為一門學(xué)科,只能是人文學(xué)科研究依托數(shù)字技術(shù)的一種方法、手段。在開(kāi)展數(shù)字人文研究時(shí),其首要考慮的應(yīng)該是人文,即實(shí)現(xiàn)人文研究本身所要達(dá)成的目標(biāo),其次才考慮采用何種數(shù)字技術(shù)或路徑來(lái)實(shí)現(xiàn)人文研究本身,不能本末倒置。
在開(kāi)展一項(xiàng)人文社會(huì)科學(xué)項(xiàng)目研究時(shí),一般應(yīng)該先認(rèn)真分析項(xiàng)目研究的背景、研究需要解決或回答的人文問(wèn)題、項(xiàng)目完成需要達(dá)成的具體目標(biāo)等內(nèi)容,在此基礎(chǔ)上,再去考慮選擇何種數(shù)字技術(shù)、方法手段(人文社會(huì)科學(xué)研究的技術(shù)工具)去實(shí)現(xiàn)研究的目標(biāo)。例如,如果需要對(duì)文本進(jìn)行數(shù)據(jù)分析(包括詞條、年代、姓氏等關(guān)鍵詞),通過(guò)這些大數(shù)據(jù)來(lái)揭示一些社會(huì)特征,顯然文本挖掘技術(shù)可以作為技術(shù)工具,用于人文社會(huì)科學(xué)的數(shù)字人文項(xiàng)目研究;如果是以普及人文社會(huì)科學(xué)知識(shí),提升市民大眾的人文素養(yǎng)的人文社會(huì)項(xiàng)目,則選擇可視化技術(shù)、圖像技術(shù)和3D技術(shù)更容易實(shí)現(xiàn)項(xiàng)目的初衷、目標(biāo)。因此,開(kāi)展數(shù)字人文項(xiàng)目研究的策略,第一需要明確人文社會(huì)科學(xué)項(xiàng)目研究的目的,然后據(jù)此選擇合適的數(shù)字技術(shù)來(lái)開(kāi)展項(xiàng)目研究,實(shí)現(xiàn)研究目標(biāo)。下文將以文化典籍?dāng)?shù)字人文項(xiàng)目為例來(lái)闡述這一策略和具體思路。
文化自信是一個(gè)民族、一個(gè)國(guó)家以及一個(gè)政黨對(duì)自身文化價(jià)值的充分肯定和積極踐行,并對(duì)其文化的生命力持有的堅(jiān)定信心[13]。如何堅(jiān)定文化自信?唯有從民族優(yōu)秀文化經(jīng)典中去汲取養(yǎng)分,增強(qiáng)民族自豪感和文化自信。在數(shù)字時(shí)代,經(jīng)典閱讀不僅必要,并且技術(shù)的發(fā)展為促進(jìn)經(jīng)典閱讀提供了更多的便利和可能。在蓬勃開(kāi)展的數(shù)字人文項(xiàng)目中,對(duì)文化典籍、經(jīng)典圖書(shū)的開(kāi)發(fā)和利用,構(gòu)成了數(shù)字人文項(xiàng)目的重要組成部分和主要內(nèi)容,其最終目的,無(wú)疑是為了促進(jìn)經(jīng)典閱讀,傳承文化。為此,需要通過(guò)數(shù)字技術(shù)這一工具,實(shí)現(xiàn)文化典籍類數(shù)字人文項(xiàng)目的開(kāi)發(fā)目標(biāo):
(1)經(jīng)典的可獲得和易獲得。在大眾所知的文化典籍中,很多經(jīng)典都存世不多,成為圖書(shū)館、博物館收藏的珍藏、孤本。要讓這些經(jīng)典為人閱讀和利用,第一要?jiǎng)?wù)是使之?dāng)?shù)字化,并與大眾共享,使普通民眾均可以通過(guò)一定的渠道來(lái)獲得其數(shù)字化版。借助數(shù)字化技術(shù)這一工具手段,可以實(shí)現(xiàn)經(jīng)典資源的可獲得和易獲得。
(2)經(jīng)典的可讀性和易讀性。經(jīng)典著述產(chǎn)生的時(shí)代已經(jīng)距離現(xiàn)代時(shí)空遙遠(yuǎn),經(jīng)典的文字和用語(yǔ),對(duì)于許多人來(lái)說(shuō),往往生澀難懂。普通讀者在閱讀時(shí)會(huì)遇到極大的理解困難和記憶障礙,而通過(guò)可視化技術(shù),對(duì)相關(guān)文獻(xiàn)信息進(jìn)行數(shù)字處理可以有效降低閱讀的難度,提高可讀性和易讀性,也便于人文學(xué)科研究者開(kāi)展相關(guān)研究。
為實(shí)現(xiàn)上述目標(biāo),國(guó)內(nèi)外數(shù)字人文研究中心、相關(guān)研究機(jī)構(gòu)和學(xué)者借助數(shù)字技術(shù),圍繞文化典籍利用、倡導(dǎo)經(jīng)典閱讀這一主旨,開(kāi)展了大量的文化典籍類數(shù)字人文項(xiàng)目的研究。
4.2.1 數(shù)字化項(xiàng)目
對(duì)經(jīng)典的數(shù)字化,是數(shù)字人文項(xiàng)目的基礎(chǔ),也是開(kāi)展最早、最多的數(shù)字人文項(xiàng)目。它通過(guò)采樣、量化、建模等技術(shù)手段,對(duì)文獻(xiàn)進(jìn)行統(tǒng)一處理,提高其利用價(jià)值。如《四庫(kù)全書(shū)》電子版、《國(guó)學(xué)寶典》《中國(guó)基本古籍庫(kù)》《廣州大典》等經(jīng)典數(shù)字化項(xiàng)目[14]。以《廣州大典》為例,它是由中共廣州市委宣傳部、廣東省文化廳策劃并組織研究編纂,旨在系統(tǒng)搜集整理和搶救保護(hù)廣州文獻(xiàn)典籍、傳播廣州歷史文化的大型地方文獻(xiàn)叢書(shū)。它依經(jīng)、史、子、集、叢五部分類,共收錄4064種文獻(xiàn),編成520冊(cè)圖書(shū)[15]。為推廣《廣州大典》的閱讀和研究,上述文獻(xiàn)全部實(shí)現(xiàn)了數(shù)字化,并建成了《廣州大典》數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)提供了檢索、紀(jì)年換算、全文下載等多種功能,極大地便利了人們的閱讀和研究開(kāi)展。在國(guó)外,類似的文化典籍類數(shù)字化項(xiàng)目也很多,如哥倫比亞大學(xué)圖書(shū)館將本館珍貴的人文學(xué)科照片、海報(bào)、繪畫(huà)、票證和手稿等檔案材料數(shù)字化,建設(shè)數(shù)字資源館藏庫(kù)(Digital Library Collections, DLC),并將資源鏈接到圖書(shū)館 OPAC系統(tǒng)中,實(shí)現(xiàn)實(shí)體資源與數(shù)字資源的關(guān)聯(lián)鏈接[16]。
4.2.2 文本挖掘與可視化項(xiàng)目
近年來(lái),隨著數(shù)字技術(shù)的不斷發(fā)展,利用文本挖掘技術(shù)、可視化技術(shù)進(jìn)行經(jīng)典的數(shù)字人文項(xiàng)目開(kāi)發(fā)也越來(lái)越多。所謂文本挖掘是從半結(jié)構(gòu)或非結(jié)構(gòu)的文本信息中挖掘可理解的、有價(jià)值的知識(shí),是對(duì)人文資料的深層次利用,通常包括文本預(yù)處理、語(yǔ)料庫(kù)構(gòu)建、特征提取、文本聚類、文本分類等過(guò)程,有些文本挖掘項(xiàng)目還伴隨著對(duì)挖掘成果的可視化處理,即以表格、圖像等形式將成果生動(dòng)地表現(xiàn)出來(lái)。類似的項(xiàng)目有普林斯頓大學(xué)的映射外籍巴黎項(xiàng)目、耶穌會(huì)圖書(shū)館起源項(xiàng)目等,前者對(duì)旅居巴黎的美國(guó)人于1919年創(chuàng)辦圖書(shū)館的會(huì)員數(shù)據(jù)進(jìn)行了深入挖掘,展示了1919-1940年間巴黎外籍社區(qū)與法國(guó)作家、藝術(shù)家的聯(lián)系圖像;后者創(chuàng)建了一個(gè)虛擬圖書(shū)館系統(tǒng),揭示芝加哥洛約拉大學(xué)前身——圣伊格納修斯大學(xué)圖書(shū)館耶穌會(huì)書(shū)籍的獲取和使用歷史,努力發(fā)現(xiàn)保存至今的原版書(shū)籍[17]。
針對(duì)傳統(tǒng)文學(xué)文本閱讀與研究方式的局限,在信息可視化和文本可視化技術(shù)的基礎(chǔ)上,斯坦福大學(xué)教授 Franco Moretti提出了“遠(yuǎn)距離閱讀(Distant Reading)”理論,為閱讀與研究信息量大、復(fù)雜度高的文本提供新的解讀途徑與工具[18]。哈爾濱工業(yè)大學(xué)教授王妍和她的碩士研究生李欣哲完成的對(duì)《詩(shī)經(jīng)》情感可視化閱讀,就是“遠(yuǎn)距離閱讀”的一個(gè)典型項(xiàng)目案例?!对?shī)經(jīng)》文本為古漢語(yǔ),古奧晦澀、生僻字多、詞意隱蔽、語(yǔ)境懸隔,這為經(jīng)典的大眾普及設(shè)置了障礙,使文化經(jīng)典的閱讀與傳承遇到了嚴(yán)峻的現(xiàn)實(shí)問(wèn)題。王妍、李欣哲以“喜、怒、憂、思、悲、恐、驚”來(lái)定性《詩(shī)經(jīng)》的情感信息,借助信息時(shí)代的數(shù)字技術(shù)力量,通過(guò)對(duì)情感信息的處理和計(jì)算,運(yùn)用信息可視化技術(shù)對(duì)《詩(shī)經(jīng)》的情感信息內(nèi)容進(jìn)行信息建構(gòu),將《詩(shī)經(jīng)》的文本信息轉(zhuǎn)換為視覺(jué)信息,幫助人們高效、快速閱讀,以視覺(jué)之“閱”的方式進(jìn)入到《詩(shī)經(jīng)》的情感世界[19]。
通過(guò)上述數(shù)字人文項(xiàng)目案例,可以清晰地看到,數(shù)字人文具有鮮明的工具屬性。在這些項(xiàng)目中,為了促進(jìn)文化典籍利用,倡導(dǎo)經(jīng)典閱讀的目的,利用了不同的數(shù)字技術(shù)作為技術(shù)工具和手段,以達(dá)成項(xiàng)目目標(biāo)。包括數(shù)字化技術(shù)(掃描,拍攝,采樣,捕捉,圖形設(shè)計(jì),3D建模等)、數(shù)據(jù)管理技術(shù)(文本編碼,語(yǔ)義描述,本體建模,數(shù)據(jù)庫(kù)設(shè)計(jì),語(yǔ)義搜索,API數(shù)據(jù)服務(wù)等)、數(shù)據(jù)分析技術(shù)(文本分析,聚類分類,主題分析,內(nèi)容挖掘,時(shí)序分析,地理空間分析,社會(huì)關(guān)系分析等)、可視化技術(shù)(信息美學(xué),知識(shí)地圖,主題圖,關(guān)聯(lián)呈現(xiàn),場(chǎng)景模擬,歷史仿真等)、VR/AR技術(shù)(人機(jī)交互,認(rèn)知,互動(dòng)測(cè)量,游戲化學(xué)習(xí)等)、機(jī)器學(xué)習(xí)技術(shù)(自動(dòng)分類,圖像視頻音頻識(shí)別和分析,深度學(xué)習(xí),超級(jí)計(jì)算等)[10]35等數(shù)字時(shí)代的各種信息技術(shù)被充分融合運(yùn)用到數(shù)字人文項(xiàng)目的開(kāi)發(fā)中,采用“發(fā)現(xiàn)(Discovering)、注釋(Annotating)、比較(Comparing)、參考(Referring)、抽樣(Sampling)、說(shuō)明(Illustrating)和表示(Representing)”等七種方法[20],實(shí)現(xiàn)了文化典籍資源的再利用、再開(kāi)發(fā),幫助媒體環(huán)境下的人們更容易閱讀經(jīng)典、研究經(jīng)典。
數(shù)字時(shí)代,技術(shù)的發(fā)展促成了數(shù)字人文的興起,這對(duì)促進(jìn)人文學(xué)科的發(fā)展和創(chuàng)新提供了更多可能和新的機(jī)會(huì)。顯然,數(shù)字人文具有鮮明的工具屬性,它的出現(xiàn),為人文學(xué)科的研究提供了一種工具,它可以幫助文學(xué)家、歷史學(xué)家、藝術(shù)家、圖書(shū)館學(xué)家等人文科學(xué)研究者以新的思路和技術(shù)方法、手段去認(rèn)識(shí)研究問(wèn)題,探究研究問(wèn)題,找到通向研究結(jié)論的全新道路。