鄭 楠
在傳統(tǒng)的文學(xué)研究中,文學(xué)作品常被視為一種渾然天成的藝術(shù)奇觀,是作家偉大心靈的文字反映,因此研究者需要依賴“細(xì)讀”(close reading)來理解文學(xué)作品,即“對文本的語言、結(jié)構(gòu)、象征、修辭、音韻、文體等因素進(jìn)行仔細(xì)解讀”(趙一凡630)。因?yàn)槟軌蜃屟芯空邔ξ谋井a(chǎn)生精細(xì)獨(dú)到的解釋,所以細(xì)讀在很長時間內(nèi)都是文學(xué)研究的范式。但由此也帶來了一個顯而易見的問題,正如雷蒙德·威廉斯(Raymond Williams)所言:“沒有人真的懂19世紀(jì)的小說,因?yàn)闆]有人讀完了或是能夠讀完從單行本到報紙連載小說在內(nèi)的全部作品?!保?8)確實(shí)如此。假如說細(xì)讀幾十乃至幾百本小說尚具有可行性,但當(dāng)研究對象的數(shù)量擴(kuò)大到成千上萬本時,細(xì)讀便顯得捉襟見肘。
細(xì)讀的局限性正是本文研究“遠(yuǎn)讀”(distant reading)方法的一個切入點(diǎn)。本文指出,造成這一局限性的原因并非在于細(xì)讀方法本身,而在于研究者對于研究對象的認(rèn)知。對文本的認(rèn)知方式?jīng)Q定了文學(xué)的研究方法,因此想要解決運(yùn)用細(xì)讀方法時所面臨的困境,研究者需要轉(zhuǎn)變自身對于文本的認(rèn)知。而基于細(xì)讀在面對大量文本時不可避免的局限性,有學(xué)者提出應(yīng)該嘗試由細(xì)讀改為遠(yuǎn)讀,遠(yuǎn)讀的文學(xué)研究方法應(yīng)運(yùn)而生。遠(yuǎn)讀在何種意義上改變了研究者對于文本的認(rèn)知?它能彌補(bǔ)細(xì)讀的缺陷嗎?遠(yuǎn)讀本身又有怎樣的特點(diǎn)和問題?它有可能成為未來文學(xué)研究的新范式嗎?本文將嘗試對這些問題作出學(xué)理化的探討。
闡釋遠(yuǎn)讀,必須從斯坦福大學(xué)教授弗朗科·莫萊蒂(Franco Moretti)談起。2000年,莫萊蒂在《新左翼評論》()上發(fā)表了題為《對世界文學(xué)的猜想》(“Conjectures on World Literature”,下簡稱《猜想》)的文章,并在其中明確提出了遠(yuǎn)讀的概念:“遠(yuǎn)離閱讀。我要重申的是:距離,是認(rèn)知的條件。有了距離,你就可以關(guān)注那些比文本小得多或大得多的單位:手法、主題、修辭——或是體裁和系統(tǒng)?!保R蒂12)此后,遠(yuǎn)讀概念以及這篇文章受到越來越多的關(guān)注。截至2021年7月21日,在谷歌學(xué)術(shù)(Google Scholar)上,《猜想》一文的被引量已經(jīng)高達(dá)2 614次。另外,以在Web of Science的核心合集中以“distant reading”為主題而檢索到的247篇論文為例,經(jīng)由VOSviewer軟件做作者共被引分析(author cocitation analysis),發(fā)現(xiàn)莫萊蒂已經(jīng)成了理解遠(yuǎn)讀的關(guān)鍵人物。因此,本文試圖將莫萊蒂的《猜想》作為考察當(dāng)代遠(yuǎn)讀的起點(diǎn),以此探析莫萊蒂的遠(yuǎn)讀究竟為何會引起學(xué)界的高度關(guān)注。
在《猜想》中,莫萊蒂用自己的方式承接了威廉斯當(dāng)初所提出的問題:“為人所知的19世紀(jì)英國小說就有3萬部,而還有4萬、5萬、6萬部不為人知,更未曾讀過,將來也沒人會去讀?!保?)也就是說,第一,對于任何試圖進(jìn)行文學(xué)總體研究的學(xué)者而言,研究對象的體量問題是顯而易見的,研究者無法窮盡所有的研究對象,他們所細(xì)讀過的文本必然遠(yuǎn)遠(yuǎn)少于其未細(xì)讀過的文本。第二,在海量的文獻(xiàn)中選擇可進(jìn)行細(xì)讀的研究對象,研究者的篩選標(biāo)準(zhǔn)必須是“為人所知”,即研究對象要與文學(xué)的經(jīng)典化(canonization)密切相關(guān)。正所謂“除非你覺得極少數(shù)文本確實(shí)重要,否則你不會花費(fèi)那么多氣力去研讀”(11)。但問題在于,即使研究者只選擇各國的經(jīng)典文本去展開文學(xué)討論,研究對象也未必能被研究者盡數(shù)細(xì)讀,更何況關(guān)于“何為經(jīng)典”的討論又涉及另一個巨大的、邊界含糊的學(xué)術(shù)難題。莫萊蒂認(rèn)為,如果僅靠傳統(tǒng)的細(xì)讀研究法來研究文學(xué),“世界文學(xué)”就很難有真正來臨的那一天。為此,他提出了一種探索“世界文學(xué)”的可能性,即遠(yuǎn)讀。
在《猜想》中,莫萊蒂展示了自己依據(jù)眾多民族文學(xué)專家的研究材料而進(jìn)行遠(yuǎn)讀的過程。他首先借用了“世界體系理論”(The Theory of World System)的經(jīng)濟(jì)假設(shè),即世界資本主義體系“同為一體,但不平等”(10)。由此,或許可以認(rèn)為,在相互關(guān)聯(lián)的世界文學(xué)體系內(nèi),強(qiáng)勢的中心文學(xué)(西歐文學(xué))會入侵并改變?nèi)鮿莸倪吘壩膶W(xué)(非西歐文學(xué))。為了驗(yàn)證這一猜想,莫萊蒂以“西方小說形式如何影響本土文學(xué)內(nèi)容”為切入點(diǎn),不直接閱讀文學(xué)文本,而通過閱讀二十多種文學(xué)批評專著,最終從眾多民族文學(xué)研究者的研究中得到了一個共同點(diǎn),即大量“邊緣地區(qū)”(指非西歐國家)的文學(xué),在特定時期都受到過“中心地區(qū)”(西歐國家)小說形式的影響,而外來的“西方形式”在遭遇“本土內(nèi)容”時,雙方會相互妥協(xié)。妥協(xié)的方式與程度雖各有不同,但這一普遍規(guī)律卻足以證明:世界文學(xué)是一個不平等的整體。
可以看到,一開始的遠(yuǎn)讀方法并沒有涉及任何量化分析(quantitative analysis)。莫萊蒂所做的,不過是“把別人的研究成果拼湊起來”(11),并從中分析出小范圍的細(xì)讀所難以反映的文學(xué)規(guī)律。這其中的遠(yuǎn)讀更像是對于他人研究的“綜合”(synthesis)。大概也正是因此,在《猜想》一文發(fā)表后,學(xué)界的討論更多聚焦在莫萊蒂對“世界文學(xué)體系”的描述上(Moretti,“More Conjectures”73)。有學(xué)者認(rèn)為,所謂的遠(yuǎn)讀方法并沒有像莫萊蒂宣稱的那般具有革命性(Spivak 107 109)。因?yàn)檫h(yuǎn)讀方法似乎只是一種變形的文獻(xiàn)綜述,綜述在傳統(tǒng)文學(xué)研究中并不罕見,而莫萊蒂所采用的民族文學(xué)研究也有對其他研究的借鑒與總結(jié)。伊利諾伊大學(xué)厄巴納 香檳分校的學(xué)者泰德·安德伍德(Ted Underwood)就認(rèn)為,遠(yuǎn)讀“是一種將歷史知識探究描述為實(shí)驗(yàn)的實(shí)踐”(33)。還有的學(xué)者據(jù)此把遠(yuǎn)讀歸為“數(shù)字人文”(digital humanities)研究的一種。
本文認(rèn)為,上述說法雖有一定真知灼見,但其并沒有深入探討遠(yuǎn)讀的方法論意義,甚至部分混淆了遠(yuǎn)讀在不同階段的內(nèi)涵。更準(zhǔn)確地說,遠(yuǎn)讀是一種借鑒科學(xué)實(shí)驗(yàn)思維的文學(xué)研究方法,與純粹的文學(xué)研究不同,它正是通過“閱讀媒介”實(shí)現(xiàn)了“假設(shè) 驗(yàn)證”的實(shí)驗(yàn)閉環(huán),它具有鮮明的實(shí)驗(yàn)性。
所謂閱讀媒介,指的是改變研究者認(rèn)知文本方式的信息反饋裝置。我們知道,遠(yuǎn)讀方法的全過程是,先由研究者對文學(xué)文本進(jìn)行理論上的假設(shè),再由閱讀媒介根據(jù)研究假設(shè)對文學(xué)文本進(jìn)行特定的處理,然后反饋相應(yīng)的文本信息,最后由研究者通過分析該信息以驗(yàn)證假設(shè)是否成立。在這一過程中,研究者對文本的認(rèn)知逐漸從原始的文字材料轉(zhuǎn)變?yōu)榉答伒男畔㈩愋?。為便于理解,本文以閱讀媒介為中心,構(gòu)建了《猜想》中遠(yuǎn)讀方法的分層模型,如圖1所示。
圖1
我們可以從整個遠(yuǎn)讀的分層模型入手來進(jìn)一步理解該流程?!恫孪搿分械倪h(yuǎn)讀方法實(shí)際上出現(xiàn)了金字塔型的三個層次。底層為原始材料,即整個遠(yuǎn)讀研究所涉及的大規(guī)模文學(xué)文本,中層則是閱讀媒介,即莫萊蒂利用的二十多本民族文學(xué)研究專著,頂層則是作為研究者的莫萊蒂。從這個模型來看遠(yuǎn)讀的具體運(yùn)作流程,我們或許更容易理解遠(yuǎn)讀的實(shí)驗(yàn)特性。所謂實(shí)驗(yàn),即“在受控條件下進(jìn)行的檢驗(yàn),以證明已知的真理或檢驗(yàn)假設(shè)的有效性”(Muijs 13)?!凹僭O(shè) 驗(yàn)證”是實(shí)驗(yàn)方法區(qū)別于其他研究方法的關(guān)鍵所在。結(jié)合波普爾的證偽理論,科學(xué)研究需要堅(jiān)持對研究假設(shè)進(jìn)行檢測。只有當(dāng)研究假設(shè)可被檢驗(yàn)時,研究者才不會堅(jiān)持不可靠的研究前提,否則研究者就有可能為了符合假設(shè)而歪曲事實(shí)或經(jīng)驗(yàn)材料。而之所以稱遠(yuǎn)讀為“文學(xué)實(shí)驗(yàn)”,關(guān)鍵就在于閱讀媒介,正是這一反饋裝置使得遠(yuǎn)讀方法中“假設(shè) 驗(yàn)證”的流程得以完成。具體到莫萊蒂的遠(yuǎn)讀方法,這個過程邏輯就是:“世界文學(xué)體系”是莫萊蒂的研究問題,“現(xiàn)代小說是西方小說形式與本土內(nèi)容相互妥協(xié)的成果”則是莫萊蒂的研究假設(shè)。莫萊蒂不需要在具體的文本語境中證明這一假設(shè),而是通過收集不同的民族文學(xué)研究組成閱讀媒介,這一閱讀媒介則根據(jù)莫萊蒂的假設(shè),反饋了“西方小說形式同本土內(nèi)容存在結(jié)合問題”的信息。莫萊蒂根據(jù)這一反饋的信息,驗(yàn)證了研究假設(shè)最終成立,從而得出世界文學(xué)同一而不平等的結(jié)論。
盡管傳統(tǒng)文學(xué)研究中也有研究設(shè)想,但卻鮮有形成基于信息反饋的驗(yàn)證機(jī)制,因而研究者很難清晰地知道自己的研究設(shè)想是否可靠,或存在哪些問題。特別是依賴細(xì)讀方法的研究,其文本分析更多聚焦在對研究設(shè)想的闡釋,雖然這一做法豐富了文學(xué)研究的進(jìn)路與結(jié)論,但在缺乏明確驗(yàn)證機(jī)制的情況下,很容易出現(xiàn)“強(qiáng)制闡釋”,即用理論框定文本,致使文學(xué)研究頻頻陷入尋求自圓其說的僵局,而這一做法顯然無益于文學(xué)知識的生產(chǎn)。莫萊蒂在《猜想》中所展現(xiàn)出的“假設(shè) 驗(yàn)證”機(jī)制,無疑證明了文學(xué)研究能夠引入一種更為科學(xué)的實(shí)驗(yàn)方法。
關(guān)于遠(yuǎn)讀的理論設(shè)想是非常美好的,但在實(shí)際運(yùn)用中卻存在不少困難。最重要的一個困難,就是缺乏對他人研究成果的選擇標(biāo)準(zhǔn)。因?yàn)榧词故轻槍ν粋€研究對象,不同研究者的研究思路和結(jié)論都有可能差別很大,而在不進(jìn)行細(xì)讀的情況下,似乎很難作出客觀公正的篩選。莫萊蒂的《猜想》也沒有給出解決方案。不僅如此,莫萊蒂在文中所使用的民族文學(xué)研究大多為英文著作,因而在關(guān)乎方法與主題等內(nèi)容性的選擇標(biāo)準(zhǔn)之外,還存在著語言這一層篩選機(jī)制。是否有其他尚未進(jìn)入英語世界的民族文學(xué)研究,其與莫萊蒂所引用的著作相比,彼此的闡釋恰好相悖?對于因語言而產(chǎn)生的研究障礙,這更是一個無解的難題。第二個困難就是對他人的研究難以驗(yàn)證。正如有學(xué)者指出,《猜想》中的遠(yuǎn)讀其實(shí)是一個基于信任的方案(Parla 123)。莫萊蒂所利用的民族文學(xué)研究,歸根結(jié)底是他人細(xì)讀文本的產(chǎn)物。由于莫萊蒂并沒有直接面對底層的文本,因此他必然難以親自判斷他人的細(xì)讀在何種程度上是可靠的。因此,莫萊蒂對他人研究的采用只能建基于信任之上:信任文學(xué)專家的文本收集與文本分析,信任科學(xué)共同體對相關(guān)成果的評價,唯獨(dú)缺失屬于研究者基于文本信息的自身判斷。
不難發(fā)現(xiàn),上述兩個弊端均集中于作為閱讀媒介的他人研究。這也是本文強(qiáng)調(diào)閱讀媒介是一個反饋裝置的重要原因。民族文學(xué)專家的細(xì)讀,其反饋的不僅是文本包含的信息,更是專家的價值判斷。研究者需要依靠解讀這些反饋,才能完成對于假設(shè)的驗(yàn)證。假如研究者既無法解釋對人為價值判斷的選擇標(biāo)準(zhǔn),又無法驗(yàn)證反饋信息的真實(shí)性,那就如同在遠(yuǎn)讀方法中引入了一個信息處理的“黑箱”(black box):一個具有信息反饋功能,卻不清楚內(nèi)部運(yùn)作結(jié)構(gòu)的篩選系統(tǒng)。這便是《猜想》中遠(yuǎn)讀所遺留下來的挑戰(zhàn)——其在實(shí)踐中仍存在著“信息黑箱”。修復(fù)閱讀媒介的弊端,進(jìn)一步優(yōu)化其性能,成為改進(jìn)遠(yuǎn)讀方法的核心任務(wù)。
發(fā)表《猜想》之后,莫萊蒂于2003年又在《新左翼批評》上發(fā)表了《圖表、地圖、樹型圖(一)》(“Graphs,Maps,Trees-I”),并于次年展示了第二、三部分的成果,最終在2005年集結(jié)成同名書籍(下文簡稱《圖表》)?!秷D表》是莫萊蒂的另一部代表作,展示了《猜想》之后莫萊蒂對于閱讀媒介的改進(jìn),即將他人的細(xì)讀替換為量化分析。具體而言,為了研究文學(xué)史中“小說的崛起”(the rise of novel),莫萊蒂將目標(biāo)聚焦于書籍史(book history)——對書籍文本的印刷、發(fā)行與流通等的研究——通過量化書籍史研究中的數(shù)據(jù),統(tǒng)計(jì)不同國家小說出版的時間、數(shù)量以及地點(diǎn)等信息,并將之形成圖表、地圖以及樹形圖。如圖2所示,在統(tǒng)計(jì)了英國、日本、意大利、西班牙以及尼日利亞分別在1700年至2000年間小說的出版數(shù)量后,莫萊蒂將數(shù)據(jù)繪制成圖表。借助圖表,莫萊蒂發(fā)現(xiàn),上述五個國家的小說發(fā)行都經(jīng)歷過一個快速上升的階段。
圖2 (Moretti,Graphs,Maps,Trees 6)
用量化分析來取代《猜想》中他人的細(xì)讀,解決了《猜想》中閱讀媒介難以被檢驗(yàn)的問題。正如莫萊蒂所言:“量化數(shù)據(jù)之所以有用,是因?yàn)樗鼈儶?dú)立于解釋。”(30)數(shù)據(jù)的統(tǒng)計(jì)方法是清晰而明確的,能夠單獨(dú)地被其他研究者分析和理解,而數(shù)據(jù)本身則是客觀存在的,不因不同研究者的閱讀而發(fā)生改變。因此,不同于細(xì)讀所隱含的價值判斷,量化分析這一閱讀媒介所反饋的,是關(guān)于文本的客觀說明。
文學(xué)研究的量化分析也成為莫萊蒂及其團(tuán)隊(duì)后來的工作方向。2011年,莫萊蒂出版了論文合集《遠(yuǎn)讀》(),其中收錄的《風(fēng)格公司:對1740至1850年間七千本英國小說標(biāo)題的反思》(“Style,Inc:Reflections 7000 Titles[British Novels,1740 1850]”)一文就引入了考察小說標(biāo)題字?jǐn)?shù)的平均數(shù)和中位數(shù)的統(tǒng)計(jì)方法,通過計(jì)算分析1740年到1850年隨著出版市場的擴(kuò)大,小說標(biāo)題字?jǐn)?shù)呈現(xiàn)出下滑的趨勢,并綜合當(dāng)時書籍購買者的喜好與標(biāo)題長度所帶來的廣告效益等方面的思考,研究者得出了市場對小說呈現(xiàn)方式(the presentation of novels)存在影響的結(jié)論。(179 210)
上文提到,安德伍德更傾向于將遠(yuǎn)讀視為一種文學(xué)史研究,因?yàn)槲膶W(xué)史研究更多集中于對文學(xué)規(guī)律的研究,相比對文學(xué)作品的美學(xué)研究而言,這種觀點(diǎn)認(rèn)為遠(yuǎn)讀更追求“普遍客觀”,這也使得在文學(xué)史研究中運(yùn)用量化分析顯得更為合適。這個看法固然有其合理性,但實(shí)際上只關(guān)注到遠(yuǎn)讀探索文學(xué)史規(guī)律的案例事實(shí),而忽略了遠(yuǎn)讀中閱讀媒介在改變文學(xué)認(rèn)知模式上的潛力。在《遠(yuǎn)讀》的最后一篇論文《網(wǎng)絡(luò)理論,情節(jié)分析》(“Network Theory,Plot Analysis”)中,莫萊蒂將遠(yuǎn)讀運(yùn)用在對《哈姆雷特》的情節(jié)分析上。通過對人物對話的量化計(jì)算,莫萊蒂設(shè)計(jì)出《哈姆雷特》的人物網(wǎng)絡(luò)圖,如圖3所示:
圖3 (Moretti,Distant Reading 213)
在上述過程中,作為閱讀媒介的量化分析先將文本轉(zhuǎn)化為數(shù)字,而后再通過可視化呈現(xiàn)將數(shù)字轉(zhuǎn)化為網(wǎng)絡(luò)圖譜,這便是閱讀媒介實(shí)現(xiàn)認(rèn)知改變的方法——研究者眼中的小說從線性文字變成了空間網(wǎng)絡(luò)。莫萊蒂介紹了網(wǎng)絡(luò)圖譜的四個優(yōu)勢:一、將歷時性的文字閱讀變成共時性的網(wǎng)絡(luò)結(jié)構(gòu);二、情節(jié)可視化;三、構(gòu)建文學(xué)模型;四、通過文學(xué)模型進(jìn)行“文學(xué)實(shí)驗(yàn)”。(215 220)更為關(guān)鍵的是,可視化網(wǎng)絡(luò)能夠直接呈現(xiàn)量化數(shù)據(jù)難以呈現(xiàn)的事實(shí)。如圖3所示,盡管哈姆雷特(Hamlet)和克勞狄斯(Claudius)在網(wǎng)絡(luò)中心性的數(shù)值上相差不遠(yuǎn)(中心性等于與其他網(wǎng)絡(luò)節(jié)點(diǎn)最短距離的平均數(shù),相鄰兩個節(jié)點(diǎn)的距離為1):哈姆雷特為1.62,克勞狄斯則是1.45,似乎二者同樣是故事的中心人物,但分別將二者抽離出網(wǎng)絡(luò)后,可以發(fā)現(xiàn),哈姆雷特對網(wǎng)絡(luò)的影響力要比克勞狄斯大,這證明了哈姆雷特才是故事的主角。對數(shù)據(jù)可視化的使用使得遠(yuǎn)讀不只限于大規(guī)模的文學(xué)文本研究,也使得作品批評得以展開。利用網(wǎng)絡(luò)圖譜,遠(yuǎn)讀可以直觀地呈現(xiàn)數(shù)據(jù)統(tǒng)計(jì)所隱藏的內(nèi)部聯(lián)系,如圖4所示:
圖4 (Moretti,Distant Reading 221)
盡管網(wǎng)絡(luò)圖譜對原先的問題有所改進(jìn),不過以上研究仍然存在問題。雖然量化分析能夠確保閱讀媒介反饋信息的客觀性,但對文本的量化往往只是為了用數(shù)據(jù)來驗(yàn)證已有研究的正確與否。而事實(shí)上,不需要關(guān)系網(wǎng)絡(luò),讀者也能夠輕易判斷出哈姆雷特才是文本的主角,這樣的遠(yuǎn)讀方法所能帶來的研究意義極為有限。同時,目前的閱讀媒介大多是簡單的量化分析方法,研究者難以利用這些數(shù)據(jù)產(chǎn)生新的文學(xué)知識。為何選擇此種數(shù)據(jù)的變化來證明研究假設(shè),而非另外一種?這需要研究者進(jìn)行說明與解釋,但選擇依據(jù)依舊很少出現(xiàn)在遠(yuǎn)讀的研究中。美國羅格斯大學(xué)學(xué)者安德魯·戈德斯通(Andrew Goldstone)就指出,實(shí)踐遠(yuǎn)讀的研究者未能系統(tǒng)性地說明分析特定數(shù)據(jù)的理由何在(“Distant Reading:More Work to be Done”)。上述莫萊蒂的《風(fēng)格公司》便是一例,加拿大麥吉爾大學(xué)學(xué)者蘇真(Richard Jean So)認(rèn)為,《風(fēng)格公司》在數(shù)據(jù)的處理上仍有缺陷,理由在于莫萊蒂對數(shù)據(jù)的處理更像是由直覺所驅(qū)動的(“All Models Are Wrong”671)。利用平均數(shù)和中位數(shù)確實(shí)能展示出某種數(shù)據(jù)的變化,但卻沒辦法告訴研究者這一變化趨勢的強(qiáng)度,有可能上述兩個指標(biāo)所展示出來的變化只是某種暫時性的噪音(noise),因而莫萊蒂在這一文章中的分析方法顯得不夠系統(tǒng)化(“All Models Are Wrong”670 671)。綜上所述,量化分析需要運(yùn)用多種數(shù)理知識,但文學(xué)研究者往往缺乏這一方面的知識,從而導(dǎo)致采用的量化分析方式過于簡單與唯一,并且缺乏選擇依據(jù)。這是造成在文學(xué)研究中運(yùn)用量化分析難以產(chǎn)生高價值數(shù)據(jù)的重要原因。因此,深化對量化分析的認(rèn)識,是避免遠(yuǎn)讀變成簡單數(shù)字統(tǒng)計(jì)的重中之重。
如何深化對于文本的量化分析?蘇真給出的建議是建模(modeling)。針對《風(fēng)格公司》的直覺驅(qū)動問題,蘇真提出了一個關(guān)于方法上的建議,即在計(jì)算機(jī)上利用回歸模型(regression model)對數(shù)據(jù)進(jìn)行再處理,分析小說標(biāo)題隨年份遞增后字?jǐn)?shù)上升或下降趨勢的強(qiáng)弱。通過建立回歸模型,蘇真為《風(fēng)格公司》引入了擬合(fitting)的概念,研究者可以根據(jù)模型擬合數(shù)據(jù)的精確度作出模型的調(diào)整,由此分析統(tǒng)計(jì)數(shù)據(jù)所呈現(xiàn)出的真正趨勢。(“All Models Are Wrong”671)
如果說量化是將文本轉(zhuǎn)化為客觀數(shù)據(jù)的集合,那么建模則是在數(shù)據(jù)集合中搭建結(jié)構(gòu)關(guān)系。不同的量化方式會使文本產(chǎn)生不同的數(shù)據(jù),在這個意義上,文本能夠產(chǎn)出的數(shù)據(jù)集合是多維的(multi-dimensional)。但假如研究者只關(guān)注單一維度的數(shù)據(jù),只因該數(shù)據(jù)的變動幅度非常大,就宣稱該數(shù)據(jù)的變化代表了整個數(shù)據(jù)集合的變化,這就很容易產(chǎn)生錯誤的研究結(jié)論。因?yàn)橛锌赡茉摂?shù)據(jù)本身的權(quán)重很小,因此用它來進(jìn)行整體評價是不恰當(dāng)?shù)?。只有?dāng)研究者利用多維數(shù)據(jù)建構(gòu)出模型,并通過模型挖掘出多維數(shù)據(jù)的結(jié)構(gòu)關(guān)系,才能從整體上去把握某個數(shù)據(jù)的變化是不是對于整體具有顯著意義,也才能判定數(shù)據(jù)與數(shù)據(jù)之間呈現(xiàn)出何種聯(lián)系。如此一來,研究者對于數(shù)據(jù)的選擇與分析會更加系統(tǒng)化,更加有據(jù)可依,而不是僅憑自身直覺來決定研究方向。
除了對系統(tǒng)性的強(qiáng)調(diào)外,建模的另外一個意義在于迭代性。模型,本質(zhì)上是對研究對象的一種數(shù)學(xué)關(guān)系表達(dá),是一種理想化的產(chǎn)物,因此在實(shí)踐中,模型并不一定能夠準(zhǔn)確地描述文本,只能盡量地去接近文本。知名統(tǒng)計(jì)學(xué)家喬治·博克斯(George Box)的名言“所有的模型都是錯的”(All models are wrong)便是對這一事實(shí)的高度總結(jié)。但這并非意味著模型就是無效的,恰恰相反,模型的有效之處就在于其“無效”。換而言之,建構(gòu)模型的一大意義便在于尋找模型所反饋的錯誤。模型中出現(xiàn)的錯誤一般分為兩種:在代入數(shù)據(jù)后,要么模型中出現(xiàn)了研究假設(shè)認(rèn)為不應(yīng)該存在的現(xiàn)象,要么沒有出現(xiàn)假設(shè)認(rèn)為應(yīng)該存在的現(xiàn)象。在上述兩種情況中,或者是建構(gòu)的模型出現(xiàn)了問題,或者是研究假設(shè)出現(xiàn)了問題,不管是何種情況,都迫使研究者不得不重新調(diào)整自身建構(gòu)的模型或假設(shè),使之更加符合數(shù)據(jù)的情況。這種調(diào)整并非一次性的,而是永無止境的,因?yàn)槟P椭皇菍ο蟮囊环N表征,它雖不是真實(shí)的對象,但卻可以無限地接近對象,而正是建模這種不斷在假設(shè)、模型、數(shù)據(jù)之間來回往返的迭代性,才使得模型得以揭示人類憑借直覺所感知不到的事實(shí)。
蘇真本人便用具體的實(shí)踐展示如何理解建構(gòu)模型的意義。他和芝加哥大學(xué)的霍伊特·朗(Hoyt Long)聯(lián)手,在《文學(xué)模式識別:細(xì)讀與機(jī)器學(xué)習(xí)之間的現(xiàn)代主義》(“Literary Pattern Recognition:Modernism between Close Reading and Machine Learning”)中進(jìn)行了一次以俳句(haiku)為對象的建模研究。具體而言,蘇真和朗首先發(fā)現(xiàn),通過傳統(tǒng)的文本細(xì)讀法進(jìn)行俳句的本體研究,無法同通過歷史主義批評的俳句傳播研究很好地結(jié)合起來,更無法揭示出俳句確立為俳句的本質(zhì)性和特殊性,究竟在它從日本傳播到西方的過程之中發(fā)生了什么變化。兩位研究者試圖找出一種能夠展示文體形式層面與歷史文化層面之間相互影響的研究方法。為此,蘇真和朗構(gòu)建了一個在傳統(tǒng)文本細(xì)讀中被確定為俳句的英語俳句語料庫(由翻譯作品和改編作品組成)與一個非英語俳句語料庫,他們先為俳句做了一個通用的文本表示模型(詞包模型),并給出一個關(guān)于區(qū)分俳句與非俳句的假設(shè):俳句可以通過共有的措辭和音節(jié)數(shù)模式來區(qū)別于非俳句。在這個假設(shè)的基礎(chǔ)上,他們運(yùn)用機(jī)器學(xué)習(xí)(machine learning)讓電腦程序在兩個語料庫自動識別分類依據(jù)。蘇真和朗發(fā)現(xiàn),模型對俳句翻譯作品的判斷率較高,改編作品卻較低。他們一開始懷疑原因是假設(shè)中對模型的限定條件過多,于是刪除了音節(jié)數(shù)的特征。但再進(jìn)行測試后卻發(fā)現(xiàn),在考察條件變得更加寬松后,機(jī)器的判斷率卻下降了。這種分類錯誤反而揭示了俳句和非俳句語料庫具有重疊之處的可能。蘇真與朗通過對這些錯誤分類的重新審視,發(fā)現(xiàn)了在美國詩歌領(lǐng)域中可能存在更為廣泛的“東方主義共鳴”。這種作為統(tǒng)計(jì)學(xué)意義上的俳句模式為研究者重新描繪了俳句的定義與傳播路徑,并提示了一種在流傳過程中所保持的“俳句性”。
在上述例子中,蘇真展示了不斷調(diào)整假設(shè)與模型,最終完成文學(xué)批評的全過程。這種批評并非一次性完成的,而是要通過不斷的迭代才能達(dá)到。部分學(xué)者提出以“尺度閱讀”(scalable reading)來形容這種研究,即研究者“形成一些松散的猜想→大規(guī)模的文獻(xiàn)挖掘(所謂‘遠(yuǎn)讀’)→找出離群值→通過回歸細(xì)讀來精準(zhǔn)定位→提出隨意閱讀難以發(fā)現(xiàn)的問題——又或者,繼續(xù)在細(xì)讀、遠(yuǎn)讀間回返,不斷精確模型,無限逼近想要再現(xiàn)的問題”(趙薇46)。麥吉爾大學(xué)學(xué)者安德魯·派博(Andrew Piper)就在其《枚舉:數(shù)據(jù)與文學(xué)研究》(:,2018)中用示意圖展示了此種遠(yuǎn)讀與細(xì)讀的結(jié)合,如圖5所示:
圖5 (Piper 10)
本文認(rèn)為,上述說法有值得商榷之處?;诒疚脑趫D1提出的遠(yuǎn)讀分層模型,這種循環(huán)往復(fù)式的研究實(shí)際上一直發(fā)生在遠(yuǎn)讀方法的內(nèi)部,而非如圖5所示是遠(yuǎn)讀、建模與細(xì)讀三個獨(dú)立部分的組合。正是因?yàn)槟壳瓣P(guān)于遠(yuǎn)讀的研究并沒有清晰地提出閱讀媒介這一概念,才使得學(xué)界對遠(yuǎn)讀方法產(chǎn)生眾多的誤解。遠(yuǎn)讀從來都不是與細(xì)讀相互割裂的研究方法——從遠(yuǎn)讀1.0到遠(yuǎn)讀2.0的演變中,遠(yuǎn)讀一直能夠包含細(xì)讀,而這一包含方式,正是通過閱讀媒介實(shí)現(xiàn)的。
首先,在遠(yuǎn)讀1.0中,莫萊蒂的《猜想》其實(shí)有著兩個層次的細(xì)讀,第一重是作為閱讀媒介的民族文學(xué)專家對底層文本的細(xì)讀,第二重是莫萊蒂對于作為閱讀媒介的民族文學(xué)專家研究的細(xì)讀。不難發(fā)現(xiàn),《猜想》中的第一重細(xì)讀是為第二重細(xì)讀服務(wù)的,換言之,遠(yuǎn)讀1.0本身可以視為經(jīng)由閱讀媒介這一概念所連接起來的雙重細(xì)讀。
其次,在遠(yuǎn)讀2.0中,當(dāng)閱讀媒介被置換為更加“客觀”的數(shù)理方法之后,細(xì)讀的方式和意義均發(fā)生了改變。例如,通過閱讀媒介對文本的轉(zhuǎn)換,細(xì)讀可以無須讀“字”,而是讀“數(shù)據(jù)”和“圖”。如上文所示,對文學(xué)文本從“字”到“數(shù)據(jù)”與“圖”的認(rèn)知變化無疑打開了一個更為廣闊的文學(xué)思考空間。同時,遠(yuǎn)讀2.0中的細(xì)讀意義并不在于探討個別文本的神圣之處。與之相反,此番細(xì)讀實(shí)際上是在探究一個整體結(jié)構(gòu)中的異常之處。細(xì)讀異常能夠給予我們關(guān)于整體更深刻的洞見。正如學(xué)者吉云飛提出的,數(shù)字時代下文學(xué)研究一大張力在于“對局部的理解總是離不開對整體的理解”(181),這已然揭示了遠(yuǎn)讀與細(xì)讀的辯證法——如果說基于計(jì)算的遠(yuǎn)讀2.0是對于研究對象的系統(tǒng)性把握,那么細(xì)讀就是對這一系統(tǒng)把握的不斷調(diào)整。而這種調(diào)整機(jī)制,正是通過引入跨學(xué)科的閱讀媒介實(shí)現(xiàn)的。作為當(dāng)代遠(yuǎn)讀方法的持續(xù)探索者,蘇真的看法呼應(yīng)了上述觀點(diǎn):“文本細(xì)讀的結(jié)果為我們反思遠(yuǎn)讀方式的局限性提供了關(guān)鍵的機(jī)會?!保ā癛ace and Distant Reading”72)所以,在遠(yuǎn)讀2.0中,局部細(xì)讀是系統(tǒng)遠(yuǎn)讀的調(diào)整基礎(chǔ),后者始終包含著前者。
更進(jìn)一步來看,將遠(yuǎn)讀同細(xì)讀對立起來的態(tài)度,在一定程度上也反映了對學(xué)科范式轉(zhuǎn)變過程的誤解。一提起范式轉(zhuǎn)變(paradigm shift),人們往往會聯(lián)想到托馬斯·庫恩(Thomas Kuhn)所提出的“科學(xué)革命”,仿佛范式轉(zhuǎn)變的過程就是一場范式之間的權(quán)力斗爭,例如有數(shù)字人文學(xué)者表示,數(shù)字人文研究(遠(yuǎn)讀)需要融入主流人文學(xué)界,展示其在人文研究領(lǐng)域的領(lǐng)導(dǎo)力(Liu 495)。這種說法其實(shí)是變相地表達(dá)了數(shù)字人文研究(遠(yuǎn)讀)與傳統(tǒng)人文研究(細(xì)讀)存在競爭關(guān)系的觀點(diǎn)。問題在于,范式轉(zhuǎn)變并非逼迫研究者作出非此即彼的選擇。理解范式轉(zhuǎn)變的意義,要根植于庫恩如下的判斷:“范式改變的確使科學(xué)家對他們研究所及的世界的看法變了?!保?4)新范式的出現(xiàn)意味著我們關(guān)于對象的認(rèn)識方式切實(shí)發(fā)生了改變,但并不代表過去的研究方法全然失效了。范式轉(zhuǎn)變的意義更多在于充盈我們對研究對象的理解,而不在于掩埋我們到達(dá)今日這一認(rèn)識現(xiàn)狀的道路。
回到遠(yuǎn)讀與細(xì)讀的問題上,本文強(qiáng)調(diào)這并不是兩種截然獨(dú)立的研究范式。歸根結(jié)底,遠(yuǎn)讀是一種多學(xué)科研究方法的融合,傳統(tǒng)細(xì)讀自然是其中一種。而理解閱讀媒介所扮演的角色,則是理解這一方法融合的關(guān)鍵所在。在如今的數(shù)字時代,與其說媒介是人的延伸,不如說人分布于媒介之中。在認(rèn)知科學(xué)領(lǐng)域,已有眾多學(xué)者提出以“分布式認(rèn)知”(distributed cognition)來解釋人類與技術(shù)的交互方式。所謂分布式認(rèn)知,指的是主體對客體的認(rèn)知發(fā)生不僅局限于個體之內(nèi),而是分布于媒介、文化以及社會等多種外部因素中(Michael Engestrom 42 43)。認(rèn)知能力的分布并非簡單地將研究者的認(rèn)知任務(wù)交托給搜索引擎、數(shù)據(jù)庫以及文獻(xiàn)分析軟件等種種現(xiàn)代媒介,而是意識到“認(rèn)知任務(wù)分布于內(nèi)部表征和外部表征之中,分布式認(rèn)知活動源于二者的交互作用”(周國梅 傅小蘭150)。而細(xì)讀融入遠(yuǎn)讀的方式,正是研究者通過閱讀媒介從而與文本進(jìn)行多次交互所實(shí)現(xiàn)的:研究者可以利用遠(yuǎn)讀從更大范圍去驗(yàn)證細(xì)讀的猜想,而通過細(xì)讀,研究者反過來不斷地調(diào)整遠(yuǎn)讀的方向。因此,遠(yuǎn)讀對細(xì)讀的涵蓋亦可轉(zhuǎn)換為如下表達(dá)——遠(yuǎn)讀是在閱讀媒介加持下的交互式細(xì)讀。遠(yuǎn)讀不是對細(xì)讀的取代,而是對細(xì)讀在特定使用條件下所存缺陷的彌補(bǔ)。遠(yuǎn)讀的出現(xiàn)宣告了新時代中細(xì)讀的變化,而非細(xì)讀的消亡。而基于上述論證,本文也確認(rèn)了文學(xué)研究者之主體性在遠(yuǎn)讀實(shí)踐中的重要地位。文學(xué)研究者作為遠(yuǎn)讀方法的頂層存在,其主觀能動性在遠(yuǎn)讀方法中仍然非常重要。沒有研究者的細(xì)讀,就沒有不斷精進(jìn)完善的遠(yuǎn)讀。如果失去身處頂層研究者的主體構(gòu)思,僅憑閱讀媒介不可能產(chǎn)出有價值的文學(xué)研究。
綜上所述,閱讀媒介是遠(yuǎn)讀方法中具備改變認(rèn)知功能的信息反饋裝置。他人研究、量化分析和構(gòu)建模型是閱讀媒介三種不同的呈現(xiàn)方式,這三者都使得讀者意識到文學(xué)文本并非必須依賴親自細(xì)讀才能體會個中真意的“神圣文字”,文本可以從多個角度進(jìn)行理解——他人研究將文本轉(zhuǎn)化為專家意見,量化分析將文本轉(zhuǎn)化為數(shù)據(jù),建構(gòu)模型則是將數(shù)據(jù)轉(zhuǎn)化為系統(tǒng)。前兩者因?yàn)槿狈沈?yàn)證性、系統(tǒng)性和迭代性,因而產(chǎn)出的是一種靜態(tài)的認(rèn)知改變。構(gòu)建模型由于兼具這三個特性,因而是一種動態(tài)的認(rèn)知改變。也就是說,研究者通過中層閱讀媒介所反饋的信息,去查看底層“原始材料”中為何會出現(xiàn)離群值,或調(diào)整閱讀媒介,或調(diào)整假設(shè),最終產(chǎn)生有價值的文學(xué)批評。顯而易見,這種文學(xué)批評是通過改變研究者對文本的認(rèn)知方式所達(dá)到的,離開閱讀媒介這個概念,很容易將遠(yuǎn)讀僅僅理解為一種數(shù)字運(yùn)算的過程。
2019年4月29日,教育部、中央政法委以及科技部等多部委在天津聯(lián)合召開“六卓越一拔尖”計(jì)劃2.0啟動大會,建設(shè)新文科成為熱點(diǎn)話題。結(jié)合目前學(xué)界對新文科的討論,新文科之“新”,在于其融合新興產(chǎn)業(yè)領(lǐng)域、轉(zhuǎn)變傳統(tǒng)研究范式以及適應(yīng)社會發(fā)展需求(王銘玉 張濤)。而作為融合了文學(xué)、統(tǒng)計(jì)學(xué)以及計(jì)算機(jī)科學(xué)等多學(xué)科研究方法的遠(yuǎn)讀,正有成為新文科研究范式的潛力。
當(dāng)然,想要讓遠(yuǎn)讀符合建設(shè)新文科的要求,我們?nèi)杂胁簧賳栴}需要解決。首先,最關(guān)鍵的因素,即文學(xué)研究者該如何提出合適的問題。所謂合適的問題,指的是需要利用以及能夠利用遠(yuǎn)讀去解決的問題。例如鑒賞陶淵明《歸園田居》中的詩人心態(tài),由于其文本量過小,加之心態(tài)這一目標(biāo)難以量化,可能就不太適合使用遠(yuǎn)讀。而大規(guī)模文本的問題就非常需要遠(yuǎn)讀的方法,就像文學(xué)史研究一樣。本文甚至認(rèn)為,大部分文學(xué)史研究,都有可能在運(yùn)用遠(yuǎn)讀后被重新改寫。
而在提出合適的問題這一方面,目前國內(nèi)較為常見的一種做法是,組成一個跨學(xué)科的團(tuán)隊(duì),由文學(xué)學(xué)者提出問題,再由統(tǒng)計(jì)學(xué)者將之轉(zhuǎn)化為統(tǒng)計(jì)模型,然后由計(jì)算機(jī)學(xué)者進(jìn)行編程和計(jì)算,最后再由文學(xué)學(xué)者進(jìn)行闡釋(項(xiàng)蕾等175)。團(tuán)隊(duì)合作的方式能夠較好地彌補(bǔ)文學(xué)研究者缺乏數(shù)理知識背景的缺陷,但這也涉及一個難點(diǎn),就是從文學(xué)學(xué)者所提出的文學(xué)問題,到統(tǒng)計(jì)學(xué)者(或者計(jì)算機(jī)學(xué)者)的實(shí)踐操作之間,究竟該如何轉(zhuǎn)換。為了填補(bǔ)這一學(xué)科之間的鴻溝,文學(xué)研究者是否需要了解一定的統(tǒng)計(jì)與編程的概念及方法?
在本文看來,這一回答是肯定的。遠(yuǎn)讀既然要發(fā)展為新文科,自然應(yīng)當(dāng)是由人文學(xué)者主導(dǎo)研究,而在這種情況下,主導(dǎo)者的跨學(xué)科思維就顯得非常重要。完全依靠團(tuán)隊(duì)中理工科出身的學(xué)者來完成具體實(shí)踐是不夠的,從蘇真對俳句的研究中就可以看出,光是模型的迭代就同時需要文學(xué)、統(tǒng)計(jì)學(xué)以及計(jì)算機(jī)科學(xué)等多種學(xué)科知識的有機(jī)結(jié)合,這并不是一段段能夠獨(dú)立切割開來的任務(wù)流程,并不是說人文學(xué)者提出問題后就可以高枕無憂,等著統(tǒng)計(jì)學(xué)家與計(jì)算機(jī)學(xué)家生產(chǎn)出數(shù)據(jù)后再進(jìn)行分析。跨學(xué)科知識的結(jié)合是全過程的,而參與這一過程必然要求人文學(xué)者理解和掌握更多其他學(xué)科的知識。
雖然這并不意味著文學(xué)研究者就必須成為統(tǒng)計(jì)專家或者計(jì)算機(jī)專家,但跨學(xué)科的知識掌握究竟需要多少才算足夠?這倒確實(shí)是一個亟待解決的問題。以編程這個問題為例,目前學(xué)界對此就有明顯的爭議。例如,有學(xué)者認(rèn)為團(tuán)隊(duì)合作就足夠了,人文學(xué)者并不需要掌握編程技術(shù)(Ore“To Code or Not To Code”)。而朗則建議人文學(xué)者需要了解一定的編程知識,同時也要具備實(shí)際操作的能力(朗蘇真 林懿52)。本文認(rèn)同朗的觀點(diǎn),而這也是本文提出閱讀媒介的基礎(chǔ),即不同的認(rèn)知工具會帶來不一樣的認(rèn)知結(jié)果。莫萊蒂本人曾表示過編程對改變認(rèn)知方式的重要性:
我在年輕的研究生和同事身上看到,編碼賦予了他們一種我所不具備的,而且將來也不可能獲得的智慧和直覺。這種智慧體現(xiàn)在腳本編寫上。但是,在編寫腳本的過程中,某個概念也會逐漸成形。雖然這個概念往往不會以概念的形式呈現(xiàn),但是你能夠看到它就隱藏在編寫的腳本里[……]因此,我認(rèn)為開展數(shù)字人文研究項(xiàng)目的高校,不管這些項(xiàng)目是大是小,都應(yīng)該確保每個人都有機(jī)會獲得這種智慧。(丁斯曼 莫雷蒂36)
這可以證明,編程或建模不僅僅是一種分析方法,更是一種認(rèn)知工具。正是基于對認(rèn)識方式的改變,研究者對諸如風(fēng)格或流派劃分等問題才可能有全新的認(rèn)識,因?yàn)轭愃频膯栴}完全有可能轉(zhuǎn)化為統(tǒng)計(jì)學(xué)意義上的詞語特征問題。斯坦福文學(xué)實(shí)驗(yàn)室(Stanford Literary Lab)所發(fā)布的《小冊子4》()就佐證了這一見解。在這一名為《2 958部19世紀(jì)英國小說的定量文學(xué)史:語義群集法》(“A Quantitative Literary History of 2,958 Nineteenth Century British Novels:The Semantic Cohort Method”)的文章中,莫萊蒂的兩位研究生利用算法提取并分析出近3 000本小說中的詞義群變化,判斷出19世紀(jì)英國小說敘事模式經(jīng)歷了從“講述”到“展示”(from telling to showing)的變化,這一結(jié)果亦符合當(dāng)時不斷擴(kuò)大的社會空間的模糊性與流動性特征。因此,本文認(rèn)為人文學(xué)者至少要了解其他學(xué)科的核心研究范式,從而獲得一種改變自身認(rèn)知文學(xué)的能力,才有可能在學(xué)科融合的基礎(chǔ)上提出運(yùn)用遠(yuǎn)讀才能解決的重要問題。
亟須解決的第二個問題是文學(xué)文本數(shù)據(jù)的匱乏。盡管量化或建模的工作可以利用人工完成(莫萊蒂的《哈姆雷特》關(guān)系網(wǎng)絡(luò)就是手工繪制的),但目前越來越多運(yùn)用遠(yuǎn)讀方法的研究已經(jīng)需要依靠計(jì)算機(jī)來完成量化與建模的工作。而運(yùn)用遠(yuǎn)讀的前提是計(jì)算機(jī)必須能夠“讀到”文本,這就涉及文本的電子化。從目前來說,獲取電子化文本有兩種方式。第一種是利用現(xiàn)成的文本數(shù)據(jù)庫,例如谷歌圖書(Google Books)、青空文庫(Aozora Bunko)、古登堡計(jì)劃(Project Gotenberg),等等。但現(xiàn)有的數(shù)據(jù)庫未必包含研究者想要研究的文本,因此第二種方式則是研究者將想要研究的紙質(zhì)文本轉(zhuǎn)化為電子文本。而為了實(shí)現(xiàn)紙質(zhì)文本的電子化,研究者需要先掃描紙質(zhì)文本,然后將獲得的掃描圖像進(jìn)行分析處理,最終將其轉(zhuǎn)化為計(jì)算機(jī)能夠識別的字符,這一過程便是光學(xué)字符識別(optical character recognition,簡稱OCR)。
然而當(dāng)研究對象多達(dá)成千上萬本,甚至需要構(gòu)建一個數(shù)據(jù)庫的時候,OCR就非常耗時耗力,這種工作往往需要以年為時間單位進(jìn)行計(jì)算,這也是目前文本數(shù)據(jù)匱乏的重要原因之一。同時,OCR的識別率很大程度上依賴于文字檢測算法。就目前而言,OCR對現(xiàn)代印刷品的識別率較高,但對較為久遠(yuǎn)的印刷品以及紙稿的識別率就比較低。除非文字檢測算法能夠取得更加重大的進(jìn)步,否則當(dāng)面對無法進(jìn)行OCR的文本時就不得不考慮手動輸入,而這又加大了文本電子化的難度。以上兩種情況均可以考慮用外包(outsourcing)或者眾包(crowdsourcing)的方式來處理。外包,就是將文字識別、轉(zhuǎn)錄、矯正等工作交由專業(yè)的文字識別機(jī)構(gòu)來完成,而眾包則是將該工作以自由自愿的形式交給公眾志愿者來完成,例如上海市圖書館開展的盛宣懷檔案抄錄項(xiàng)目,選取盛宣懷檔案中與辛亥革命相關(guān)的日記、文稿以及信札等紙質(zhì)材料,供廣大民眾在線認(rèn)領(lǐng)轉(zhuǎn)錄。
最后便是研究成果的評價問題。因?yàn)檫h(yuǎn)讀方法本身是一種多學(xué)科方法的融合,因此對采用了遠(yuǎn)讀的文學(xué)研究的評價工作就不能由單個領(lǐng)域的評審專家來做。例如,傳統(tǒng)文學(xué)論文期刊評審文學(xué)論文的過程基本上要先由編輯初審,再交給對應(yīng)領(lǐng)域的文學(xué)專家多輪盲審,最終決定刊發(fā)與否。然而作為一個多學(xué)科合作的文學(xué)研究成果,單憑文學(xué)專家又如何能夠評判該成果所包含的統(tǒng)計(jì)學(xué)運(yùn)算?同時,運(yùn)用遠(yuǎn)讀的文學(xué)研究很多時候會涉及計(jì)算機(jī)代碼的運(yùn)算,而這些代碼往往是研究成功的關(guān)鍵所在,那么期刊的文學(xué)專家又該如何基于這些代碼去復(fù)現(xiàn)研究過程是否可靠?因此,面對新興的遠(yuǎn)讀方法,文學(xué)期刊或許需要擴(kuò)大盲審專家的學(xué)科領(lǐng)域。同時,學(xué)界還需要創(chuàng)建更多有能力評價人文學(xué)科與理工學(xué)科交叉成果的期刊,例如清華大學(xué)主辦的《數(shù)字人文》與中國人民大學(xué)主辦的《數(shù)字人文研究》,等等。學(xué)術(shù)期刊之所以重要,是因?yàn)槠涫菍W(xué)術(shù)研究成果最為核心的展示平臺。缺乏更多合適的平臺,遠(yuǎn)讀便難以進(jìn)入學(xué)界的視野中心,其中蘊(yùn)含的多學(xué)科研究方法便難以得到推廣與理解,學(xué)科融合更將舉步維艱。
不難發(fā)現(xiàn),遠(yuǎn)讀方法極大地改變了文學(xué)領(lǐng)域的研究思路。本文試圖指出閱讀媒介是內(nèi)嵌于遠(yuǎn)讀方法中具備改變認(rèn)知功能的信息反饋裝置,以此理解遠(yuǎn)讀方法的出發(fā)點(diǎn)。研究者通過閱讀媒介所反饋的信息,改變自身認(rèn)知文學(xué)文本的方式,進(jìn)而改變了文學(xué)研究的方法。從他人研究、量化分析到建構(gòu)模型,閱讀媒介的進(jìn)化是遠(yuǎn)讀方法演變的核心。在這一演變過程中,遠(yuǎn)讀方法展示出對跨學(xué)科研究方法的融合,并揭示了這一融合的價值,最終指明了傳統(tǒng)文科向新文科轉(zhuǎn)變的可能路徑。文學(xué)研究者只有深入地去了解遠(yuǎn)讀方法的核心,而不是止步于量化、數(shù)據(jù)與建模等概念,才能夠理解實(shí)踐遠(yuǎn)讀方法的關(guān)鍵,以獲得遠(yuǎn)讀方法對文學(xué)研究范式轉(zhuǎn)變的啟示。
同時,我們也需要意識到,遠(yuǎn)讀對整個文學(xué)學(xué)科的建制提出了更新的要求。建設(shè)新文科是文學(xué)學(xué)科發(fā)展不可逆轉(zhuǎn)的潮流,這是文學(xué)在面對當(dāng)代科技沖擊時所作出的積極反應(yīng)。不過新文科的建設(shè)并非是一朝一夕便能夠完成的,從遠(yuǎn)讀方法的演變過程中可以發(fā)現(xiàn),學(xué)科間不同方法的借鑒與融合是一個需要反復(fù)探索的工作。為此,文學(xué)研究者既要更加重視跨學(xué)科合作,也要促進(jìn)自身的思維轉(zhuǎn)變,理解其他學(xué)科的研究范式,做到取長補(bǔ)短。同時,學(xué)界也要為新文科的成果建立完善的評價體系,創(chuàng)造成更多的展示機(jī)會。唯有打通人文學(xué)科與其他學(xué)科之間的知識壁壘,才能為新文科的發(fā)展奠定堅(jiān)實(shí)基礎(chǔ),使文學(xué)研究在新時代煥發(fā)更強(qiáng)大的活力。