李天 耿旭樸
摘要:新文科概念的提出,肯定并強(qiáng)化了數(shù)字人文方法對文學(xué)研究的可行性。文章從三個(gè)方面對數(shù)字人文方法進(jìn)行反思:一是從數(shù)字人文與人文計(jì)算的區(qū)別出發(fā),闡釋數(shù)字人文方法在文學(xué)研究中的獨(dú)特性;二是在對數(shù)字人文方法的客觀性提出質(zhì)疑的同時(shí),重審數(shù)字人文方法的研究對象;三是在國內(nèi)文學(xué)發(fā)展新現(xiàn)象的語境下,探討方法原創(chuàng)的可能性。
關(guān)鍵詞:數(shù)字人文;新文科;方法論;人文計(jì)算
中圖分類號(hào):G644 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1004-9436(2022)05-000-05
“融通”是新文科的首要特征。新文科是指對傳統(tǒng)文科進(jìn)行學(xué)科重組、文理交叉,即把新技術(shù)融入哲學(xué)、文學(xué)、語言等課程,為學(xué)生提供綜合性的跨學(xué)科學(xué)習(xí)。新文科的概念是針對傳統(tǒng)的學(xué)科分類來說的,它打破了人文與科學(xué)之間的界限,其特征主要體現(xiàn)在多學(xué)科協(xié)同、融入信息技術(shù)以及變革人才培養(yǎng)模式等方面。新文科的“融通”是學(xué)科之間的交叉通融,但與此同時(shí),不能遮蔽“文”的本質(zhì);文理交匯后,必須更加重視和凸顯“文”的特質(zhì)[1]。
基于計(jì)算機(jī)技術(shù)的數(shù)字人文具有典型的新文科特征,值得注意的是,新文科之“新”,不僅代表研究方法的革新,更在于新理念中蘊(yùn)藏著的研究方法的原創(chuàng)可能性,即在數(shù)字人文的語境下,生成自己的新方法。對文學(xué)研究者來說,一方面,目前的數(shù)字人文方法主要來源于英美文學(xué)研究學(xué)者;另一方面,媒介技術(shù)的變革與網(wǎng)絡(luò)文學(xué)的發(fā)展,促成了獨(dú)具中國特色的新的文學(xué)現(xiàn)象,并且它們與數(shù)字人文具有契合性,使得中國文學(xué)具有方法原創(chuàng)的可能性。
結(jié)合新文科背景,文章系統(tǒng)地考察了國內(nèi)外文學(xué)研究中數(shù)字人文方法的理論與實(shí)踐,主要基于以下三點(diǎn):其一,數(shù)字人文并不是簡單的量化方法,也并非人文計(jì)算的某個(gè)階段,它是一種真正的跨學(xué)科研究方法;其二,數(shù)字人文并不能保證研究的客觀性,它的積極意義也不在于此;其三,數(shù)字人文方法與傳統(tǒng)文學(xué)研究方法的研究對象有根本區(qū)別,這建構(gòu)了數(shù)字人文的獨(dú)特性。
1 作為文學(xué)研究方法的數(shù)字人文
數(shù)字人文通常被認(rèn)為是人文計(jì)算發(fā)展的最新階段[2],然而,從方法論的意義上來說,數(shù)字人文與人文計(jì)算并不是一回事,雖然都以量化為起點(diǎn),但量化所起的作用卻是截然不同的。
1.1 風(fēng)格辨析與人文計(jì)算
人文計(jì)算的先驅(qū)是19世紀(jì)的科學(xué)家托馬斯·門登霍爾(Thomas Mendenhall)和文學(xué)教授盧修斯·謝爾曼(Lucius Sherman),他們采用人工計(jì)算的方式,將科學(xué)方法帶入文學(xué)研究領(lǐng)域,通過人工方式計(jì)算文學(xué)文本中特定單詞的頻率(詞頻),據(jù)此制作圖形化的曲線,以區(qū)分不同作者或觀察文學(xué)的發(fā)展變化。19世紀(jì)中晚期是數(shù)據(jù)方法運(yùn)用在文學(xué)領(lǐng)域中的第一個(gè)高峰,日后計(jì)算機(jī)的出現(xiàn)大大提升了數(shù)據(jù)的量值和準(zhǔn)確度,但基本上沿襲了這些開拓者的思路。
計(jì)算機(jī)的介入使得人文計(jì)算的概念開始形成,學(xué)界普遍認(rèn)為人文計(jì)算出現(xiàn)在20世紀(jì)中葉,其標(biāo)志是意大利神父羅伯托·布薩(Roberto Busa)的風(fēng)格辨析研究。從1949年開始,布薩使用計(jì)算機(jī)對神學(xué)家托馬斯·阿奎那(Thomas Aquinas)的《神學(xué)大全》全集進(jìn)行處理,生成了中世紀(jì)拉丁文字詞的索引,研究者可以據(jù)此對其的風(fēng)格進(jìn)行辨析,判定作品的著作權(quán)。布薩可以說是早期人文計(jì)算的代表,與19世紀(jì)的人工計(jì)算相比,人文計(jì)算離不開計(jì)算機(jī)的輔助,通過計(jì)算機(jī)對文學(xué)文本進(jìn)行處理。
在文學(xué)研究中,人文計(jì)算最典型的類型是風(fēng)格辨析。早期的風(fēng)格辨析集中于作者風(fēng)格,即對某部作品的著作權(quán)進(jìn)行判斷。奧古斯都·摩根(Augustus de Morgan)在1851年就提出了詞匯表的量化研究可以作為辨析保羅書信作者的方法。如前所述,門登霍爾和謝爾曼是19世紀(jì)中期將量化方法應(yīng)用在文學(xué)領(lǐng)域的代表人物,他們研究單詞長度與句子長度,將之作為一種確定文學(xué)風(fēng)格的方法,門登霍爾試圖通過詞頻辨析狄更斯和威廉·薩克雷的風(fēng)格差異,謝爾曼則通過文學(xué)作品中句子長度的不同觀察英國文學(xué)風(fēng)格的變化[2]。
中國文學(xué)對人文計(jì)算方法的采用,始于對《紅樓夢》的著作權(quán)辨析,并于19世紀(jì)80年代形成第一個(gè)高峰,這個(gè)時(shí)期出現(xiàn)了一批用量化方法分析《紅樓夢》的研究文章,如華東師范大學(xué)陳大康[3]和復(fù)旦大學(xué)李賢平[4]等人的成果。此后,用統(tǒng)計(jì)進(jìn)行《紅樓夢》作者研究的方法一直沿用至今。
1.2 大數(shù)據(jù)與數(shù)字人文
數(shù)字人文概念的興起與文學(xué)大數(shù)據(jù)直接相關(guān)。21世紀(jì)以來,互聯(lián)網(wǎng)的發(fā)展、計(jì)算與存儲(chǔ)能力的飛升催生了大數(shù)據(jù),與以前的數(shù)據(jù)庫相比,數(shù)字人文概念下的文學(xué)數(shù)據(jù)不僅數(shù)量巨大,而且出現(xiàn)了相應(yīng)的大數(shù)據(jù)分析工具,谷歌圖書和古騰堡工程是文學(xué)大數(shù)據(jù)的典型代表。
基于文學(xué)大數(shù)據(jù),數(shù)字人文的方法真正得到應(yīng)用,“文化組學(xué)”和斯坦福文學(xué)實(shí)驗(yàn)室的工作是數(shù)字人文頗有代表性的成果。2011年,艾略茲·利波曼·埃頓(Erez Lieberman Aiden)和簡-拜普提斯特·邁克爾(Jean-Baptiste Michel)等提出了“文化組學(xué)”的概念,認(rèn)為單詞像基因一樣包含可繼承的信息[5]。2007年,弗朗哥·莫萊蒂(Franco Moretti)用圖表的形式勾勒出了從18到19世紀(jì)英法意西日等國的小說在數(shù)量和題材上的變化[6]。2010年,斯坦福文學(xué)實(shí)驗(yàn)室創(chuàng)立,以小冊子是形式發(fā)表了一系列數(shù)字人文的研究成果,他們的研究不僅多元化,并且開發(fā)了多個(gè)文學(xué)大數(shù)據(jù)分析工具。
到了數(shù)字人文階段,風(fēng)格辨析仍然是重要的研究領(lǐng)域,與人文計(jì)算的辨析方法不同,斯坦福文學(xué)實(shí)驗(yàn)室開發(fā)了DocuScope等工具進(jìn)行類型風(fēng)格識(shí)別,取得了令人矚目的成果。他們使用DocuScope對莎士比亞的戲劇進(jìn)行類型分組,其結(jié)論不僅與傳統(tǒng)的類型分組一致,而且還能自動(dòng)選擇出被批評家們視為例外的文本(如《亨利三世》)。不僅如此,DocuScope還可以準(zhǔn)確地區(qū)分出工業(yè)小說、哥特式小說和教育小說等類型風(fēng)格。06781BA0-0821-4532-9259-C02AC285977A
而最能體現(xiàn)大數(shù)據(jù)方法的是“遠(yuǎn)距離閱讀”與“大分析”?!斑h(yuǎn)距離”的意義在于挖掘經(jīng)典之外的海量文本的價(jià)值,其與文本細(xì)讀結(jié)合,能產(chǎn)生更自由、開放的探索。莫萊蒂結(jié)合歷史、地理與進(jìn)化理論,提供了兩百多年來多個(gè)國家的新文學(xué)史樣態(tài),其中既有文本細(xì)讀(微觀),也有抽象模型(宏觀)的建立。
2 證實(shí)與闡釋:數(shù)字人文方法是否客觀
數(shù)字人文方法與傳統(tǒng)文學(xué)研究方法的差異,通常被表述為證實(shí)性與闡釋性的不同,“遠(yuǎn)距離”與“近距離”的不同,定量與定性的不同等。其本質(zhì)在于對客觀性的追求。
從方法本身來說,數(shù)字人文通常涉及數(shù)據(jù)采集與整理、模型建立、結(jié)論分析等過程,它們追求的是一個(gè)共同的目標(biāo):客觀性。風(fēng)格辨析在于為作者風(fēng)格或類型風(fēng)格提供客觀的證據(jù),“遠(yuǎn)距離”與“大分析”方法在于“追求一個(gè)更為理性的文學(xué)史”。通常,數(shù)字人文方法的客觀性被表述為證實(shí)性(Verifiable),其與傳統(tǒng)研究方法的闡釋性(Interpretive)對立。后者往往被認(rèn)為是文學(xué)研究的本質(zhì),它根植于個(gè)體研究者對具體文本的閱讀,依據(jù)研究者自身的理論框架得出相應(yīng)的結(jié)論,如對文學(xué)現(xiàn)象的闡釋以及對現(xiàn)象背后原因的挖掘等。
在數(shù)字人文的研究者看來,闡釋的缺陷在于它的主觀性,闡釋是“靠觀察來激發(fā)的,作為一種收集證據(jù)的方法,不管科學(xué)的還是人文的,觀察都是有缺陷的”[7]。這里的觀察是指研究者的主觀視角與判斷,基于觀察的闡釋具有軼事的(Anecdotal)及推斷的(Speculative)特征,也因此遠(yuǎn)離了客觀性,甚至在某種程度上削弱了學(xué)術(shù)研究的科學(xué)性。而數(shù)字人文方法因?yàn)闇p少了人為的參與,以數(shù)據(jù)調(diào)查代替?zhèn)€人觀察,提供確定的文學(xué)史事實(shí)。另一方面,客觀性與樣本數(shù)量往往成正比,大數(shù)據(jù)所達(dá)到的樣本數(shù)量可以使調(diào)查達(dá)到一定程度的廣泛性,數(shù)據(jù)量越大,可靠性就越高,大數(shù)據(jù)的廣泛性取代了以往隨機(jī)的代表性樣本,最大限度地保證了調(diào)查的客觀性。研究者通常將闡釋性與定性、主觀、文學(xué)相關(guān)聯(lián),而將數(shù)字人文的證實(shí)性與定量、客觀、科學(xué)相關(guān)聯(lián),并將證實(shí)性與闡釋性對立起來,認(rèn)為二者之間存在本質(zhì)差異。
那么,數(shù)字人文中的證實(shí)性能否保證絕對的客觀性?是否與闡釋性對立?在數(shù)字人文的證實(shí)中,最基礎(chǔ)的是對既定知識(shí)的證實(shí)或者糾正。以喬克斯對查爾斯·范寧(Charles Fanning)的研究結(jié)果的驗(yàn)證為例,范寧認(rèn)為愛爾蘭裔美國作家在1900—1930年間經(jīng)歷過“失去的一代”,即在這段時(shí)間內(nèi)作家匱乏。而喬克斯通過大數(shù)據(jù)分析,發(fā)現(xiàn)“失去的一代”的論點(diǎn)不成立,或者說是一種錯(cuò)覺,這是因?yàn)榉秾幰詯蹱柼m裔美國作家的經(jīng)典作品為研究對象,這些作品的作者大部分為男性,而1900—1930年代男性作者的缺乏讓研究者產(chǎn)生了“失去的一代”的錯(cuò)覺。喬克斯的大數(shù)據(jù)包括250年間所有的出版數(shù)據(jù),以及作品的地理環(huán)境和作者的性別、出生地、年齡和居住地等信息,發(fā)現(xiàn)1900—1930年這段時(shí)間并不缺少女性作家。在喬克斯看來,以經(jīng)典作品作為研究對象的方法,忽視了更為廣泛的文學(xué)體系,容易對文學(xué)史現(xiàn)象產(chǎn)生誤判[8]。重審數(shù)字人文的客觀性不難看出,證實(shí)性/客觀性來自兩個(gè)方面:其一,數(shù)據(jù);其二,統(tǒng)計(jì)方法。這兩點(diǎn)看上去都成功避免了人為的干預(yù),能保證研究結(jié)論的客觀性。但其實(shí)不僅數(shù)據(jù)本身很難保證絕對的客觀性,統(tǒng)計(jì)方法本身的適用性也需要考量。
2.1 數(shù)據(jù)的闡釋性
在數(shù)字人文方法中,數(shù)據(jù)是客觀性的重要保證,數(shù)據(jù)被認(rèn)為獨(dú)立于觀察者之外,具有確定性。然而,目前的數(shù)據(jù)庫建設(shè)與利用并不能遠(yuǎn)離研究者個(gè)人的主觀闡釋。不同于公開的大型全本數(shù)據(jù)庫,那些為文學(xué)研究創(chuàng)建的主題性數(shù)據(jù)庫都存在研究者的主觀預(yù)設(shè),如英國小說類型(1740—1900年)的主題數(shù)據(jù)庫,莫萊蒂表示該數(shù)據(jù)庫對小說的分期標(biāo)準(zhǔn)建立在他個(gè)人對英國小說史的理解之上,也就是說該數(shù)據(jù)庫的創(chuàng)建本身存在選擇性,包含著研究者個(gè)人的闡釋,不可能達(dá)到完全的客觀。在科學(xué)研究中,客觀性的重要標(biāo)準(zhǔn)之一在于可重復(fù)性,換句話說,如果數(shù)據(jù)庫足夠客觀,那么其他的研究者就可以從被引用的這些資源中重建原始數(shù)據(jù)庫。但無論是莫萊蒂還是喬克斯,都承認(rèn)這是不可能的,就算喬克斯列出了他所分析的標(biāo)題和作者,其他人也不可能在完全不接觸他所使用的文本的情況下重建他的論點(diǎn)。
目前大部分主題數(shù)據(jù)庫對文獻(xiàn)外部數(shù)據(jù)的采集,一般會(huì)采納文獻(xiàn)的首次出版信息及出版所在地等。然而嚴(yán)格說來,只采集書籍第一次出版的數(shù)據(jù)是片面的,文學(xué)作品的版本并不單一,有些書籍空有標(biāo)題卻從未出版過,有些文學(xué)作品被重版多次,而作品的其他內(nèi)部信息,如作者、出版者、編輯、插圖、書商、廣告者等卻被選擇性忽視了。另一方面,根據(jù)18世紀(jì)之后的全球化趨勢,僅從國別表明文學(xué)作品的地理性太過單薄。選擇性數(shù)據(jù)庫建立的文學(xué)體系忽視了文學(xué)作品之間的不同以及體系的動(dòng)態(tài)變化。這些闡釋性的選擇造成了文學(xué)體系的不充分性,往往只是在一定時(shí)間和空間中流通的文學(xué)的子集,無法達(dá)到大數(shù)據(jù)所要求的全本和整體的概念。正因?yàn)閿?shù)據(jù)的主觀性,大衛(wèi)·布魯爾認(rèn)為,“遠(yuǎn)距離”方法雖解析了“伴隨而來的那些經(jīng)典化過程”[9],卻以忽視歷史上文學(xué)作品的不同面向?yàn)榇鷥r(jià)。數(shù)字人文方法的認(rèn)同者們一方面贊成使用數(shù)據(jù),另一方面也承認(rèn)這種知識(shí)的新形式無可避免地會(huì)抽象或簡化原本復(fù)雜的文學(xué)現(xiàn)象,以至于用“與魔鬼共謀”來形容“遠(yuǎn)距離”與“大分析”方法[10]。
2.2 統(tǒng)計(jì)方法的模糊性
由于往往涉及數(shù)據(jù)采集與整理、模型建立、結(jié)論分析等過程,且數(shù)據(jù)處理方法受益于統(tǒng)計(jì)學(xué)較多,數(shù)字人文也被稱為“統(tǒng)計(jì)學(xué)與社會(huì)語言學(xué)的混合”。然而,在數(shù)字人文研究中,統(tǒng)計(jì)方法類似于一個(gè)黑匣子,研究者個(gè)人并不需要了解其運(yùn)作過程,傳統(tǒng)的論證過程被包裹起來。例如,斯坦福文學(xué)實(shí)驗(yàn)室在研究莎士比亞戲劇和小說類型時(shí)采用主成分分析(PCA)方法,它將一組文本里許多具有相似分布的不同詞頻組合到一個(gè)新的成分中,從而提取出一小組相關(guān)的能夠反映出這組文本之間的主要差異的主成分,雖然提供了一種可以用來同時(shí)“閱讀”大量詞頻的圖形化方式,但這些新的主成分究竟代表什么含義卻是模糊的。06781BA0-0821-4532-9259-C02AC285977A
2.3 研究的理論預(yù)設(shè)
約翰·弗羅認(rèn)為,“遠(yuǎn)距離”并不能實(shí)現(xiàn)“一個(gè)類型與傾向的客觀敘述”的目標(biāo),因?yàn)樗鲆暳四承┗镜年P(guān)鍵因素,即作為基礎(chǔ)的形態(tài)分類并不是事先給予或不證自明的,而是“通過闡釋性的Decision建構(gòu)的”[11]。這里所謂的形態(tài)分類,即DocuScope對小說進(jìn)行分類之前,需要先有教育小說、哥特式小說等既定的類型,而這些既定類型建立在文學(xué)的闡釋基礎(chǔ)之上。基于這個(gè)基本假設(shè)條件,才能依據(jù)小說的標(biāo)題由20~25個(gè)詞縮短到6~7個(gè)詞,得到市場規(guī)模和標(biāo)題長度之間的否定性關(guān)系,以及專有名詞與小說是轉(zhuǎn)喻關(guān)系,而抽象名詞和小說是隱喻關(guān)系等結(jié)論。
然而,如果這種質(zhì)疑是針對數(shù)字人文方法的客觀性,那么該質(zhì)疑實(shí)際上是無意義的,因?yàn)轭A(yù)設(shè)是幾乎所有能產(chǎn)生新知識(shí)/觀點(diǎn)的基石,無論是何種領(lǐng)域的研究,都不可能離開研究者的預(yù)設(shè)。如果沒有研究者的理論預(yù)設(shè),機(jī)器閱讀就會(huì)失去其目的,無論工具多么先進(jìn),終將不能產(chǎn)生有意義的研究成果。數(shù)字人文方法并不會(huì)顛覆研究本身的價(jià)值取向,而是其論證方法,其本質(zhì)則源于研究對象的不同。
3 “文本”:面向?qū)ο蟮募w話語
數(shù)字人文與傳統(tǒng)文學(xué)研究方法之所以看上去如此不同,并不是因?yàn)槎ㄐ耘c定量的區(qū)分,而在于研究對象的差異。數(shù)字人文的研究對象并非傳統(tǒng)意義上的文學(xué)文本,而是作為對象的“文本”。
3.1 面向?qū)ο蠖钦撌霰旧淼亩嗝浇檎撟C方式
文學(xué)文本是傳統(tǒng)文學(xué)研究的對象,即作為整體的文學(xué)作品,這是一個(gè)由語言文字組成、充滿著作者情感與想象的完整世界,因此文學(xué)作品從本質(zhì)上來說是無法量化的。文學(xué)是審美形態(tài)的語言作品,并不是語言的機(jī)械組合。語言文字是作品的組成成分,但將它們組織起來的是作者的主觀意識(shí),無論是情感還是認(rèn)知都無法被量化,作為完整世界的文學(xué)作品也無法被切斷為詞或句子。量化意味著將文學(xué)作品打碎、分離,它不再是完整統(tǒng)一的文學(xué)世界,而變成了一堆毫無情感與想象力的數(shù)值,從這個(gè)意義上看,計(jì)數(shù)與文學(xué)天生就是對立的。
然而數(shù)字人文的研究對象并非僅是傳統(tǒng)文學(xué)意義上的文本,它更傾向于作為物質(zhì)對象的“文本”,如果借用計(jì)算機(jī)語言來比喻,傳統(tǒng)文學(xué)研究方法類似于“面向過程”,研究的是文學(xué)作品內(nèi)部的論述過程,而數(shù)字人文方法則是一種“面向?qū)ο蟆薄ρ芯空邅碚f,文學(xué)文本類似于“所指”,研究者需要闡釋文本內(nèi)部傳達(dá)的意義,而“文本”則更像“能指”,它向外擴(kuò)展它作為質(zhì)料的地位。
風(fēng)格辨析所研究的正是作為語言質(zhì)料的“文本”。風(fēng)格辨析之所以能通過數(shù)字人文的方法來實(shí)現(xiàn),其理論基礎(chǔ)在于風(fēng)格所呈現(xiàn)出的語言特征。文學(xué)作品可以被看作字母、單詞與句子的組合,作為語料它們是可以被量化的。文學(xué)風(fēng)格是一種相對穩(wěn)定的整體話語特色,在一定程度上可以體現(xiàn)為語言與修辭,雖然影響風(fēng)格的因素包括作者的情感體驗(yàn)、個(gè)性與心理、藝術(shù)素質(zhì)與時(shí)代影響等,但在具體文本中,風(fēng)格表現(xiàn)為對某些詞匯的重復(fù)性使用,這一重復(fù)性成了可被量化的特征。另外,語言質(zhì)料還被用來研究標(biāo)題與文學(xué)市場的關(guān)系(莫萊蒂),以及個(gè)體小說家在文學(xué)史上的影響力(喬克斯)等。
“遠(yuǎn)距離”與“大分析”所依賴的不僅是“文本”的語言質(zhì)料,更是它在大文化語境中的新坐標(biāo)。當(dāng)文學(xué)作品被置于文化生產(chǎn)的更大領(lǐng)域中,被置于其他文化產(chǎn)品和出版物的族群之中,新的坐標(biāo)使之擁有了更多的信息維度,這是“遠(yuǎn)距離”與“大分析”能有效進(jìn)行的基礎(chǔ)。當(dāng)今“文本”的物質(zhì)信息與印刷時(shí)代不同,它們擁有多媒介的表現(xiàn)形式,呈現(xiàn)出比以前更強(qiáng)的流動(dòng)性,基于文字處理軟件與轉(zhuǎn)化工具,“文本”可以作為對象被改變、替換、計(jì)算,也可以轉(zhuǎn)化成其他媒介形式,一個(gè)主對象由多媒介對象環(huán)繞,不同的媒介形式產(chǎn)生“文本”的不同面向?!拔谋尽辈辉偈钦Z言構(gòu)成的單個(gè)文本,而是由縱橫交錯(cuò)的各種面向共同完成,從而使得文本性(Texture)與其原來的“紋理”和“紡織品”的含義再次關(guān)聯(lián)。正如馬克等將出版物、檔案、語料庫作為三個(gè)基本概念,研究者用“場域”來形容數(shù)字人文方法下的大文化語境,“遠(yuǎn)距離閱讀”并不關(guān)注單個(gè)文本的具體特點(diǎn),而是通過文本語料庫考察更大的趨勢和模式[12]。
與物質(zhì)對象相應(yīng)而生的是多媒介的論證方式。統(tǒng)計(jì)工具的設(shè)計(jì)、可視化的運(yùn)用等,都是針對“文本”而產(chǎn)生的新論證方式。對大規(guī)模的數(shù)據(jù)集所展現(xiàn)出的大跨度的趨勢或關(guān)系,可視化是比文字更清晰、精確并且更富有說服力的論證方式,能讓曾經(jīng)隱藏的信息變得視覺化,《圖表、地圖、樹:文學(xué)史的抽象模型》里的圖表、樹作為分析與解釋工具用來揭示世界小說發(fā)展的總體規(guī)律,《網(wǎng)絡(luò)理論,情節(jié)分析》里的網(wǎng)狀圖用來顯示對哈姆雷特人物關(guān)系的全新發(fā)現(xiàn)[13],《大分析:數(shù)字方法與文學(xué)史》里的蜂巢用來作為文學(xué)史影響力論證的總結(jié),它們構(gòu)成了闡釋性的一部分,以至于能“促生新的內(nèi)容”,甚至能“產(chǎn)生詩意的效果”[14]。如學(xué)者查德·魏爾蒙用“驚奇”的移位來解釋數(shù)字人文對圖表、地圖和示意圖的偏愛,在這里,“遠(yuǎn)距離閱讀”中的“距離”并不僅僅是一種機(jī)器功能,而是這些參與到文學(xué)閱讀中的新式示意圖和圖表的功能,它們本身就是文本,可以被閱讀,可以被解釋,也可以成為驚奇的對象[15]。
3.2 個(gè)人話語到集體話語
從精神性到物質(zhì)性,從文本到“文本”,研究對象的變化引發(fā)了一系列的連鎖效應(yīng)。從研究過程到研究者構(gòu)成,也都出現(xiàn)了與以往截然不同的面貌。“新文科”的“融通”意味著研究方法的交叉與跨越,這種跨越并非僅體現(xiàn)在個(gè)體研究者的知識(shí)構(gòu)成上,需要不同領(lǐng)域的學(xué)者合作完成。換句話說,意味著個(gè)體著述的時(shí)代轉(zhuǎn)入合作項(xiàng)目的時(shí)代。
傳統(tǒng)以“正典”為對象、以細(xì)讀為方式的研究方法,建立在個(gè)體閱讀的基礎(chǔ)之上,對有限的數(shù)據(jù)集進(jìn)行精細(xì)分析,長期以來形成了對一系列主題歷史性的、一般性的和風(fēng)格上的研究。在數(shù)字人文語境下,面對大數(shù)據(jù)集和基于文本挖掘的文化分析,研究開始更傾向于集體性和合作性,流動(dòng)性的文本意味著集體話語的生成。
“文本”的物質(zhì)性帶來的是研究對象的擴(kuò)大化,文學(xué)作品所依賴的媒介正變得不透明。在印刷術(shù)一統(tǒng)天下的時(shí)代,書籍成為一種不言而喻的、透明的媒介,研究者只需要讀取承載于其上的文本信息,穩(wěn)定的印刷文化使研究者忽視了潛在的物質(zhì)性力量,而在信息物質(zhì)化與媒介多元化的時(shí)代,以往被視為透明的媒介已經(jīng)與創(chuàng)造活動(dòng)密不可分。研究對象擴(kuò)展到作為空間記錄單位的書籍,擴(kuò)展到墨跡、雕版印刷和出版商的物質(zhì)性歷史,擴(kuò)展到媒介與人的認(rèn)知和身體互動(dòng)。著述不僅是重要見解的簡單包裝,而且還是整個(gè)社會(huì)文化裝置的一部分。06781BA0-0821-4532-9259-C02AC285977A
面對新的研究對象,個(gè)體研究已經(jīng)無法滿足數(shù)字人文的需要,“項(xiàng)目”一詞越來越多地出現(xiàn)在數(shù)字人文的研究目錄之中,研究者正在經(jīng)歷從個(gè)體著述時(shí)代轉(zhuǎn)入合作創(chuàng)作項(xiàng)目的時(shí)代,項(xiàng)目管理也成為數(shù)字人文領(lǐng)域中的重要課題。項(xiàng)目集體包括不同領(lǐng)域的研究者,也包括知識(shí)平臺(tái)的構(gòu)建者以及互動(dòng)形式的參與者。數(shù)字人文研究過程中,文學(xué)研究者、數(shù)據(jù)庫設(shè)計(jì)者及計(jì)算機(jī)技術(shù)人員正緊密合作,他們利用數(shù)字性手段進(jìn)行論證,再通過多元媒體組合進(jìn)行傳播,知識(shí)平臺(tái)不再僅僅只是圖書管理與技術(shù)人員或者出版單位的工作。學(xué)術(shù)交流形式的改變,使得讀者參與、探索、探討、互動(dòng)等對著述發(fā)揮著越來越重要的作用。在數(shù)字人文出版物上發(fā)表的項(xiàng)目列出一大批作者也是常見現(xiàn)象。上述的斯坦福文學(xué)實(shí)驗(yàn)室的工作大部分都是群體作者,涉及平臺(tái)開發(fā)更是如此。安妮認(rèn)為,“以我為核心的單一著述模式已經(jīng)轉(zhuǎn)變?yōu)橐晕覀優(yōu)橹行牡暮献餍灾瞿J健盵14]。
4 結(jié)語
從“融通”的意義上來說,數(shù)字人文具有典型的新文科特征,新文科之“新”蘊(yùn)藏著研究方法的原創(chuàng)可能性。數(shù)字人文的方法,無論是論證方式、分析工具還是數(shù)據(jù)庫設(shè)計(jì),大部分仍然來自英美文學(xué)實(shí)踐,國內(nèi)方法的原創(chuàng)性并不突出。但英美的研究主要集中于傳統(tǒng)的文學(xué)形態(tài)——出版物。就西方數(shù)字人文的主要研究機(jī)構(gòu)而言,無論是斯坦福文學(xué)實(shí)驗(yàn)室,還是數(shù)字人文中心,文本分析與文學(xué)史研究都占據(jù)較大比例。
而新時(shí)代,最具有中國特色的文學(xué)形式是網(wǎng)絡(luò)文學(xué)。20世紀(jì)末誕生的網(wǎng)絡(luò)文學(xué)迅速發(fā)展到今天的龐大規(guī)模,不僅成為讀者接受的主要文學(xué)形式,也成為文學(xué)研究與產(chǎn)業(yè)研究的重要對象。比起傳統(tǒng)文學(xué)作品,網(wǎng)絡(luò)文學(xué)更適合數(shù)字人文的方法,不僅因?yàn)樗哂性臄?shù)字性,也因?yàn)榕c傳統(tǒng)印刷文學(xué)相比,網(wǎng)絡(luò)文學(xué)更具有物質(zhì)性,它更像是一個(gè)對象,一個(gè)被各種媒介形式和交互方式包圍的對象。
一方面,數(shù)字人文方法擅長處理大數(shù)據(jù)集,而能夠產(chǎn)生文學(xué)大數(shù)據(jù)的,除了日漸成熟的各類文學(xué)數(shù)據(jù)庫之外,最顯著的當(dāng)屬網(wǎng)絡(luò)文學(xué)大數(shù)據(jù)。它不僅擁有天然的電子文本優(yōu)勢,還因?yàn)閺?qiáng)互動(dòng)性產(chǎn)生了龐大的實(shí)時(shí)數(shù)據(jù)流。不論在學(xué)術(shù)界還是產(chǎn)業(yè)界,數(shù)據(jù)都是分析網(wǎng)文最重要的指標(biāo),就同一時(shí)間段所產(chǎn)生的文本數(shù)據(jù)來說,無論是單個(gè)作品的體量,還是作品的數(shù)量,網(wǎng)絡(luò)文學(xué)已經(jīng)遠(yuǎn)遠(yuǎn)超過傳統(tǒng)文學(xué)。另一方面,網(wǎng)絡(luò)文學(xué)并不是傳統(tǒng)意義上單純的文學(xué)話語,而是一個(gè)多面向的“文本”。在這個(gè)文學(xué)生態(tài)系統(tǒng)中,作者與讀者的數(shù)量前所未有,接受者意圖可能直接影響作品生產(chǎn),而且大量影視作品改編自網(wǎng)絡(luò)文學(xué),IP概念的興起使得它超過了傳統(tǒng)文學(xué)的傳播形態(tài)。
數(shù)字人文幾乎與計(jì)算機(jī)技術(shù)同步發(fā)(下轉(zhuǎn)第頁)(上接第頁)展,與世界接軌的信息產(chǎn)業(yè)為我國提供了產(chǎn)生自生科學(xué)方法的環(huán)境。典籍的數(shù)字化是信息產(chǎn)業(yè)發(fā)展的直接影響之一,統(tǒng)計(jì)學(xué)與計(jì)量學(xué)等為數(shù)字人文提供了方法上的保障??萍嫉陌l(fā)展為數(shù)字人文提供了產(chǎn)生模型和數(shù)據(jù)方法的土壤,中國文學(xué)研究可以在此基礎(chǔ)上發(fā)展出自己的研究方法。
參考文獻(xiàn):
[1] 陳鵬.“新文科”要培養(yǎng)什么樣的人才[N].光明日報(bào),2019-05-20(008).
[2] 李天.數(shù)字人文背景下的文學(xué)研究:量化方法在中西文學(xué)研究中的比較[J].廈門大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2020(5):153-162.
[3] 陳大康.從數(shù)理語言學(xué)看后四十回的作者:與陳炳藻先生商榷[J].紅樓夢學(xué)刊,1987(1):293-318.
[4] 李賢平.《紅樓夢》成書新說[J].復(fù)旦大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),1987(5):3-16.
[5] 讓-巴蒂斯特·米歇爾,等.使用百萬數(shù)字化書籍的文化定量分析[J].科學(xué),2010(331):176-182.
[6] 弗蘭克·莫萊蒂.圖表,地圖,樹:文學(xué)史抽象模型[M].紐約:維索出版社,2007:7-13.
[7] 馬修·喬克斯,等.十九世紀(jì)文學(xué)的重要主題[J].詩學(xué),2013(6):750-769.
[8] 馬修·喬克斯.大分析:數(shù)字方法與文學(xué)史[M].香檳:伊利諾伊大學(xué)出版社,2013:36-46.
[9] 大衛(wèi)·布魯爾.計(jì)數(shù)、共鳴和形式,一種思辨的宣言(附注)[J].十八世紀(jì)小說,2011(2):161-170.
[10] 希瑟·愛.近而不深:文學(xué)倫理與描寫轉(zhuǎn)向[J].新文學(xué)史,2010(2):371-391.
[11] 約翰·弗羅.思考小說[J].新左翼評論,2008(49):137.
[12] 馬克·阿爾吉-休伊特,等.正典/檔案:文學(xué)場域大型動(dòng)力學(xué)[J].山東社會(huì)科學(xué),2017(9):46-62.
[13] 弗蘭克·莫萊蒂.網(wǎng)絡(luò)理論,情節(jié)分析[J].新左翼評論,2011(68):80-102.
[14] 安妮·博迪克,等.數(shù)字人文:改變知識(shí)創(chuàng)新與分享的游戲規(guī)劃[M].馬林青,韓若畫,譯.北京:中國人民大學(xué)出版社,2019:45.
[15] 查德·魏爾蒙,曾毅.神圣閱讀:從奧古斯丁到數(shù)字人文主義者[J].山東社會(huì)科學(xué),2017(9):38-45.
作者簡介:李天(1984—),女,湖北荊州人,博士,副教授,研究方向:數(shù)字人文、新媒體藝術(shù)、影像美學(xué)。
耿旭樸(1981—),男,河南南陽人,博士,高級工程師,系本文通訊作者,研究方向:大數(shù)據(jù)、數(shù)字信號(hào)處理、遙感技術(shù)。06781BA0-0821-4532-9259-C02AC285977A