張子軾
大數(shù)據如今已滲透到人類生活的方方面面。隨著各種數(shù)據庫的大量出現(xiàn),傳統(tǒng)文史研究也發(fā)生了變化。
近年來,與“e考據”和“數(shù)字人文”相關的研究日趨增多,因此,進一步探索如何更切實地將理論、方法與研究實踐有機結合,就變得十分重要。
揚棄既有研究成果
大數(shù)據時代對傳統(tǒng)文史研究產生的影響,首先表現(xiàn)在資料上。近些年新推出的電子資源在內容上甚至有超越傳統(tǒng)出版物之勢,檢索的快捷性和精確度,可以令學者省卻翻檢群書、游歷訪書之勞。
在這樣的學術環(huán)境下,探討某些疑難問題可能只需簡單檢索,許多“懸案”的解決難度也相應大幅度降低。前人因資料局限而不得不大量運用的“理校”“推論”“悟證”等方法,在大數(shù)據時代無疑需要重新進行揚棄。
在學術史研究中,清代人往往因所見善本不豐而大量運用“理?!狈ㄕ归_研究,其中有的結論或與善本相合或遭善本否定。當下既然已經能夠在研究中大量占有善本供校勘,那么這種研究方法雖仍有學習的必要,但其實用性難免會打些折扣。大量新材料理應引發(fā)大量新結論,一些“常識”或“定論”必然也會隨之遭到質疑甚至顛覆,這對于現(xiàn)有的研究自然會有相當明顯的刺激作用。
近年來學界對于近代學人的成就時有爭論,原因之一就在于當時學者以一人之力所做的資料性工作,精度和效率都很容易被數(shù)據庫所超越。不少在民國時期“古史辨”中幾乎成為公認的定論,隨著出土文獻的發(fā)現(xiàn)而被推翻(典型的例子如對《孫子兵法》的辨?zhèn)危?,足見新材料在某些研究領域確實處于相當核心的地位。
通過數(shù)據庫重新打撈那些以往不被關注的文獻,這實際上仍是發(fā)現(xiàn)新材料,其性質與考古相似,亦可稱之為當下的“預流之學”(陳寅?。骸抖鼗徒儆噤浶颉罚?/p>
與此相關的一個問題是,在超過120億字的可檢索古典文本,以及各種不同類型的數(shù)據庫中,還蘊藏諸多問題可供發(fā)掘。這些數(shù)據資源能否被學者使用,很大程度上取決于其所在單位購買的數(shù)據庫數(shù)量。在高校間已有明顯“數(shù)位落差”的現(xiàn)狀下,學者個人的學術水準有可能受到所處文獻環(huán)境的制約,而不同文獻環(huán)境導致的信息素養(yǎng)的差異可能會進一步拉大這一差距。
數(shù)據庫大量涌現(xiàn),學術評判標準也會發(fā)生變化。出于“功利”眼光計算,當代學者費盡周折的考據工作,很可能被下一代學者輕易解決。其原因并非人的智力才能有別,而是由于文獻環(huán)境不斷變化提供的巨大方便使然。
一代有一代之學術,面對不同的環(huán)境,學術范式也應隨之轉移。所以,當下正是海量文獻可供使用、可以大有作為的時代,也是考據研究缺乏亮點而趨于同質化的時代。換言之,即使是在數(shù)據仍未被充分電子化的當下,考據研究的合法性也正在受到沖擊。一般性的文獻挖掘仍然重要,但能夠解決核心學術問題的研究更為重要。
引發(fā)學術倫理討論
在電子檢索受到學界矚目的同時,一些批評尤其是對于學術倫理的討論也隨之熱門起來。
電子檢索的高效快捷,令不少學者擔憂其可能引發(fā)更嚴重的學術不端。比如,有的研究者可能對相關領域了解有限,但在檢索工具的助力下仍敢匆匆上馬,輕易立說;有的研究者征引繁復,可謂博瞻,但實際上許多材料是脫離語境的“遙讀”,經不起細加辨析;有的研究者過于迷信電子文本的全面性,但卻因此而忽略了那些未被電子化的文獻;有些電子文本存在錯誤,研究者未核查原書導致誤引誤斷,等等。
對這些實際存在甚至時顯泛濫的問題,我們可以嘗試從以下幾個方面來進一步認識。
首先,技術本身是中立的,上述批評很大程度上是在針對研究者個人的文史素養(yǎng)和治學態(tài)度,并未否定技術能夠令優(yōu)秀學者如虎添翼。而擅長檢索的學者也能夠認識到文史素養(yǎng)的重要性,并非一味依賴電子資源。從現(xiàn)實情況看,電子技術確實使那些曾經看上去遙不可及的專家學者(尤其是實證型學者),變得可以企及了,這至少是正在提升學術研究的平均水準。???、箋注、考據中的一些前期工作,可由計算機更精準地代勞,在人機結合的研究過程中,“高明子弟,自然沉潛”。
其次,當下的電子文本即使是掃描版也往往不能完全忠于原書,引用之前必須與原始文獻核對。這恰好說明,現(xiàn)在的數(shù)據庫還沒有脫去以往“工具書”的性質。前人做研究,亦會查閱類書、索引等,甚至常有轉引、代查的現(xiàn)象,這證明“工具”本來也不被排斥。如將數(shù)據庫理解為一種高級的“逐字索引”,則其學術價值自然彰顯。此外,紙質文獻(尤其是整理本)同樣常常有誤。古籍校勘中,也多有以“通行本”為底本的典范。事實上,核心問題不在于當下的電子文本有多少具體錯誤,而在于能否使注釋具有可回溯性和規(guī)范性。如果一味排斥征引電子文本,很可能也會使數(shù)據庫開發(fā)者缺乏將電子文本精確化的動力。
促進材料深度辨析
一般觀點通常認為,電子檢索作為一種“捷徑”,往往令學者過于重視關鍵詞,卻忽視同一詞語所處的不同語境。時代的風氣、作者的習慣、史料的性質等,都在大數(shù)據時代的考據中付之闕如。在筆者看來,這種弊病在傳統(tǒng)文史研究中同樣并不少見,卻有可能在大數(shù)據時代覓得新的解決契機。
首先,大數(shù)據時代資源豐富,找尋輔證、反例的難度與以前相比要小很多,可以在一定程度上防治孤證武斷,并有益于深入理解史料所處的特殊語境。
其次,當大數(shù)據呈現(xiàn)出全部信息時,可以在多方面幫助學者辨析問題,甚至可以用“結構取義”的方式展開新的研究思路。例如高樹偉在研究《永樂大典》的輯佚條例時,推翻了認為《大典》“直取全文”的成說,并且依靠海量文本對校的方式,提出了《大典》征書的新通例。這一變化,或許在一定程度上可以借助通例建立參考系,并以此來重新認識前人輯佚的成果,不妨稱之為類似于“理?!钡摹袄磔嬝薄|S一農最近在脂批本“寧”字抄寫避諱的研究中,也提及抄本研究應建立參照系,這些見解似可遙相呼應。
又如在文本細讀工作中,作者究竟是直接使用某一典故,還是受到文化傳統(tǒng)影響,實際存在多種可能。箋注、考據家往往側重于鎖定甲乙間的因果承襲關系,但容易忽視文化大傳統(tǒng)的潛在影響。近年來古代文學研究引入“互文”理論,嘗試說明這種影響往往是網絡狀、多源多流的。張昊蘇在此基礎上提出“e互文”思路,意在指出大數(shù)據時代有助于深入理解這種多樣性。
借助大數(shù)據提供的便利,考據學出現(xiàn)了“后發(fā)先至”的現(xiàn)象。前輩學者經年研究的難題,很可能被新一代學人在短時間內解決。至少在這類問題上,信息素養(yǎng)的意義很可能要高于傳統(tǒng)知識體系,掌握查找知識的能力很可能也比掌握知識更為高效且重要。
這里并非是說新時代的學者可以不掌握知識而解決問題,而是說,信息素養(yǎng)可以出于研究的需要,迅速進入新的領域并建構具有針對性的知識體系,這種大幅度的跨界是傳統(tǒng)學者較難做到的。
當然,就目前的研究狀況來看,大數(shù)據時代“數(shù)字人文”研究的多數(shù)成果仍然是在研究具體問題,而尚未建立新的范式。但近十余年來這一領域的學術積累正以指數(shù)級速度增長,足以令人期待由“量變”產生“質變”?;蛟S,未來傳統(tǒng)學者也應該未雨綢繆,需要考慮能否做出不被數(shù)據庫遮蔽、凸顯研究者個性的學問。