王濤
在這樣一個人人都在為 “大數(shù)據(jù) ”趨之若鶩的時代,數(shù)字史學無疑令人著迷。但自以羅森茨威格(Roy Rosenzweig)為代表的學者提出 “數(shù)字史學 ”的概念以來,經(jīng)過幾十年的發(fā)展,國內(nèi)世界史學界對數(shù)字史學還比較陌生。造成這種困境的原因在于,國外的數(shù)字史學圈長期致力于的一項工作是對史料的數(shù)碼化整理。這些工作并非不重要,甚至可以說相當具有基礎性:文獻的數(shù)字化處理是解決巧婦難為無米之炊的前提,可視化的成果展現(xiàn)是讓歷史研究走進公眾視野的必由之路。但是,更具核心價值的具體研究環(huán)節(jié)如果長期缺失,數(shù)字史學的前景堪憂。實際上,真正運用數(shù)碼科技,直接從史料中挖掘有效信息,并且進行符合學術規(guī)范的歷史分析,換句話說,有干貨的歷史研究成果不是太多,而是太少。從這個意義上說,美國內(nèi)布拉斯加大學林肯分校的威廉 ·托馬斯(William Thomas)關于美國內(nèi)戰(zhàn)時期鐵路問題的研究專著就顯得異常重要,可以成為我們了解數(shù)字史學如何進行具體研究的極好案例。
從傳統(tǒng)學科上劃分,托馬斯的著作屬于美國史范疇,其主題是討論鐵路在美國內(nèi)戰(zhàn)前后所扮演的重要角色。這看上去是一個非常傳統(tǒng)的研究課題。他在書中提到的比較有創(chuàng)新的見解,是對
“現(xiàn)代性 ”這個概念進行了新的闡釋。在托馬斯看來,所謂現(xiàn)代性在十九世紀中期的美國社會表現(xiàn)為一種對身體移動的掌控。能夠自由遷徙,不受限制地旅行,這就是現(xiàn)代社會。鐵路的出現(xiàn)為身體移動帶來了極大便利,以至于在后來的內(nèi)戰(zhàn)中,鐵路成為輸送兵力和武器的高效交通工具,最終讓北部聯(lián)邦軍在謝爾曼(William Sherman)的率領下,抓住了鐵路的戰(zhàn)略意義,通過控制、利用以至于破壞南方的鐵路系統(tǒng),為聯(lián)軍的勝利做出了重要貢獻:所有這些事實都在指向一個顯而易見的真理,鐵路是 “現(xiàn)代性最直接的指標 ”。托馬斯在書中還用大量篇幅敘述了南方黑奴如何利用鐵路逃往北方自由世界的過程,讓鐵路承載的現(xiàn)代性意味更加明顯。所以,內(nèi)戰(zhàn)前的北方精英,尤其是廢奴運動的支持者有一個共識,鐵路將會像播種機一樣,在所到之處播撒文明與道德的種子,奴隸制度會因此瓦解。持這種天真想法的大有人在,英國商人科布登(Richard Cobden)在一八五九年進行了一次乘火車的美國之行后(行程達四千英里),也愈發(fā)篤信這個觀點。這種盲目的樂觀假定了一個前提,鐵路與奴隸制格格不入。
然而,托馬斯讓我們看到了一個錯位,奴隸制大行其道的南方,反而是鐵路建設更加積極和發(fā)達的區(qū)域。南方奴隸主用行動圓滿解決了這種錯位感:密集的奴隸勞動參與南方的鐵路建設,帶來了交通便利,讓種植園經(jīng)濟具有了更廣闊的市場,從而增加了對奴隸的需求,抬高了奴隸價格,由此推動了奴隸貿(mào)易的發(fā)展,也讓以火車站為中心的城市得到了商業(yè)機會,最終帶來了經(jīng)濟的全面增長。這個事實讓我們不得不接受這樣的邏輯:盡管奴隸制看上去與現(xiàn)代性針鋒相對,但事實表明,鐵路、奴隸制與現(xiàn)代性能夠和諧共存。在某種意義上說,南方的鐵路建設要比北方更加多快好省,隧道、高架橋更密集,成本反而還比北方便宜一半。因為奴隸主可以更有效率地調(diào)動奴隸參與建設,結果 “全世界最優(yōu)秀的鐵路建設專家 ……都在美國的南方開工 ”。這不僅讓北方所推崇的技術的現(xiàn)代化能夠帶來觀念的現(xiàn)代性這個信念破產(chǎn),而且南方從鐵路上的獲益,讓他們更加迷信自己得到了上天的眷顧,是不折不扣的 “現(xiàn)代性 ”國家。
從美國史研究的角度看,托馬斯的許多結論并沒有特別創(chuàng)新之處。不過,本書的真正價值不在于對美國史研究的原創(chuàng)性,而在于他的研究方法,特別是對數(shù)字史學的意義。托馬斯的這部專著大量使用數(shù)字化工具進行歷史問題的研究,包括詞頻的可視化, GIS,文本挖掘,這些都是近年來頗為流行的技術手段。
上文提到的內(nèi)戰(zhàn)時期鐵路與現(xiàn)代性的錯位,嚴格講并非托馬斯的原創(chuàng)。鐵路作為現(xiàn)代化的象征與助推劑,并不天然地同北方有親緣性,南方同樣在主動地使用它,雖然其目的是為了鞏固奴隸制。熟悉美國史的學者都了解這個假說,只是學界還缺乏全面的分析讓這個模糊的印象變成合理的結論。托馬斯采用了數(shù)字史學的方法,對大量基于貨運清單、薪水冊、人口統(tǒng)計年鑒的數(shù)據(jù)進行了分析,并用 GIS技術形象地指出,南方在鐵路里程上并不遜于北方,至于人均擁有火車站的數(shù)量,南方甚至要高于北方。換句話說,托馬斯的研究展現(xiàn)了數(shù)字史學的巨大優(yōu)勢,將一種似是而非的假說用堅實的數(shù)據(jù)與可靠的分析合理化。對于必然會牽扯大量數(shù)據(jù)的歷史研究課題,數(shù)字史學方法論或許是最佳的選擇。
自蘭克以來,歷史學家都致力于讓自己從事的學科更具科學性。雖然胡適所謂歷史就是任人打扮的小女孩這樣的歷史虛無主義也有一批擁躉,但是有情懷的學者或許并不甘心歷史學淪為與
“小女孩 ”相提并論的境地??茖W性意味著客觀性。對歷史學科而言,能夠實現(xiàn)客觀性的重要途徑,是在歷史分析的過程中,充分占有和挖掘史料。這種窮盡相關史料的愿望,在主張 “史學即史料學 ”的傅斯年那里是一個奢望,但是在數(shù)字史學的方法論中將成為一種常態(tài),因為我們借助電腦程序,采用數(shù)據(jù)挖掘技術,能夠從以 “大數(shù)據(jù) ”形態(tài)存在的史料中獲取有效信息,讓歷史研究更具客觀性,并向規(guī)范性與科學性的維度邁進。
托馬斯的數(shù)字史學方法也讓我們見識了歷史研究成果的多元化呈現(xiàn)。我們不要以為托馬斯的研究成果僅僅是一部專著而已,本書其實是名為 “鐵路與美國的現(xiàn)代化 ”這個龐大的數(shù)字史學項目的階段性成果。參與到這個項目組的學者有歷史、計算機、地理學、經(jīng)濟學等多學科背景,形成了包括專著、論文、會議、演講等多種成果發(fā)布形態(tài)。托馬斯還在教學中致力于推廣課題的理念,吸引了大量年輕人參與項目的演練。最新的一項成果是托馬斯與另外兩位有地理學背景的研究者合作完成的一篇論文,分析了鐵路工人的流動情況:跟我們的傳統(tǒng)認知不同,十九世紀中期,在鐵路工人的層面,并沒有所謂大規(guī)模的西進運動,相反有由西往東到巴爾的摩的東進趨勢。他們所使用的核心數(shù)據(jù)是一八四二至一八五七年間巴爾的摩 —俄亥俄鐵路公司的工人薪水冊。
實際上,這個項目組專門
創(chuàng)建了一個網(wǎng)站(地址為 http:// 復的境界,從而讓研究結論更加
railroads.unl.edu/)來展示他們的研 經(jīng)受得起考驗。
究成果。這個網(wǎng)站不僅有大量項 作為數(shù)字史學的研究成果,
目所依據(jù)的原始史料,而且對一 托馬斯的作品讓我們看到了未來
些數(shù)據(jù)進行了可視化處理,尤其 歷史研究的狀態(tài)。除非歷史學家
是對鐵路的建設情況,使用 GIS 抱定把自己煉成全才的決心,單
技術進行了信息輸出。這些內(nèi)容 打獨斗的歷史研究在未來幾乎是
都是開放的,網(wǎng)友可以隨時免費 一種奢望了。多年前,第三代年
下載使用。網(wǎng)站還用博客的形式 鑒學派的領軍人物之一的勒華拉
與訪問者進行交流,一方面披露 杜里曾預言,未來的歷史學家要
項目組的最新研究成果,另一方 成為程序員。這個設想在今天看
面網(wǎng)友可以通過留言直接與相關 來并不現(xiàn)實,歷史學家可以了解
研究者交流。 一些編程,但是所有計算代碼都
這種發(fā)布研究成果的方式, 由歷史學家一人承擔,不僅沒有
完全顛覆了傳統(tǒng)的歷史研究成果 必要,而且是不可能完成的任務。
形態(tài)。線上的網(wǎng)站秉承互聯(lián)網(wǎng)的 托馬斯領銜的這個 “鐵路與現(xiàn)代
開放與免費精神,也讓研究成果 化”項目組,就不是一個人單挑
借助網(wǎng)絡技術更加普及;線下的 能夠承受的,而需要集各色人才
專業(yè)書籍與學術論文,又兼顧了 的力量;換句話說,合作研究是
傳統(tǒng)的學術交流。網(wǎng)站上的原始 將來數(shù)字史學研究的一種基本的
資料和數(shù)據(jù),就像實驗室提供的 工作狀態(tài)。
化學試劑那樣,可供有興趣的讀 不過,本書的缺點正反映了
者自行解讀,重新驗證研究者的 數(shù)字史學研究者可能面臨的尷尬
結論是否正確。這或許是許多側 窘境。托馬斯要處理的信息量太
重數(shù)字人文的項目組把自己冠名 大,他在書中有時會偏離主題去
為實驗室(Lab)的原因,他們就 解讀那些看上去更有趣的材料。
想把包括歷史學在內(nèi)的人文研究 這從一個側面反映出我們所面臨
做到能夠像化學實驗那樣不斷重 的大數(shù)據(jù)時代,是一個信息龐雜
的時代。歷史學家可能需要在充斥的垃圾信息中挖掘真正有價值的內(nèi)容,這并不是一個愜意的事情。然而,有一個比喻恰到好處,我們現(xiàn)代人不會因為電子郵件常常有垃圾郵件,而完全棄用電子郵箱。同理,數(shù)字史學時代的史家與讀者,也不會因為信息過于龐雜、常常生出被無用信息淹沒的無助感而拒絕信息技術。實際上,數(shù)字史學擅長的課題正是大跨度的歷史問題,需要面臨龐大的信息量;不過正如美國布朗大學活躍的數(shù)字史學專家古爾第(Jo Guldi)強調(diào) “長時段 ”的回歸那樣,讓海量信息變得有序,在大數(shù)據(jù)中挖掘精粹,才是數(shù)字史學的發(fā)展前景。
一個基于數(shù)字史學的歷史作
品,如果在史學層面有硬傷,就會讓研究大打折扣。托馬斯的研究沒能逃過這樣的命運。他對鐵路在美國發(fā)展的歷史梳理并不準確,涉及的一些專有名詞和數(shù)據(jù)存在出入。這會讓讀者懷疑,在數(shù)字史學的研究項目中,對一些計算工具的使用,不過是一種傲慢的炫耀,就如有評論家指出的那樣,托馬斯對謝爾曼的書信文本進行可視化處理時,并沒有做出深入的內(nèi)容解讀,似乎僅僅為了漂亮的云標簽而刻意為之。這些問題都在提醒我們,真正有分量的數(shù)字史學研究依然任重道遠。
(William Thomas, The Iron Way, Railroads, the Civil War, and the Making of Modern America , New Haven: Yale University Press, 2011)