周 瓊 胡禮忠 (上海外國語大學(xué)圖書館 上海 200083)
2011年6月17—22日,在美國斯坦福大學(xué)成功舉辦了“2011數(shù)字人文國際大會”(以下簡稱大會),本次大會的主題是“包容的數(shù)字人文”(Big Tent Digital Humanities)。對于“包容”一詞,斯坦福大學(xué)的Matt Jockers和Glen Worthey①在大會主題發(fā)言前解釋到:一方面是希望它能承載此次大會的不同意見和看法、各種實驗和結(jié)果;另一方面,是因為這幾年學(xué)術(shù)屆對“數(shù)字人文”有所質(zhì)疑,希望通過大家的不斷努力,讓“數(shù)字人文”在各領(lǐng)域都有所作為。
大會高效、嚴謹,所有與會人員對“數(shù)字人文”時代的到來都很樂觀。這種氛圍感染了筆者,也促使筆者深思:在信息時代,圖書館員如何才能讓數(shù)字技術(shù)更好地為人文學(xué)科研究服務(wù)?筆者圍繞這個課題在斯坦福大學(xué)訪學(xué)期間進行了深入的研究,現(xiàn)將所思記錄下來,與同行共享。
目前學(xué)界尚沒有一個權(quán)威、可以讓人信服的“數(shù)字人文”的定義,它的創(chuàng)始人布薩神父也只是在其著作中展望了它的將來,而沒有做出具體的界定[1],但是我們從諸多關(guān)于“數(shù)字人文”的研究中可以清楚地感知到“數(shù)字人文”是什么。Unsworth教授在《什么是數(shù)字人文,什么又不是》一文中對“數(shù)字人文”給出了較明確的定義,他認為,“‘?dāng)?shù)字人文’是一種代表性的實踐、一種建模的方式,或者說就是一種擬態(tài)、一種推理、一個本體論約定。這種代表性的實踐可一分為二,一端是高效的計算,另一端是人文溝通?!盵2]我們可以從以下幾方面來理解這段話:
(1)“數(shù)字人文”是一門跨專業(yè)的學(xué)科 “數(shù)字人文”的研究范圍廣泛,包羅萬象。斯坦福大學(xué)人文實驗室的研究結(jié)果表明,“數(shù)字人文”是“研究文化與自然交叉的問題,超越了固有的關(guān)于藝術(shù)、科學(xué)、人文的分界,跨越學(xué)術(shù)、工業(yè)和大眾層面”[3]?!皵?shù)字人文”對從事相關(guān)研究的個人或團隊提出了很高的要求,要求他們不僅懂得數(shù)字技術(shù),還必須懂得人文知識。
(2)“數(shù)字人文”關(guān)注的是本體 “數(shù)字人文”帶有濃厚的信息科學(xué)色彩。本體論約定原是從哲學(xué)家奎因那里借用而來的,計算機學(xué)和信息學(xué)將它轉(zhuǎn)變成一種結(jié)構(gòu)。本體論使研究者從自己感興趣的領(lǐng)域出發(fā),搜集一切材料,建立某種概念框架或模型,將所有的知識重新組織,呈現(xiàn)出新的作品。而本體論約定則是以一個概念為前提,從它出發(fā)繼續(xù)探討是否還有別的東西存在。由此可以看出,這是對“數(shù)字人文”的信息科學(xué)要求,即對人文學(xué)科知識進行搜集、整理并按照一定的標準建立一個框架,繼而透過已知尋求未知。
(3)“數(shù)字人文”的每個項目都是一個具體成果的體現(xiàn)“數(shù)字人文”將每個思想碎片、每點思考的火花連接起來,形成一種知識表達?!皵?shù)字人文”研究不能單靠人文學(xué)科本身完成,它需要數(shù)字技術(shù)參與研究過程,并得出有計算機色彩的(或者說數(shù)字色彩的)人文結(jié)論?!?011數(shù)字人文國際大會”開幕式的主題演講者David Rumsey終生從事著利用GIS(Geographic Information System,地理信息系統(tǒng))處理歷史地圖、在虛擬世界里還原嚴肅的學(xué)術(shù)資料的工作,他把自己多年收藏的150 000張歷史地圖捐贈給斯坦福大學(xué),還將自己的研究成果全部公布在“David Drumsey歷史地圖藏品網(wǎng)”(http://www.davidrumsey.com/)上。閉幕式的主題演講者Michel Jean-Baptiste 和Aiden Erez Lieberman演示了題為“利用數(shù)字化圖書研究1800—2000年間的語言和文化變遷”的“數(shù)字人文”研究的精髓,他們建立了一個紙本圖書數(shù)字化的語料庫②,通過對這個語料庫的文化趨勢定量分析,側(cè)重研究1800—2000這200 年間的語言和文化變遷情況,并從中觀察詞的演變、語法的變遷、集體記憶的變化以及對技術(shù)的采納、對名利的追求、審查制度的變化、歷史的流變等[4]。
可以看出,“數(shù)字人文”這個新興的學(xué)術(shù)領(lǐng)域給人文研究注入了新的活力,它的出現(xiàn)并不是為了讓人文研究者加快研究速度、提升工作效率,而是給人文學(xué)者提供了新的研究方法和范式。那么,作為參與者之一的圖書館員可以為“數(shù)字人文”做些什么呢?
“數(shù)字人文”研究對文獻資源有很高的要求。圖書館員恰恰可以抓住這個機遇,在“數(shù)字人文”環(huán)境下充分發(fā)揮資源建設(shè)與整理的專長,在資源建設(shè)、數(shù)據(jù)庫建設(shè)及技術(shù)應(yīng)用方面有所作為。
高校圖書館的主要功能是支持和保障全校師生的教學(xué)、科研,而資源采購質(zhì)量直接關(guān)系到館藏能否滿足師生的需求,因此有必要系統(tǒng)地開展館藏資源建設(shè)。
2.1.1 采訪政策考慮館藏延續(xù)性
館藏積累并非一日之功,它需要圖書館人的不斷努力,而穩(wěn)定的采訪政策有利于館藏集中、持續(xù)的增長??梢哉f,使采購人員工作的隨機性更多地服從于理性的思考,是館藏建設(shè)從經(jīng)驗管理走向科學(xué)管理的標志[5]。只有依據(jù)合理的采訪政策建設(shè)館藏,才能豐富館藏。因此,館藏采訪政策應(yīng)當(dāng)隨著學(xué)校的學(xué)科調(diào)整而做相應(yīng)調(diào)整,從而為重點學(xué)科發(fā)展提供強有力的資料保障。
2.1.2 采訪目標條理化
采訪工作涉及多方參與,如何避免采訪人員的主觀性,將直接影響到館藏質(zhì)量。圖書館需要借助書商、教師、科研人員及采購主管的采訪優(yōu)勢,鼓勵多方參與,進行統(tǒng)一協(xié)調(diào)。
(1) 提高書商服務(wù)質(zhì)量 目前國內(nèi)高校圖書館的采訪渠道主要是書商招標,由于以往在招標過程中對于書商提供的服務(wù)要求不夠嚴格,缺少對圖書質(zhì)量的監(jiān)控,因而處于被動的弱勢狀態(tài)。近年來,各高校圖書館均根據(jù)本館的采訪政策提高了對書商的要求。例如,復(fù)旦大學(xué)圖書館在每次招標前都會對書商進行評估,客觀評價各書商的優(yōu)缺點并將意見反饋給合作書商,這其實是對合作書商提出了隱性約束;上海外國語大學(xué)圖書館要求合作書商保證重點出版社的圖書種類和到書率。同時,為獲得競爭優(yōu)勢,各大書商積極行動,紛紛采取了有效的改善措施。例如,目前遼寧北方出版物配送有限公司推出《學(xué)科新品選目》(每10日發(fā)布1期)供圖書館參考,并為圖書館提供館藏數(shù)據(jù)分析報告和專題推薦目錄定制服務(wù)。可見,圖書館的積極舉措使書商站在圖書館的角度提供館配服務(wù),提高了書商的服務(wù)質(zhì)量。
(2)發(fā)動教師及科研人員的參與 “數(shù)字人文”時代,跨學(xué)科的研究越來越多,對館藏的要求也越來越高,因此圖書館研究文獻資源的采訪工作需要廣大教師與科研人員的參與。例如,上海外國語大學(xué)圖書館除了24個語言類專業(yè)外,還有12個復(fù)合型專業(yè),隨著復(fù)合型專業(yè)的增多,館藏建設(shè)面臨巨大挑戰(zhàn)。教師的參與有助于圖書館從課程角度調(diào)整館藏結(jié)構(gòu),不僅能使館藏建設(shè)有效地支持教學(xué),而且能增強圖書館員與教師的良性互動。同時,科研人員的參與有助于建設(shè)研究性館藏,其專業(yè)的眼光能夠保證資源的學(xué)術(shù)價值和前沿性,保證研究資料的完整性。Carole Palmer曾這樣描述“數(shù)字人文”時代資源建設(shè)的圖景:“學(xué)術(shù)性館藏的建設(shè)者將是一類新的學(xué)者或者是團隊,他至少要在3個方面都很擅長,即專題學(xué)術(shù)輔以學(xué)科評判與分析、計算機技術(shù)處理、內(nèi)容的挑選與組織。”[6]可見,具有專業(yè)知識的研究者進入資源建設(shè)領(lǐng)域是多么的重要。同樣,如果圖書館能協(xié)助研究人員收集并整理各類型資料,那么將形成非常有體系、有學(xué)術(shù)價值的館藏,這也是十分讓人期待的。
(3)采購主管 “數(shù)字人文”環(huán)境下的資源采購中,采購主管的責(zé)任就是用對每一分錢,保證本校教學(xué)和科研擁有充分的可用資源。這就要求采購主管應(yīng)將注意力放在資金調(diào)度與采訪政策的執(zhí)行上,利用有限的資金購買更多的資源,審慎對待資源購買,協(xié)調(diào)各種資源的配置;對每份采購訂單進行仔細審核,保證采購質(zhì)量,并且定期進行館藏評估,檢查采訪工作是否過度偏離采訪政策。
“數(shù)字人文”較傳統(tǒng)人文學(xué)科研究的一個最顯著的區(qū)別是,“數(shù)字人文”的研究手段和研究對象需要數(shù)字技術(shù)的介入。但需要強調(diào)的是,“數(shù)字人文”并不是 “數(shù)字圖書館”?!皵?shù)字人文”相較“數(shù)字圖書館”而言,更具備主題性?!皵?shù)字人文”的研究資料可以部分來源于數(shù)字圖書館,但前提是要確定一個主題,并且在這個主題的要求下重新組織資源。目前國內(nèi)很多高校圖書館正在建立特色數(shù)據(jù)庫、開設(shè)教學(xué)參考平臺服務(wù),這在某種程度上亦是“數(shù)字人文”的體現(xiàn)。
2.2.1 加強特色文獻數(shù)據(jù)庫建設(shè)
特色文獻數(shù)據(jù)庫最能體現(xiàn)學(xué)校的重點學(xué)科,因此特色文獻數(shù)據(jù)庫立項時往往會充分考慮學(xué)科的師資力量、科研水平及多方的支持力度。例如,上海外國語大學(xué)圖書館于2010年開始建設(shè)俄羅斯文學(xué)特色文獻數(shù)據(jù)平臺,這個項目將來可以為俄羅斯文學(xué)研究者進行文本挖掘統(tǒng)計、語義分析研究等“數(shù)字人文”研究提供幫助。目前該平臺已初步建成,上海外國語大學(xué)圖書館擬申請二期項目,設(shè)立關(guān)于俄羅斯文學(xué)的子專題,并圍繞這些專題深入收集、挖掘資源,使其具備知識倉儲功能、更加學(xué)術(shù)化,以便俄羅斯文學(xué)研究者利用。
2.2.2 開設(shè)教學(xué)參考平臺服務(wù)
美國各大高校圖書館均建有“教學(xué)參考書架”,以電子平臺的形式體現(xiàn)紙本圖書的分類、館藏。哈佛大學(xué)圖書館對此項服務(wù)進行了改進,由專業(yè)教師組織助教、研究生和圖書館員進行課程資料的收集,并將這些資料電子化后按照一定的框架組織發(fā)布到教學(xué)參考平臺上,供學(xué)生學(xué)習(xí)參考。在這個過程中,參與者不僅貢獻了自己的學(xué)識,也在團隊的合作中提高了自己的學(xué)術(shù)水平。而且教學(xué)參考平臺經(jīng)過不斷的更新,數(shù)字資源建設(shè)日臻完善,它既能反映課程的歷史,又能體現(xiàn)課程的前沿理念。筆者曾觀看到哈佛大學(xué)圖書館員馬小鶴老師關(guān)于《胡笳十八拍》的資料收集、整理和加工過程,這是為該校東亞系一門關(guān)于古羅馬和古中國文化比較的課程所整理的參考資料,其理念創(chuàng)新、成效顯著,充分體現(xiàn)了圖書館服務(wù)的價值。
“數(shù)字人文”研究離不開計算機技術(shù)與信息技術(shù)的應(yīng)用,尤其是信息檢索技術(shù),已成為“數(shù)字人文”研究的重要支撐。目前基于文本的檢索技術(shù)已在“數(shù)字人文”研究中得到廣泛的應(yīng)用,但“數(shù)字人文”的研究目標并不局限于文本文件,還包括聲音、圖像等音視頻文件。如何在眾多類型的數(shù)字文獻中實現(xiàn)統(tǒng)一檢索,將是“數(shù)字人文”時代圖書館的技術(shù)研究重點[7]。除此之外,信息可視化、內(nèi)容分析、機器學(xué)習(xí)、數(shù)據(jù)/文本/Web挖掘等技術(shù)也對“數(shù)字人文”的研究具有重大意義。圖書館技術(shù)人員可以在這些方面多加鉆研,以迎合“數(shù)字人文”研究的需要。
“數(shù)字人文”研究在國外已有60余年的研究歷史[8],雖然國內(nèi)對它的關(guān)注時間不長,但是“數(shù)字人文”研究將以其實踐性、包容性等特點贏得國內(nèi)研究者的注意。圖書館員應(yīng)把握機遇,找到適合自身發(fā)展的位置,在合作中發(fā)揮資源與服務(wù)優(yōu)勢,共同推進人文學(xué)科研究朝著更深、更廣的領(lǐng)域發(fā)展。
注 釋:
① Matt Jockers是斯坦福大學(xué)英語學(xué)院的講師,主攻“數(shù)字人文”和愛爾蘭文學(xué),Glen Worthey是斯坦福大學(xué)數(shù)字人文中心的主任。
② 語料庫通常指為語言研究收集的、用電子形式保存的語言材料,一般由自然出現(xiàn)的書面語或口語的樣本匯集而成,用來代表特定的語言或語言變體。
③ 機器學(xué)習(xí)(Machine Learning)是研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,從而獲取新的知識或技能、重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。
[1]林穗芳.羅伯托·布薩和世界最早用計算機輔助編輯的巨著《托馬斯著作索引》 [J].河南大學(xué)學(xué)報:社會科學(xué)版,2007(4):167-174.
[2]Unsworth J. What Is Humanities Computing and What Is Not? [EB/OL].[2011-08-17]. http://computerphilologie.uni-muenchen.de/jg02/unsworth.html.
[3]Stanford Humanities Center[EB/OL].[2011-08-17]. http://shc.stanford.edu/research-lab/.
[4]Michel J B, Shen Yuan Kui, Aiden E L, et al. Quantitative Analysis of Culture Using Millions of Digitized Books[EB/OL]. [2011-08-17].http://www.sciencemag.org/content/331/6014/176.full.
[5]鄭心清.試論圖書館文獻評價[J].國家圖書館學(xué)刊,2005(4):36-41.
[6]Carole L P.Thematic Research Collections[G]// Schreibman S,Siemens R, Unsworth J. A Companion to Digital Humanities. Oxford:Blackwell,2004:348-365.
[7]張文秀,朱慶華,黃 奇.數(shù)字圖書館的未來[J].現(xiàn)代圖書情報技術(shù),2006(5):1-5.
[8]Hockey S. The History of Humanities Computing[G]// SchreibmanS,Siemens R, Unsworth J. A Companion to Digital Humanities. Oxford:Blackwell,2004:3-19.