李 鶴 伊
(北京大學(xué) 藝術(shù)學(xué)院,北京100000)
在《探索歷史大數(shù)據(jù)——?dú)v史學(xué)家的宏觀視角》一書中,學(xué)者肖恩·格雷厄姆、伊恩·米利根、斯科特·魏因加特認(rèn)為“DH”的表述不同程度上同時(shí)適用于兩個(gè)領(lǐng)域,即“數(shù)字人文”(Digital Humanities)和“數(shù)字歷史”(Digital History)[1](P34)。在《數(shù)字人文:改變知識(shí)創(chuàng)新與分享的游戲規(guī)則》中,學(xué)者安妮·伯迪克、約翰·德魯克、彼得·倫恩費(fèi)爾德、托德·普雷斯納、杰弗里·施納普提出:“亞里士多德認(rèn)為我們讀史以認(rèn)識(shí)世界了解過(guò)往之事,我們讀詩(shī)以想象世界激發(fā)孕育出新世界。數(shù)字人文學(xué)者同時(shí)具有史學(xué)家和詩(shī)人的特質(zhì),我們既積極研究過(guò)往的世界,也積極思考尚未誕生的新世界,然而數(shù)字人文學(xué)者利用新的工具技術(shù)和設(shè)計(jì)策略,采用將詩(shī)人和史學(xué)家的傳統(tǒng)創(chuàng)作實(shí)踐方式徹底改變的新認(rèn)識(shí)方式來(lái)思考過(guò)去和未來(lái)。”[2](P77)可見,數(shù)字人文與歷史研究有著無(wú)法割舍的聯(lián)結(jié),作為變革世界認(rèn)知方式的跨學(xué)科領(lǐng)域,數(shù)字技術(shù)及工具打破了學(xué)界對(duì)人文、藝術(shù)及社會(huì)科學(xué)知識(shí)的傳統(tǒng)理解模式,貢獻(xiàn)了全球性的、超越歷史和媒介的新型學(xué)術(shù)模型和組織形式。歷史學(xué)家置身于數(shù)字化轉(zhuǎn)向的局面已經(jīng)無(wú)可避免地依賴數(shù)字化工具進(jìn)行研究,依托大數(shù)據(jù)獲取史料已經(jīng)超出了人工無(wú)法企及的地位。2012年底Ithaka S+R 公司對(duì)歷史學(xué)家的調(diào)研報(bào)告就已指出,數(shù)字化轉(zhuǎn)向下的新興研究實(shí)踐和交流機(jī)制已經(jīng)被廣泛采納,這為研究既帶來(lái)了機(jī)遇,也帶來(lái)了挑戰(zhàn)。
“數(shù)字人文”作為快速發(fā)展的跨學(xué)科研究方法,目前學(xué)界對(duì)其詞源定義紛繁多樣,并無(wú)統(tǒng)一口徑(1)數(shù)字人文的百種定義可訪問(wèn)詹森·赫普勒(Jason Heppler)創(chuàng)辦的網(wǎng)站 “What is Digital Humanities”或《數(shù)字人文宣言2.0》,包含50個(gè)對(duì)數(shù)字人文的理解與表述。,其涉及范圍可以指涉從媒介研究到電子藝術(shù),從數(shù)據(jù)挖掘到技術(shù)教育,從學(xué)術(shù)編輯到無(wú)政府博客,同時(shí)還囊括代碼迷、數(shù)字藝術(shù)家、專業(yè)領(lǐng)域書呆子、超人類主義者、游戲理論家、自由文化倡導(dǎo)者、檔案保管員、圖書管理員、自主創(chuàng)新式教育者等[4](P75)。計(jì)算領(lǐng)域?qū)?shù)字人文有較系統(tǒng)化的討論和紛繁的定義,而人文領(lǐng)域?qū)W者認(rèn)識(shí)數(shù)字人文相對(duì)較晚。人文學(xué)中運(yùn)用計(jì)算機(jī)的開端始于1949年,1949至1970年間“人文計(jì)算”作為數(shù)字人文發(fā)展的前身,直到2004年出版的《數(shù)字人文指南》標(biāo)志著“數(shù)字人文”作為概念在學(xué)術(shù)界的開端[5](Pxxiii),再到2005年數(shù)字人文國(guó)際聯(lián)盟成立后,數(shù)字人文作為一個(gè)研究領(lǐng)域獲得國(guó)際學(xué)術(shù)界的普遍認(rèn)可[6]。2005年至2009年是數(shù)字文人領(lǐng)域的確定期,研究主要圍繞語(yǔ)言學(xué)和文學(xué)等人文學(xué)科展開,2009至2019是數(shù)字人文的成熟期,著重跨學(xué)科領(lǐng)域的合作深化[7]。從計(jì)算機(jī)科學(xué)領(lǐng)域逐步演進(jìn)使得電子版逐步代替了紙質(zhì)版文字,計(jì)算機(jī)語(yǔ)言的功用導(dǎo)致傳統(tǒng)語(yǔ)言的弱化。荷爾·波茨坦認(rèn)為由于“人文計(jì)算”到“數(shù)字人文”有著“散漫的轉(zhuǎn)換”[8], 使得人文學(xué)者擔(dān)心新技術(shù)會(huì)徹底顛覆人文學(xué)科領(lǐng)域,所以部分學(xué)者對(duì)數(shù)字人文方法介入人文研究一直持有保留態(tài)度。
“數(shù)字歷史”可以追溯至20世紀(jì)50年代和60年代,隨著定量和計(jì)算史學(xué)的發(fā)展,歷史學(xué)家積極探究歷史的邊界問(wèn)題,以跨越個(gè)體及時(shí)空的視角對(duì)歷史的不同時(shí)段進(jìn)行探究。1970至1990年代,數(shù)學(xué)及統(tǒng)計(jì)學(xué)的廣泛應(yīng)用推動(dòng)著歷史研究的數(shù)字化轉(zhuǎn)向。數(shù)字人文與數(shù)字歷史的關(guān)系并沒(méi)有明確答案,有些認(rèn)為數(shù)字人文比數(shù)字歷史更為寬泛且二者相互重疊。我們似乎更容易在學(xué)界普遍關(guān)注重點(diǎn)數(shù)字人文期刊《人文學(xué)科中的數(shù)字學(xué)術(shù)》與《數(shù)字人文季刊》以及數(shù)字人文國(guó)際聯(lián)盟論文集、《數(shù)字人文的爭(zhēng)論》中接觸到大量科技工作者、技術(shù)主義者、社會(huì)科學(xué)家對(duì)“數(shù)字人文”進(jìn)行的定義和闡釋的學(xué)術(shù)成果,這樣相對(duì)掩蓋了人文學(xué)者在數(shù)字人文研究中的話語(yǔ)影響力。因此,這里選取了人文歷史學(xué)科下相對(duì)具有代表性的數(shù)字史學(xué)研究項(xiàng)目,并闡釋歷史項(xiàng)目研究者對(duì)數(shù)字人文以及數(shù)字歷史的理解與認(rèn)知。凱莉·奧尼爾創(chuàng)建了俄羅斯歷史研究數(shù)字人文項(xiàng)目“帝國(guó)主義計(jì)劃”(2)凱莉·奧尼爾(Kelly O'Neill),哈佛大學(xué)戴維斯俄羅斯和歐亞研究中心,俄羅斯歷史、空間史學(xué)家。,她認(rèn)為數(shù)字人文以創(chuàng)新的方式生產(chǎn)知識(shí)并解釋人類的經(jīng)驗(yàn)?,F(xiàn)今通過(guò)表格、定量數(shù)據(jù)和制圖材料,將數(shù)字材料納入研究方法之后能夠在空間上促使史學(xué)研究者提出新的問(wèn)題,即詮釋歷史在“何處”發(fā)生的問(wèn)題。將地理信息科學(xué)的方法應(yīng)用于歷史,并建立交互平臺(tái)來(lái)創(chuàng)建“地圖故事”,從定位事物、地點(diǎn)和人物入手,以了解地理位置如何塑造個(gè)人、社會(huì)和國(guó)家。蘇珊·普雷斯頓·比利爾同樣提到數(shù)字人文是以一整套新技術(shù)的角度重新思考世界的方法,人文學(xué)者的突破關(guān)鍵是轉(zhuǎn)型過(guò)程的一部分。(3)蘇珊·普雷斯頓·比利爾(Suzanne Preston Blier),哈佛大學(xué)艾倫·懷特希爾(Allen Whitehill Clowes)美術(shù)史和非洲與非裔美國(guó)人研究教授。有關(guān)比利爾在該領(lǐng)域的貢獻(xiàn)于2013年春季哈佛大學(xué)研究生院刊物Colloquy文章《面對(duì)非洲藝術(shù)》中發(fā)表。她領(lǐng)導(dǎo)的電子地理空間數(shù)據(jù)庫(kù)Africamap成為擴(kuò)展到Worldmap的站點(diǎn),并將不同學(xué)科的學(xué)者納入研究體系。包弼德認(rèn)為數(shù)字人文涉及規(guī)模巨大的信息和數(shù)據(jù),依托計(jì)算分析和社會(huì)網(wǎng)絡(luò)分析,可以發(fā)現(xiàn)人與人之間的聯(lián)系,以及在歷史上某一時(shí)刻形成的各種群體。(4)包弼德(Peter K. Bol),歷史學(xué)家和漢學(xué)家,哈佛大學(xué)東亞語(yǔ)言與文明教授,哈佛大學(xué)地理分析中心的創(chuàng)始主任,負(fù)責(zé)中國(guó)歷史地理信息系統(tǒng)(CHGIS)和中國(guó)傳記數(shù)據(jù)庫(kù)(CBDB)項(xiàng)目。在2020數(shù)字人文視角下的中國(guó)歷史研究會(huì)議上提出《從軼事到數(shù)據(jù):傳記數(shù)據(jù)的網(wǎng)絡(luò)和空間分布》。然而,有學(xué)者曾質(zhì)疑“數(shù)字人文”,后殖民文化學(xué)家艾達(dá)琳·寇爾提出“數(shù)字人文無(wú)法拯救你”的命題[9],她斥責(zé)數(shù)字人文主義者將計(jì)算置于文化之上,此舉只會(huì)讓人文學(xué)科變得更加無(wú)關(guān)緊要,成為 “STEM的女仆”,然而寇爾最終還是認(rèn)可了數(shù)字人文主義者被要求更像媒體研究、科學(xué)、技術(shù)和社會(huì)研究或某種文化研究變體的學(xué)者,而不是被工程師、科學(xué)家和數(shù)學(xué)家所掩蓋的事實(shí)。面對(duì)計(jì)算史上的第三次浪潮(5)計(jì)算史上的第一次浪潮源自人文計(jì)算,第二次浪潮圍繞文本分析(H-net,Usenet和GIS),第三次浪潮經(jīng)歷數(shù)據(jù)儲(chǔ)存能力重大革新,開源工具軟件的興起是其核心。,歷史學(xué)家逐步從思考定量方法的利弊采取了“語(yǔ)言學(xué)轉(zhuǎn)向”,計(jì)算機(jī)科學(xué)家們也試圖尋求與人文社會(huì)學(xué)科相連的共同點(diǎn)并在網(wǎng)絡(luò)上建構(gòu)跨學(xué)科共享文件的語(yǔ)言。數(shù)字歷史學(xué)者面對(duì)計(jì)算大潮已然無(wú)法“躲進(jìn)小樓成一統(tǒng)”,跨學(xué)科數(shù)字歷史研究模式早已成為變革世界知識(shí)生產(chǎn)的新方法。
作為歷史的電影史[10](P3),且電影作為一種協(xié)調(diào)、綜合、多元軌跡的媒體——產(chǎn)制出大量千變?nèi)f化的文本,需要多重的理解架構(gòu)[11],數(shù)字人文與文化分析就是實(shí)現(xiàn)多重理解架構(gòu)的新工具。當(dāng)前中國(guó)電影史學(xué)者仍處于重寫電影史的階段中,致力于規(guī)避以論帶史和過(guò)度陷入史料不能自拔的陷阱,數(shù)字人文為重寫中國(guó)電影史提供了新型路徑與研究方法。然而,并非所有電影史學(xué)者必須啟用數(shù)字人文的研究方法,但是運(yùn)用數(shù)字研究方法的電影史學(xué)者必定是電影史、電影研究的重要組成部分。數(shù)字人文影人年譜的構(gòu)建為重寫電影史貢獻(xiàn)基礎(chǔ)性價(jià)值,以代表性中國(guó)影人為研究對(duì)象和切入點(diǎn),依托大數(shù)據(jù)開源獲取、文本分析可視化、地理信息系統(tǒng)分析與數(shù)字地圖繪制、主題建模、網(wǎng)絡(luò)分析、知識(shí)關(guān)聯(lián)、數(shù)據(jù)庫(kù)建構(gòu)等方式進(jìn)行研究,對(duì)厘清電影本體與電影史的認(rèn)知,理解不同時(shí)期社會(huì)、文化、消費(fèi)、電影接受的觀念以及創(chuàng)新呈現(xiàn)中國(guó)電影史的敘事視角和空間建構(gòu)奠定堅(jiān)實(shí)的基礎(chǔ)。同時(shí),以影人搭建的數(shù)據(jù)庫(kù)力圖在世界范圍內(nèi)開源聯(lián)動(dòng),為中國(guó)電影史論研究的突破、跨國(guó)的中國(guó)電影史書寫以及人文藝術(shù)學(xué)科整體的未來(lái)發(fā)展提供豐富的理解架構(gòu)和突破傳統(tǒng)的研究資源。
2004年起,列夫·馬諾維奇的研究對(duì)象從“新媒體”變?yōu)?“更多媒體”下的“文化分析”。他創(chuàng)建了文化分析實(shí)驗(yàn)室并將計(jì)算機(jī)解析全球人類“大規(guī)模文化”的使命貫穿了他之后的研究路徑。文化分析是指使用計(jì)算和設(shè)計(jì)方法(包括數(shù)據(jù)可視化、媒體和交互設(shè)計(jì)、統(tǒng)計(jì)和機(jī)器學(xué)習(xí))來(lái)探索和分析文化的規(guī)模,是人文學(xué)科中使用計(jì)算機(jī)視覺最重要的成果。需要注意的是,文化分析不是用算法取代文化研究,而是通過(guò)新的接口和技術(shù)來(lái)觀察大量的文化數(shù)據(jù)集以增強(qiáng)人類的能力。傳統(tǒng)的文化分析方法已經(jīng)無(wú)法覆蓋人類的文化知識(shí)生產(chǎn)的高速率,數(shù)億文化生產(chǎn)者創(chuàng)造、想象出具有價(jià)值的產(chǎn)品和事件以及文化“更多信息”(網(wǎng)站、帖子、出版物、數(shù)據(jù)集)需要提出適合全球數(shù)字文化規(guī)模、速度、多樣性和連通性的新理論。
馬諾維奇在《文化分析、計(jì)算機(jī)視覺、人類感官和藝術(shù)的語(yǔ)言》中談到了文化分析與數(shù)字人文的關(guān)系。其中,文化分析與數(shù)字人文方法都屬于21世紀(jì)下半葉出現(xiàn)的利用大量文化和社會(huì)數(shù)據(jù)的研究范式,其他范式還包括計(jì)算社會(huì)科學(xué)、社會(huì)計(jì)算、數(shù)字人類學(xué)、數(shù)字歷史、城市科學(xué)、城市信息科學(xué)和文化經(jīng)濟(jì)學(xué),二者都依托機(jī)器學(xué)習(xí)、計(jì)算處理對(duì)藝術(shù)史、電影和媒體研究、游戲研究、考古學(xué)等領(lǐng)域有著廣泛的應(yīng)用。馬諾維奇對(duì)《人文學(xué)科中的數(shù)字學(xué)術(shù)》一文中 “數(shù)字人文重文字,輕可視化,模擬性差”的觀點(diǎn)提出了質(zhì)疑,認(rèn)為這種觀點(diǎn)令人驚訝,因?yàn)橛?jì)算機(jī)科學(xué)家早在20世紀(jì)50年代末就對(duì)圖像分析方法進(jìn)行了開發(fā)[12](P7)。在計(jì)算機(jī)視覺和多媒體計(jì)算領(lǐng)域,研究者多年來(lái)持續(xù)發(fā)布新的算法以自動(dòng)檢測(cè)歷史圖像內(nèi)容、藝術(shù)風(fēng)格、早期攝影技術(shù)、電視和視頻的類型,并將其應(yīng)用于逐漸龐大的歷史數(shù)據(jù)集。馬諾維奇主導(dǎo)的文化分析實(shí)驗(yàn)室也一直使用數(shù)字人文和文化分析可視化結(jié)合的方法分析文化歷史和視覺媒體,如紐約現(xiàn)代藝術(shù)博物館收藏的20000張照片、奧地利電影博物館收藏的紀(jì)錄電影先驅(qū)吉加·維爾托夫的電影、100萬(wàn)幅DeviantArt上的藝術(shù)作品以及其他數(shù)據(jù)集[13]。總體來(lái)看,文化分析和數(shù)字人文都無(wú)法脫離計(jì)算機(jī)的共性且都受到了人文計(jì)算的影響,圖像分析方法影響了文化分析可視化與數(shù)字人文方法,二者可以從不同角度介入到電影史及其他藝術(shù)史的研究中。數(shù)字人文的大部分計(jì)算工作都集中在文學(xué)文本、歷史文本記錄和空間數(shù)據(jù)上,與此相比,文化分析更突出靜態(tài)和動(dòng)態(tài)圖像以及交互式媒體等其他類型的媒體。
以“人及社群”為線索展開的數(shù)字人文個(gè)案項(xiàng)目在藝術(shù)史、文學(xué)史等研究領(lǐng)域比電影史研究領(lǐng)域起步相對(duì)較早。2013年,約翰娜-德魯克在 “數(shù)字藝術(shù)史”(使用計(jì)算技術(shù)的分析技術(shù))和“數(shù)字化藝術(shù)史”(建立在使用在線資源上的藝術(shù)史)之間做了一個(gè)顯著區(qū)分[14],她認(rèn)為,前者是“數(shù)字藝術(shù)史的適當(dāng)領(lǐng)域”,因?yàn)樗孕路f的方式揭示藝術(shù)史文物的特征并拓展傳統(tǒng)的觀察和分析方法而產(chǎn)生創(chuàng)新的考察面比數(shù)字化藝術(shù)史研究更為深廣。2015年《國(guó)際數(shù)字藝術(shù)史期刊》成立,學(xué)界出現(xiàn)了對(duì)人與人、人與社群之間如何產(chǎn)生聯(lián)結(jié)這一話題感興趣的研究者。譬如重建弗朗西斯·培根的人物形象和最杰出人物之間的現(xiàn)代社會(huì)關(guān)系網(wǎng)絡(luò),他們掌握了從《牛津國(guó)民傳記詞典》中提取人名和推斷關(guān)系的自然語(yǔ)言處理工具和統(tǒng)計(jì)圖學(xué)習(xí)技術(shù),運(yùn)用傳記文獻(xiàn)中推斷歷史社會(huì)網(wǎng)絡(luò)的統(tǒng)計(jì)方法[15]。2020年,第一本關(guān)于數(shù)字藝術(shù)史的卷集《勞特里奇數(shù)字人文藝術(shù)史》出版[16],著重論述數(shù)字人文是如何與藝術(shù)史、藝術(shù)理論、藝術(shù)創(chuàng)作者產(chǎn)生聯(lián)系的。作者對(duì)數(shù)字人文和藝術(shù)史研究之間的交叉點(diǎn)進(jìn)行了廣泛的調(diào)查,不僅關(guān)注為藝術(shù)作品及藝術(shù)家的歷史而開發(fā)的新技術(shù),而且還思考這些工具的使用帶來(lái)的學(xué)科挑戰(zhàn),并追問(wèn)計(jì)算方法能夠在何種程度上對(duì)藝術(shù)史的研究產(chǎn)生影響。同時(shí),也對(duì)這種研究方式的概念性偏見進(jìn)行了反思。國(guó)內(nèi)藝術(shù)史以“人及社群”研究的個(gè)案項(xiàng)目以董其昌的數(shù)字人文項(xiàng)目為經(jīng)典案例,研究嘗試引入機(jī)器學(xué)習(xí)、CNN (深度模型卷積網(wǎng)絡(luò))和圖像關(guān)聯(lián)AI引擎等方法,實(shí)現(xiàn)了以高清藏品圖像數(shù)據(jù)等為基點(diǎn),可視化了董其昌的個(gè)體人文脈絡(luò),梳理鑒藏、交游、教育、傳承等多個(gè)人文脈絡(luò),以可視化的形態(tài)為董其昌的研究設(shè)計(jì)了一個(gè)“主體-表達(dá)-時(shí)代”的綜合維度。其次,參照CIDOC CRM等國(guó)際元數(shù)據(jù)標(biāo)準(zhǔn),基于Linked Data設(shè)計(jì)明清文人書畫本體, 實(shí)現(xiàn)博物館的實(shí)物性特征所帶來(lái)的源于圖像本體的排比和深度分析,并將逐步形成繪畫元素標(biāo)準(zhǔn)樣本國(guó)際平臺(tái),為研究范式轉(zhuǎn)變、傳播邊界拓展、內(nèi)涵顯性化以及知識(shí)創(chuàng)造提供一種新的思路[17]。此外,文學(xué)領(lǐng)域中,學(xué)者基于計(jì)算機(jī)算法與模型,挖掘文學(xué)史上的重要人物史料數(shù)據(jù)后進(jìn)行空間研究、人際網(wǎng)絡(luò)及關(guān)系闡釋、知識(shí)圖譜構(gòu)建以及對(duì)該人物著述的深度翻譯、詞典和機(jī)器學(xué)習(xí)。例如冉從敬等學(xué)者的《數(shù)字人文視角下的莎士比亞學(xué)術(shù)傳播研究》、楊玲的《遠(yuǎn)讀、文學(xué)實(shí)驗(yàn)室與數(shù)字人文:弗朗哥莫萊蒂的文學(xué)研究路徑》等,將文學(xué)史、藝術(shù)史的作者、藝術(shù)家作為“人”的意義加以凸顯,是數(shù)字人文應(yīng)用于人文學(xué)科的重要目標(biāo),通過(guò)詞頻分析、遠(yuǎn)讀、遙讀等手段將定量的研究與定性的研究對(duì)接,對(duì)電影研究中影人年譜及影人社群網(wǎng)絡(luò)的時(shí)空構(gòu)建具有啟發(fā)性意義。
2018年出現(xiàn)了第一本采用數(shù)字人文方法量化可視單個(gè)導(dǎo)演作品的英語(yǔ)專著《數(shù)字人文與電影研究——視覺化吉加·維爾托夫電影》[18],不過(guò),量化電影的分析方法和文化數(shù)據(jù)化作為電影研究可視化的方法之一可以追溯至上世紀(jì)。自1971年尤里·洛特曼在《藝術(shù)文本的結(jié)構(gòu)》一書中提出針對(duì)文本的符號(hào)學(xué)分析后,大量研究者使用對(duì)藝術(shù)形象中的元素、結(jié)構(gòu)以及其產(chǎn)生的意義、審美價(jià)值進(jìn)行探究。電影研究者也發(fā)現(xiàn)計(jì)算機(jī)進(jìn)行的文本分析能夠觸及自然語(yǔ)言中無(wú)法達(dá)到的精度,并能夠定性描述圖像的特征,亦可處理沒(méi)有明顯視覺元素的部分[19](P30)。以此為標(biāo)志,依托計(jì)算機(jī)展開影像的量化分析、電影計(jì)量學(xué)、電影檔案學(xué)紛至沓來(lái),電影文本量化分析學(xué)者偏向針對(duì)單個(gè)文本以及某一作者的系列文本進(jìn)行規(guī)模較小的分析。在西方,1974年巴里·索爾特運(yùn)用統(tǒng)計(jì)學(xué)來(lái)探究電影風(fēng)格[20]。1987年羅杰·史密瑟在提出計(jì)算機(jī)的引入應(yīng)使處理電影檔案館的藏品信息共享更容易,并認(rèn)識(shí)到這種數(shù)據(jù)交換依賴于對(duì)共同標(biāo)準(zhǔn)和格式的接受這一問(wèn)題[21]。20世紀(jì)后半期,無(wú)論是對(duì)電影的算法研究還是將電影作為證據(jù)的電影史研究被籠罩在后結(jié)構(gòu)主義之下,堅(jiān)持認(rèn)為電影是一種不同形式的證據(jù),需要對(duì)其進(jìn)行解碼的特殊訓(xùn)練,以對(duì)其制作時(shí)期的精神或時(shí)代精神進(jìn)行無(wú)意識(shí)的物質(zhì)見證[22](P6)。這種依靠算法的定量的研究延伸至當(dāng)今,杰森-薩拉文對(duì)文化模式進(jìn)行了數(shù)據(jù)可視化,電影《泰坦尼克號(hào)》的畫面被簡(jiǎn)化為單一的代表性顏色,這些顏色的小正方形被放置在一個(gè)矩形網(wǎng)格中,從而使電影中可見的視覺節(jié)奏成為可能[23]。在亞洲,日本學(xué)者大澤勝久提出數(shù)字化的電影研究在對(duì)長(zhǎng)期保存大量信息的動(dòng)態(tài)圖像的數(shù)字?jǐn)?shù)據(jù)方面需要提出相應(yīng)策略,與動(dòng)態(tài)圖片一起使用的感光材料與數(shù)字技術(shù)結(jié)合作為創(chuàng)新性研究方法可以彌補(bǔ)數(shù)字技術(shù)在長(zhǎng)期保存方面的不足[24]。韓國(guó)學(xué)者姜璲桓認(rèn)為電影不再是基于賽璐珞膠片的藝術(shù)形式,而是變成了“文件”和“信息”。他從劇本的文本分析、視覺形象量化研究、敘事模式的研究三個(gè)方面將定量方法引入電影研究[25]。國(guó)內(nèi)近年來(lái)也開始對(duì)量化電影研究進(jìn)行嘗試,楊世真探究了計(jì)量電影學(xué)的理論、方法與應(yīng)用[26],陳剛通過(guò)Cinemetrics工具對(duì)于費(fèi)穆導(dǎo)演的電影結(jié)構(gòu)進(jìn)行了可視化的研究實(shí)踐等[27]。以上計(jì)量電影學(xué)的可視化分析與定量研究突出電影文本、電影風(fēng)格、節(jié)奏、鏡頭的量化,尤其偏重“算法”“數(shù)據(jù)”對(duì)電影史研究的影響,依據(jù)這些數(shù)據(jù)延續(xù)了實(shí)用后現(xiàn)代主義的方式來(lái)理解文本的思想,“即所有的敘事形式,包括傳統(tǒng)的歷史,都被部署了相等的情節(jié)、猜測(cè)和選擇過(guò)程”[28]。
然而,這種研究方式引起了歷史學(xué)家以及羅伯特·艾倫、杰弗瑞·克萊諾奇、理查德·馬爾比、亞瑟·奈特等電影史、媒介史學(xué)者的反思,他們認(rèn)為以電影研究為基礎(chǔ)的電影史是不夠的,電影作為大眾娛樂(lè)的媒介必須具有以超越電影文本的生產(chǎn)和實(shí)踐的方式來(lái)構(gòu)想。聚焦于文本的電影分析窄化且抑制了電影史的空間意義,且會(huì)在電影與歷史兩個(gè)學(xué)科之間造成不可跨越的隔閡。于是,21世紀(jì)初的前十年,電影史研究的國(guó)際趨勢(shì)從電影的內(nèi)容轉(zhuǎn)移到其循環(huán)和消費(fèi)并將電影作為一個(gè)社會(huì)和文化交流的場(chǎng)所來(lái)研究,2007年,學(xué)者們?cè)诟嘏e辦的具有突破性意義的電影研究論壇“他們眼中的光芒:關(guān)于電影文化、電影展覽和電影觀看的全球視角”中明確了“新電影史”的研究范式將轉(zhuǎn)換視角至電影的消費(fèi)流通以及電影作為社會(huì)與文化交流的屬性。電影史研究者借助GIS系統(tǒng)著重關(guān)注歷史、地理、文化研究、經(jīng)濟(jì)學(xué)、社會(huì)學(xué)和人類學(xué)的關(guān)聯(lián),對(duì)電影史進(jìn)行空間分析,試圖深入電影發(fā)行和展覽的商業(yè)活動(dòng)等公共生活、電影的法律和政治話語(yǔ)以及特定電影觀眾的社會(huì)和文化歷史中搭建空間網(wǎng)絡(luò)及關(guān)系以發(fā)現(xiàn)新的歷史。此時(shí)可視化的電影研究不僅包括計(jì)量電影學(xué)等依托算法和數(shù)據(jù)的文本分析,亦走向了電影史學(xué)的空間研究,轉(zhuǎn)向了更為深廣的文化和社會(huì)的歷史視角。21世紀(jì)初,在谷歌檢索“GIS與電影研究”只能查到與好萊塢電影中第二次世界大戰(zhàn)的士兵形象相關(guān)的網(wǎng)站[29],之后隨著GIS在社會(huì)學(xué)女性研究、歷史學(xué)的廣泛應(yīng)用,電影學(xué)者愈發(fā)認(rèn)識(shí)到數(shù)字方法與社會(huì)、文化、空間、消費(fèi)等層面的重要聯(lián)結(jié),電影史研究的空間轉(zhuǎn)向必然與文化地理學(xué)進(jìn)行跨學(xué)科交叉。以著名電影史空間研究項(xiàng)目HOMER為例,它包括了四個(gè)數(shù)據(jù)庫(kù)案例:(1)電影院和觀眾研究項(xiàng)目(CAARP)研究電影放映、公司和場(chǎng)地的信息,對(duì)1928年引入聲音后南澳大利亞的電影發(fā)行模式、1949-1980年的移民電影院線路和觀眾、新南威爾士州農(nóng)村觀眾的文化體驗(yàn)進(jìn)行探索。(2)電影文本背景數(shù)據(jù)庫(kù)提供了荷蘭電影文化的基本要素:電影、影院、影人和電影公司。我們不僅可以找到關(guān)于人物、事件、地點(diǎn)和時(shí)間信息,還可以分析這些信息的模式和網(wǎng)絡(luò)。(3)早期倫敦電影商業(yè)數(shù)據(jù)庫(kù)是對(duì)1894-1914年倫敦電影企業(yè)的開源數(shù)據(jù)庫(kù),記錄了第一次世界大戰(zhàn)前倫敦的電影院和電影企業(yè)。(4)威廉斯堡劇院數(shù)據(jù)庫(kù)是一個(gè)在線檔案數(shù)據(jù)庫(kù),記錄了美國(guó)弗吉尼亞州威廉斯堡20世紀(jì)的電影觀看和日常文化生活的證據(jù),這個(gè)大西洋中部的小鎮(zhèn)同時(shí)也是美國(guó)的一個(gè)標(biāo)志性地點(diǎn)。四個(gè)項(xiàng)目的共性在于使用定量信息,通過(guò)數(shù)據(jù)庫(kù)、空間分析和地理可視化等手段,提出了一系列關(guān)于電影人、電影院與社會(huì)群體關(guān)系的假設(shè),并期望這些假設(shè)通過(guò)其他定性手段得到驗(yàn)證,從而發(fā)現(xiàn)新的電影史。無(wú)論是文化分析方式對(duì)圖像、視覺媒體的規(guī)模性呈現(xiàn),還是數(shù)字人文方法對(duì)計(jì)量電影、歷史空間的探尋,都注重可視化的呈現(xiàn)方式,即研究的視角由二維呈現(xiàn)為三維。與算法、人工智能的結(jié)合可以充分對(duì)歷史上的電影庫(kù)進(jìn)行檢索、挖掘,盡可能地覆蓋各國(guó)家、各民族地區(qū)電影資料,提取出的是指數(shù)級(jí)增量電影文本、膠片、圖像、記憶以推動(dòng)具有變革性意義的電影研究。電影等文化藝術(shù)不一定是被書寫的,而是被看的,是“可視”的。文化分析與數(shù)字人文下的可視化皆為中國(guó)電影史研究提供創(chuàng)新性的研究路徑。
數(shù)據(jù)收集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)清洗與資料庫(kù)的構(gòu)建是數(shù)字人文研究的基礎(chǔ)與起點(diǎn)[6],可視化影人年譜和數(shù)據(jù)庫(kù)的建設(shè)是數(shù)字人文下的中國(guó)電影史研究不可忽視的基礎(chǔ)性工作,因?yàn)椤坝叭四曜V是一種在創(chuàng)新電影史觀的基礎(chǔ)上吁求中國(guó)史學(xué)傳統(tǒng)的電影研究方式,試圖在最大限度‘還原’社會(huì)歷史面貌和‘體認(rèn)’影人生命軌跡的過(guò)程中,為中國(guó)的電影研究和電影史研究提供必要的知識(shí)積累和價(jià)值導(dǎo)向,并為‘重述’中國(guó)電影史以及構(gòu)建中國(guó)電影學(xué)派奠定不可或缺的學(xué)術(shù)基礎(chǔ)”[30],省略這一步驟則會(huì)出現(xiàn)研究的斷層或史料獲取的片面性。大部分早期影人年譜的書寫和出版物整理只能聚焦在紙質(zhì)版上,碎片化信息導(dǎo)致無(wú)法在兩岸三地電影史學(xué)建構(gòu)中形成網(wǎng)絡(luò)。計(jì)算機(jī)技術(shù)介入下的史料挖掘與數(shù)字化以機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、可視化與GIS、關(guān)聯(lián)數(shù)據(jù)、網(wǎng)絡(luò)分析、數(shù)據(jù)管理、文本挖掘從根本上打破了傳統(tǒng)電影史影人研究空間的局限性,提高了史料的獲取效率和獲取范圍。
可視化影人年譜搭建的一條實(shí)踐路徑是早期影人史料的數(shù)據(jù)化和文本分析。與社科領(lǐng)域相對(duì)成熟化的數(shù)據(jù)庫(kù)進(jìn)行比較,中國(guó)電影史學(xué)研究者可以獲取的電子化基礎(chǔ)性史料數(shù)量遠(yuǎn)遠(yuǎn)不夠,且需要以嚴(yán)謹(jǐn)?shù)膽B(tài)度甄別史料的來(lái)源,于是將電影史文字書寫轉(zhuǎn)換成數(shù)字時(shí)代的通用計(jì)算機(jī)語(yǔ)言屬于數(shù)字人文電影研究者、圖書館、影史檔案館的工作方向。在某些情況下,該過(guò)程可以依靠自動(dòng)化輸入,例如設(shè)定限定詞,爬梳《國(guó)文天地》數(shù)據(jù)庫(kù)、大成老舊刊數(shù)據(jù)庫(kù)、愛如生數(shù)據(jù)庫(kù)、全國(guó)報(bào)刊索引數(shù)據(jù)庫(kù)等后篩選有效的影人資料,而在其他情況下(如珍稀影人日記、殘缺磨損的手稿等),則必須手動(dòng)完成輸入。無(wú)論以哪種方式,任務(wù)都是艱巨的。文字史料轉(zhuǎn)化成數(shù)據(jù)后只有經(jīng)過(guò)分析解讀才具有存在意義,所以使用文本分析的方法才能激活龐大且靜態(tài)的影人史料,這里引用一個(gè)直觀的文本分析與歷史研究結(jié)合的案例用以說(shuō)明。某位西方歷史學(xué)家認(rèn)真閱讀一摞影印版的18世紀(jì)倫敦的庭審記錄,邊看邊抄錄案文。過(guò)程中她開始注意到用于描述年輕女性囚犯的語(yǔ)言似乎存在一些有趣的規(guī)律,于是她求助于Old Bailey Online法律在線數(shù)據(jù)庫(kù)并展開搜索。很快她就獲得了一個(gè)包含1000份有關(guān)女性囚犯的庭審訴訟資料。她下載完整的副本,并將其加載到文本分析工具Voyant Tools中, 沒(méi)過(guò)多久,她得到了文本中的關(guān)鍵詞和關(guān)鍵詞搭配,并使用頻率(詞語(yǔ)計(jì)數(shù))區(qū)分了語(yǔ)境中的關(guān)鍵詞,以及隨時(shí)間變化的圖表。這佐證了她自己的猜測(cè),之后,她使用處理文本的java工具包Mallet開始尋找文本中潛在的語(yǔ)義結(jié)構(gòu),經(jīng)算法多次探索,最終表明每篇文本的大部分內(nèi)容都涉及23個(gè)常見主題[1](P iii)。同樣道理,影史研究者可以在經(jīng)過(guò)OCR的數(shù)據(jù)庫(kù)中根據(jù)涉及影人、城市的不同詞頻深入不同主題之中,并辨析影人與主題間的關(guān)系??墒褂脟?guó)際上文本分析的基本文本挖掘工具詞云、Markus、AntConc、斯坦福開發(fā)的Voyant Tools、Overview 等,依托詞語(yǔ)計(jì)數(shù)、N元頻率、語(yǔ)境關(guān)鍵詞技術(shù)語(yǔ)料庫(kù)等推進(jìn)影人史料的可視化研究工作。目前,《基于社會(huì)網(wǎng)絡(luò)分析的蔡楚生創(chuàng)作研究》已對(duì)蔡楚生及其人物網(wǎng)絡(luò)關(guān)系進(jìn)行可視化詞云研究,試圖挖掘出地理空間、人物、事件及影響力的內(nèi)在關(guān)聯(lián),是數(shù)字人文影人年譜工作在國(guó)內(nèi)的初步嘗試。
另一個(gè)可視化路徑是依托地理信息系統(tǒng)對(duì)影人及社群進(jìn)行空間分析。地理信息系統(tǒng)(GIS)是一種綜合的基于計(jì)算機(jī)和網(wǎng)絡(luò)的技術(shù),允許用戶創(chuàng)建、管理、繪制、分析、建模和探索空間信息。GIS的電影空間史平臺(tái)可以支持小型、中型和大型研究,能夠允許多用戶多終端同時(shí)訪問(wèn)并使用不同規(guī)模的證據(jù)來(lái)共同研究一個(gè)主題,集最局部的微觀數(shù)據(jù)和廣泛規(guī)模的統(tǒng)計(jì)數(shù)據(jù)為整體的綜合研究模式。以GIS建立影人年譜為例,用戶可以選擇不同軟件平臺(tái),但使用平臺(tái)的方式具有共性。第一步,對(duì)影人和群體進(jìn)行地理定位。地理定位既是一門藝術(shù),也是一門科學(xué),其內(nèi)容包含批判地查證史料來(lái)源并明確其中包含的各種信息,評(píng)估史料的可拓展性,確定該來(lái)源的信息與其他來(lái)源中包含的信息相關(guān)的方式,將源信息重組為數(shù)據(jù),決定選用文檔,實(shí)現(xiàn)從源到電子表格的轉(zhuǎn)換。此過(guò)程適用于所有歷史來(lái)源:檔案文件、歷史地圖、繪畫、敘事文本、統(tǒng)計(jì)表。以上步驟通常需要重復(fù)執(zhí)行,不一定按必要順序執(zhí)行。然而,對(duì)于歷史學(xué)者而言,相對(duì)特殊且艱難的環(huán)節(jié)在于要處理地圖系統(tǒng)中找不到且在歷史地圖上出現(xiàn)過(guò)、證明過(guò)的地方。研究者根據(jù)史料了解到的影人出現(xiàn)過(guò)的具體位置與在地理信息系統(tǒng)上定位該信息具有很大區(qū)別,后者需要高精度和準(zhǔn)確性。例如我們能否實(shí)現(xiàn)將20世紀(jì)三四十年代的上海城市以及影人所在或出現(xiàn)過(guò)的城市區(qū)域、街道的豐富性和可變性降低到一組坐標(biāo)上?當(dāng)前的數(shù)字地圖與史料中提供的地圖是否會(huì)不符?如果目前的地理定位系統(tǒng)精度無(wú)法達(dá)到文字史料提供的城市、鄉(xiāng)村的位置會(huì)發(fā)生什么?研究者可能在處理當(dāng)前不存在的地理位置,因?yàn)殡S著歷史的變遷,城市在不斷發(fā)展,河道隨著時(shí)間推移而變化,行政邊界也在不斷變化,影人的空間位置與歷史迭代出現(xiàn)實(shí)質(zhì)性的差異,所以技術(shù)層面上不斷對(duì)地圖進(jìn)行數(shù)字化和地理配準(zhǔn)可能是確定位置的最佳方法。同時(shí),研究者需要時(shí)常反思:當(dāng)我不知道一場(chǎng)放映或影人確切出現(xiàn)在哪里時(shí),我怎么能確定該城市、街道或影院等空間就是我之后需要關(guān)注的重要的地理位置呢?這會(huì)不會(huì)產(chǎn)生預(yù)判性的錯(cuò)誤和偏差?種種問(wèn)題迫使研究者仔細(xì)思考如何概念化定義場(chǎng)所及其重要性,以及影人的生活、行為和觀念如何與我們定義的場(chǎng)所產(chǎn)生有意義的空間連結(jié)。目前國(guó)外研究者在處理類似問(wèn)題時(shí)使用現(xiàn)有的地名詞典來(lái)定義其坐標(biāo),輔助手動(dòng)構(gòu)建空間數(shù)據(jù)。對(duì)遺棄城市、廢墟城市及消失的地理位置進(jìn)行重新的地理編碼,或回到大量的文獻(xiàn)資料中找到原始地圖并進(jìn)行數(shù)據(jù)化,挖掘出沒(méi)有地理標(biāo)識(shí)符的文檔。第二步,在確定好處理的內(nèi)容以及在何處定位后則可以開始進(jìn)行影人年譜的可視化空間分析。空間分析的目的是研究影人的行動(dòng)、行為與地理之間的關(guān)系。它實(shí)現(xiàn)的前提在于研究者通過(guò)第一步知道“哪里”更為重要,如果不了解影人隨政治因素、社會(huì)環(huán)境、文化所變更的地理背景,就無(wú)法整合理解該影人牽動(dòng)出的電影史問(wèn)題。影人的空間分析意味著以多種不同方式工作:計(jì)數(shù)、測(cè)量、計(jì)算,將信息分層、重建網(wǎng)絡(luò)、識(shí)別模式等。盡管空間分析的步驟會(huì)復(fù)雜冗長(zhǎng),但它的存在是為了幫助研究者在影史研究中梳理出更加聚類、分散、連通性和相關(guān)性的命題??臻g分析突破了傳統(tǒng)的電影研究中聚焦文本、意識(shí)形態(tài)、類型研究等視角,以跨學(xué)科的思路強(qiáng)調(diào)了地理學(xué)在影史研究中的重要性,通過(guò)可視化的映射關(guān)系,各地、各影人信息之間的相關(guān)性會(huì)更多地激發(fā)史學(xué)研究者開始思考 “為什么”的問(wèn)題。第三步,辨析影人關(guān)系。影人關(guān)系往往是按照一種可識(shí)別的邏輯運(yùn)作的,即地點(diǎn)(一種由地理標(biāo)識(shí)符或地名描述的事物)。有些關(guān)系是垂直的,按行政地理學(xué)的邏輯進(jìn)行影人分類,例如多影人集中出現(xiàn)在上海、天津或北京等地,某地區(qū)包括某個(gè)村莊等。有些關(guān)系是主題性的,例如可以專門研究關(guān)于20世紀(jì)40年代中后期由內(nèi)地赴港的“南下影人”的空間軌跡和互動(dòng)關(guān)系 [31]。有些是按時(shí)間順序的。例如,活躍在孤島期的影人、十七年后的影人或改革開放后的影人等。以上地點(diǎn)的分類闡明利于了解影史空間信息之間的影人關(guān)系。第四步:依托協(xié)同合作產(chǎn)生新發(fā)現(xiàn)。數(shù)字人文時(shí)代,史學(xué)研究者逐漸會(huì)從基于個(gè)體著述的時(shí)代轉(zhuǎn)入基于“項(xiàng)目”協(xié)同創(chuàng)作的時(shí)代[32]。一個(gè)成熟的數(shù)字人文研究項(xiàng)目需要在資金、專業(yè)、資源方面協(xié)同合作,例如俄羅斯“帝國(guó)主義計(jì)劃”項(xiàng)目中,需要地理分析中心、歷史學(xué)院、地圖中心、俄羅斯國(guó)家圖書館以及哈佛大學(xué)等合作者包括GIS 服務(wù)部門、數(shù)字學(xué)術(shù)孵化中心、地理分析中心下設(shè)的地圖空間技術(shù)中心、圖書館的社會(huì)科學(xué)與視覺化部門、數(shù)字制圖部門等部門的協(xié)同合作。以此為鑒,可視化影人年譜也需由傳統(tǒng)的獨(dú)立作者撰寫模式轉(zhuǎn)變成以多方合作為基礎(chǔ)的“項(xiàng)目”推進(jìn)模式。可視化影人年譜的數(shù)據(jù)庫(kù)搭建需要多方機(jī)構(gòu)的協(xié)同合作與良性互動(dòng),形成數(shù)字人文研究活動(dòng)的關(guān)系網(wǎng)絡(luò),各節(jié)點(diǎn)可以同時(shí)對(duì)某一項(xiàng)目在不同地點(diǎn)對(duì)資料進(jìn)行訪問(wèn)、獲取、增刪修改、應(yīng)用。圖書館、電影資料館、檔案館、博物館在數(shù)字人文影人年譜和中國(guó)電影數(shù)據(jù)庫(kù)建構(gòu)中發(fā)揮重要作用,這些機(jī)構(gòu)與數(shù)字人文緊密聯(lián)結(jié),不僅能夠提供史料挖掘所需的基礎(chǔ)文本詞條與元數(shù)據(jù),還能在檢索、分類、開源獲取、數(shù)據(jù)關(guān)聯(lián)、資源共享與傳播、數(shù)據(jù)加工與維護(hù)多方面完善電影史研究的空缺。與此同時(shí),數(shù)字人文影人年譜的數(shù)據(jù)化對(duì)圖書館、電影資料館、檔案館、博物館等機(jī)構(gòu)自身服務(wù)效率的提高與資源整合具有利好之處,機(jī)構(gòu)配合研究人員的需求不斷吸納更多史料并補(bǔ)充進(jìn)數(shù)據(jù)庫(kù),進(jìn)一步提高館藏、檢索、組織、管理能力。所以為了提高機(jī)構(gòu)與數(shù)字影人年譜的互動(dòng)效率,研究者應(yīng)主動(dòng)去圖書館、電影資料館、檔案館、博物館提出對(duì)某方面資源的需求和補(bǔ)充,積極與館內(nèi)科研人員提出查缺補(bǔ)漏的請(qǐng)求。
為從根本上改變當(dāng)下中國(guó)電影知識(shí)圖譜的固態(tài)化、淺表化和孤島化狀況,為改善中國(guó)影人數(shù)據(jù)資源的離散化和斷片式特征[33],研究者需要擺脫對(duì)有偏見的檔案或典籍材料的依賴,在計(jì)算機(jī)的算法和傳統(tǒng)的電影史研究中尋求平衡點(diǎn),探尋適合不同研究者個(gè)體的數(shù)字工具和路徑方法,開放包容地面對(duì)知識(shí)與歷史的多面闡釋。在應(yīng)用數(shù)字技術(shù)、算法與人工智能的背景下,堅(jiān)守以人文主義為核心和靈魂,在電影本體論和歷史、社會(huì)、文化的層面實(shí)現(xiàn)數(shù)字與人文的對(duì)接。