趙雨 王華
【摘要】作為計算機技術(shù)與人文學科的交叉領(lǐng)域,數(shù)字人文的興起為人文研究與業(yè)界實踐注入了新活力。文章從數(shù)字人文視角出發(fā),以國內(nèi)外開發(fā)較為成熟的部分專業(yè)數(shù)據(jù)庫為例,深入探析其在數(shù)字人文影響下的建庫理念、功能設(shè)計、運作模式及應(yīng)用場景。在案例分析的基礎(chǔ)上,文章嘗試為各出版機構(gòu)的專業(yè)數(shù)據(jù)庫融合出版實踐提供可行性路徑方面的參考,提出應(yīng)在理念維度轉(zhuǎn)變角色認知,深挖自身特色,實現(xiàn)優(yōu)勢資源整合;在方法維度以人文研究為認知框架,以前沿數(shù)字技術(shù)為關(guān)鍵手段,延伸數(shù)據(jù)庫價值鏈;在體系維度注重人才培養(yǎng)、機構(gòu)協(xié)同、多方融資;在場景維度適配移動時代用戶的個性化需求,打通多元應(yīng)用場景。
【關(guān)鍵詞】數(shù)字人文 專業(yè)數(shù)據(jù)庫 融合出版
【中圖分類號】G230 【文獻標識碼】A 【文章編號】1003-6687(2024)2-042-06
【DOI】 10.13786/j.cnki.cn14-1066/g2.2024.2.006
2022年4月,中共中央宣傳部印發(fā)《關(guān)于推動出版深度融合發(fā)展的實施意見》,明確指出要“加強重要領(lǐng)域?qū)I(yè)數(shù)據(jù)庫建設(shè),推動出版機構(gòu)打造代表國家水平的黨史文獻、社科文獻、科技文獻、學術(shù)文獻、古籍整理融合出版精品,推出更多具有中國特色、世界影響的數(shù)據(jù)庫項目”。2022年10月,黨的二十大對繁榮發(fā)展文化事業(yè)和文化產(chǎn)業(yè)作出重要部署,首次將“實施國家文化數(shù)字化戰(zhàn)略”寫入報告,這對出版業(yè)在新時代加速數(shù)字化轉(zhuǎn)型、加快融合出版步伐、持續(xù)增加數(shù)字化精品供給提出了新要求。在此背景下,專業(yè)數(shù)據(jù)庫建設(shè)已成為各出版社打造融合出版精品的重要一環(huán)。
與此同時,在國際范圍內(nèi)飛速發(fā)展、不斷更新迭代的數(shù)字人文作為一種文化生產(chǎn)實踐,也注重數(shù)字技術(shù)與人文研究的耦合,以碰撞出更具前沿性的學術(shù)火花。哈佛大學包弼德教授認為數(shù)字人文的定義應(yīng)包括三點:信息的發(fā)現(xiàn)、分析和可視化的技術(shù),數(shù)字出版物,以及數(shù)字人文研究和整個數(shù)字生態(tài)系統(tǒng)。[1]數(shù)字人文作為國際范圍內(nèi)日益興盛的人文研究新范式,可為專業(yè)數(shù)據(jù)庫融合出版提供更有針對性的、更多元的服務(wù)場景,實現(xiàn)出版內(nèi)容勢能再釋放;作為數(shù)據(jù)密集型的產(chǎn)業(yè)主體,可為專業(yè)數(shù)據(jù)庫融合出版提供前沿數(shù)字技術(shù)應(yīng)用方面的有益借鑒;作為多以協(xié)作方式展開的數(shù)字化項目,可為專業(yè)數(shù)據(jù)庫融合出版提供新的項目運作理念指引。
一、數(shù)字人文與專業(yè)數(shù)據(jù)庫建設(shè):現(xiàn)實起點與價值基點
專業(yè)數(shù)據(jù)庫平臺可從研究工具、數(shù)據(jù)、資源等方面為數(shù)字人文研究提供服務(wù)支持,是其重要的基礎(chǔ)設(shè)施和物質(zhì)載體。近年來,國內(nèi)出版業(yè)界的專業(yè)數(shù)據(jù)庫建設(shè)工作主要呈現(xiàn)以下發(fā)展態(tài)勢。
首先是類型多樣化。隨著國家政策、資金扶持力度加大,各出版機構(gòu)立足自身優(yōu)勢,多維探索專業(yè)數(shù)據(jù)庫建設(shè)新方向。既有中華書局歷代進士登科數(shù)據(jù)庫、社會科學文獻出版社中國鄉(xiāng)村文獻數(shù)據(jù)庫等專題數(shù)據(jù)庫,也有工程科技知識服務(wù)平臺、中國航天科學技術(shù)知識庫等專業(yè)知識服務(wù)平臺,還有案例數(shù)據(jù)庫、地圖數(shù)據(jù)庫、專業(yè)數(shù)據(jù)庫等眾多類型。這些品種涵蓋古籍、醫(yī)學、法律、航天、社會科學等多學科領(lǐng)域。
其次是技術(shù)應(yīng)用前沿化。國內(nèi)部分出版機構(gòu)緊跟大數(shù)據(jù)、人工智能等技術(shù)發(fā)展大趨勢,在技術(shù)應(yīng)用層面逐步做到與國際前沿接軌。如上海古籍出版社的尚古匯典·古籍數(shù)字服務(wù)平臺充分應(yīng)用OCR技術(shù)、自然語言處理、大規(guī)模語料庫和機器學習標點等古籍智能算法技術(shù),[2]數(shù)字中國·大運河文化數(shù)字資源庫則在數(shù)據(jù)挖掘、聚合及知識圖譜構(gòu)建方面著重發(fā)力。
然而,不可否認的是,相較于歐美等國,國內(nèi)專業(yè)數(shù)據(jù)庫平臺建設(shè)尚處起步階段,存在技術(shù)方法薄弱、用戶體驗欠佳、實際利用率不高等問題。[3]在內(nèi)容方面,國內(nèi)出版業(yè)界打造的一些專業(yè)數(shù)據(jù)庫平臺往往基于自身傳統(tǒng)出版物內(nèi)容資源進行開發(fā),缺乏明確的建庫目標。數(shù)據(jù)庫想要更好地服務(wù)于某學科領(lǐng)域的特定學術(shù)問題,既需陳列知識,也需展示知識間的關(guān)聯(lián),還需及時更新與之相關(guān)的國內(nèi)外研究動態(tài),而未以明確目標布局數(shù)據(jù)庫建設(shè),自然難以滿足用戶需求,直接影響用戶黏性。在形式方面,國內(nèi)部分專業(yè)數(shù)據(jù)庫產(chǎn)品界面較為簡單,未能根據(jù)當前移動化辦公、研究的大趨勢適時打造移動終端適用的產(chǎn)品,使用場景固定,自然導致實際使用率低。不僅如此,可持續(xù)性不強也是目前國內(nèi)一些專業(yè)數(shù)據(jù)庫產(chǎn)品存在的問題之一,其運營和后期維護都缺乏專業(yè)團隊和技術(shù)層面的支持。
開發(fā)面向數(shù)字人文的相關(guān)專業(yè)數(shù)據(jù)庫,對我國出版機構(gòu)融合發(fā)展模式意義重大。一是可充分利用、整合出版機構(gòu)自身的諸多優(yōu)勢??v觀數(shù)字人文項目運作的全流程,除最初的研究選題設(shè)立與最后的闡釋性環(huán)節(jié)需研究者親自完成,其他的資源采集及整合、內(nèi)容建模、數(shù)據(jù)分析等多個環(huán)節(jié)都可交由除研究中心以外的專業(yè)機構(gòu)運作。而相比于其他商業(yè)性公司,出版機構(gòu)在人文內(nèi)容資源貯藏、連通研究、市場/內(nèi)容生產(chǎn)與內(nèi)容消費的關(guān)系等方面都有著得天獨厚的條件。二是能夠有效應(yīng)對新技術(shù)新業(yè)態(tài)不斷迭代帶來的新挑戰(zhàn)。在AR、VR、區(qū)塊鏈、元宇宙、ChatGPT等眾多新技術(shù)名詞充斥社會生活的當下,仍然囿于過去傳統(tǒng)的紙質(zhì)出版思維理念的出版機構(gòu)勢必要被時代浪潮湮沒。如若出版機構(gòu)能夠以數(shù)字人文新理念武裝思想,用數(shù)字人文新技術(shù)打造優(yōu)質(zhì)數(shù)據(jù)庫產(chǎn)品,主動挖掘研究者或大眾的需求,那么在國家文化數(shù)字化戰(zhàn)略指引下,其專業(yè)數(shù)據(jù)庫建設(shè)走向高質(zhì)量發(fā)展將不再是愿景。
由此,以專業(yè)數(shù)據(jù)庫建設(shè)為主要抓手,以數(shù)字人文為切入點,廣泛借鑒吸收其先進理念、前沿技術(shù)、運作模式、應(yīng)用場景,可為數(shù)智時代各出版單機構(gòu)更好、更快實現(xiàn)數(shù)字化轉(zhuǎn)型,走融合出版之路提供破題之道。
二、面向數(shù)字人文的專業(yè)數(shù)據(jù)庫建設(shè):理念、方法、模式、場景
數(shù)字人文作為一項以人文精神駕馭數(shù)字技術(shù)的前沿性知識生產(chǎn)實踐,在全球范圍內(nèi)的學術(shù)與產(chǎn)業(yè)領(lǐng)域都掀起了巨大的波瀾。與此同時,國內(nèi)的出版行業(yè)也在積極嘗試將數(shù)字化革命的成果運用到以專業(yè)數(shù)據(jù)庫建設(shè)為代表的融合出版實踐中。本文從理念、方法、模式、場景等角度,分析數(shù)字人文領(lǐng)域的專業(yè)數(shù)據(jù)庫建設(shè)經(jīng)驗,以為我國出版業(yè)界的相關(guān)實踐帶來諸多可參考、借鑒之處。
1. 數(shù)字人文作為一種理念∶專業(yè)數(shù)據(jù)庫建設(shè)理念
以電子屏幕為中介的專業(yè)數(shù)據(jù)庫與以紙張為介質(zhì)的傳統(tǒng)紙質(zhì)出版物的知識呈現(xiàn),其區(qū)別不僅局限于技術(shù)工具性層面,還包括知識生產(chǎn)、知識獲取方式的更迭,作者、讀者與編輯角色界限的模糊,時間性的閱讀體驗向空間性的閱讀思維轉(zhuǎn)變等。成熟的數(shù)字人文數(shù)據(jù)庫在建設(shè)理念上格外注重創(chuàng)新與多元,突出問題意識,以用戶需求為導向,給人文研究和業(yè)界實踐帶來了新范式。
數(shù)字人文理念首先體現(xiàn)為跨學科、跨領(lǐng)域、跨文化的包容性。中國歷代人物傳記資料庫(以下簡稱CBDB)是世界范圍內(nèi)較早開發(fā)建設(shè)的大型歷史關(guān)系型數(shù)據(jù)庫,在歷史學研究領(lǐng)域有較大的影響力。這一數(shù)據(jù)庫是由哈佛大學、北京大學等三家機構(gòu)共同主持的項目。其包容性不僅體現(xiàn)在文化背景的多元化上,而且體現(xiàn)在其致力于開發(fā)眾包錄入系統(tǒng),以開放的在線平臺鼓勵來自各領(lǐng)域的研究者、志愿者向CBDB提交數(shù)據(jù),目標是要打造“全球智慧數(shù)據(jù)平臺”。[4]類似的情形在英國倫敦大學學院主導的邊沁手稿轉(zhuǎn)錄項目、[5]英國國家檔案館主導的“戰(zhàn)爭日記”項目[6]等眾多數(shù)字人文項目中都較為常見。共建共享的理念有助于避免各自為戰(zhàn)、數(shù)據(jù)庫平臺過于分散的情況發(fā)生,實現(xiàn)優(yōu)勢資源的聚合、專業(yè)領(lǐng)域的融通。
數(shù)字人文理念還體現(xiàn)為問題意識突出??v觀國內(nèi)外影響力較大的數(shù)字人文數(shù)據(jù)庫,其設(shè)計理念均以特定研究問題為導向,或充分注重前期對潛在用戶接受偏好的調(diào)研,在保證數(shù)據(jù)庫的實際利用率、延長其生命周期的同時,降低項目資金投入的風險。如威尼斯時光機項目旨在復(fù)原威尼斯城市歷史的演變過程;南京大學六朝建康歷史地理信息系統(tǒng)專注于利用GIS技術(shù)重現(xiàn)六朝建康的歷史地理風貌;社會科學文獻出版社則依托自身社科資源根據(jù)用戶需求“量身定制”,為包括上海旅游??茖W院等在內(nèi)的多家科研機構(gòu)打造專業(yè)數(shù)據(jù)庫平臺,充分體現(xiàn)了社會科學文獻出版社以用戶為中心的建庫理念。
2. 數(shù)字人文作為一種方法∶專業(yè)數(shù)據(jù)庫功能設(shè)計
數(shù)字人文對人文學科研究和知識呈現(xiàn)最顯著的影響體現(xiàn)在方法論和技術(shù)層面上。通過運用一系列先進的數(shù)字技術(shù),數(shù)字人文為人文學界和業(yè)界帶來了數(shù)據(jù)驅(qū)動的新方法。德國當代著名技術(shù)哲學研究者、媒介學者西比爾·克萊默爾提出,數(shù)字人文激發(fā)了平面化文化技藝的潛力。經(jīng)由數(shù)字人文的方法,流動在不同時間維度、不同出版物中的離散語言文字以字母拼音輸入方式重新排列組合并形成新的序列。以字母表順序形成索引格式的專業(yè)數(shù)據(jù)庫,使得使用主體能夠在數(shù)字化平面空間里自由尋訪并以嶄新的視角操縱知識。由此,“‘世界的可讀性轉(zhuǎn)變?yōu)椤當?shù)據(jù)世界機器的可讀性及可操作性”。[7]
這當然是建立在數(shù)字人文數(shù)據(jù)庫先進、完備的技術(shù)方法體系之上的。從知識資源發(fā)現(xiàn)、收集到文本比較,再到發(fā)布、協(xié)作,每一環(huán)節(jié)的完成都需要數(shù)字化技術(shù)、數(shù)據(jù)管理技術(shù)、數(shù)據(jù)分析技術(shù)、可視化技術(shù)、VR/AR技術(shù)、機器學習技術(shù)等不同類型數(shù)字技術(shù)作為支撐。以時間機器項目數(shù)據(jù)庫的技術(shù)方法為例,其技術(shù)基礎(chǔ)設(shè)施體系由一個數(shù)字內(nèi)容處理器和三個仿真引擎構(gòu)成,包括用來對歐洲歷史虛擬時空模擬的4D模擬器、管理多模態(tài)數(shù)據(jù)生成的多維空間的通用表示引擎,以及一個大規(guī)模的推理引擎,用于評估確保人類共通認知與4D模擬結(jié)果的一致性。[8]眾多前沿的高科技技術(shù)被用于這項時間和地理空間跨度較大的項目,以實現(xiàn)開發(fā)者復(fù)原歐洲社會、文化和地理的歷史演變的目標需求。
3. 數(shù)字人文作為一種模式∶專業(yè)數(shù)據(jù)庫項目運作模式
數(shù)字人文實踐一般以項目形式開展,其項目開發(fā)模式、資金獲得渠道及數(shù)據(jù)庫后續(xù)維護策略等,都值得出版機構(gòu)在進行專業(yè)數(shù)據(jù)庫建設(shè)時深入學習。
(1)項目人員配備組織化、體系化。目前眾多成熟的數(shù)字人文數(shù)據(jù)庫均設(shè)有專門的委員會。例如CBDB項目、跨大西洋奴隸貿(mào)易數(shù)據(jù)庫(Transatlantic Slave Trade Database)均專設(shè)有執(zhí)行委員會和指導委員會,參與項目決策、監(jiān)督等項目治理活動;時間機器項目團隊同樣下設(shè)有執(zhí)行委員會,除項目發(fā)起人、瑞士洛桑聯(lián)邦高等理工學院弗雷德里克·卡普蘭教授擔任委員會主席外,委員會另由來自計算機科學、藝術(shù)史、圖書館系統(tǒng)等多領(lǐng)域的技術(shù)專家組成,還設(shè)有專門的項目運營團隊負責項目宣傳、行政等具體事務(wù)。結(jié)構(gòu)化的團隊體系可確保各委員會成員都能參與到項目決策、監(jiān)督等環(huán)節(jié)中,避免重復(fù)建設(shè)、效率低下、推諉等情況發(fā)生。
(2)資金來源的多渠道化。國內(nèi)現(xiàn)有的部分專業(yè)數(shù)據(jù)庫由于支持資金有限或渠道單一,易陷入生命周期短、可持續(xù)利用性低等尷尬局面。許多運營能力較強的數(shù)字人文數(shù)據(jù)庫項目注重商業(yè)化探索,除定向撥款的資金來源以外,還向私人基金會及高校、專業(yè)協(xié)會等非營利組織尋求資金支持。[9]如斯坦福大學的“描繪信件共和國”(Mapping the Republic of Letters)項目,最初由斯坦福大學人文創(chuàng)新基金資助,后又先后獲得國家人文基金會的挖掘數(shù)據(jù)挑戰(zhàn)基金及數(shù)字人文資助計劃撥款;[10]跨大西洋奴隸貿(mào)易數(shù)據(jù)庫的資金來源更為廣泛,受到美國學術(shù)團體協(xié)會、安德魯·威廉·梅隆基金會、英國藝術(shù)與人文研究委員會等多國基金會及相關(guān)研究中心的資助。[11]
此外,在數(shù)據(jù)庫維護方面,第三方知識技術(shù)服務(wù)公司是眾多數(shù)字人文項目的首選。例如CBDB授權(quán)北京元引科技有限公司獨家負責該數(shù)據(jù)庫的商業(yè)化運營,實現(xiàn)了人力與時間成本的壓縮集約。當然也有如中華書局一樣規(guī)模較大、人力資源結(jié)構(gòu)完善的老牌出版機構(gòu),其選擇成立全資子公司——古聯(lián)(北京)數(shù)字傳媒科技有限公司為其提供數(shù)據(jù)庫服務(wù)支持。
4. 數(shù)字人文賦能多元場景∶專業(yè)數(shù)據(jù)庫應(yīng)用場景
數(shù)字人文改變了知識傳播的方式。不同于以往獲取知識需前往圖書館、檔案館等地閱讀處在看護狀態(tài)下的書籍或檔案的朝圣性具身體驗,數(shù)字化虛擬空間下,知識獲取、學術(shù)研究呈現(xiàn)泛在化趨勢,數(shù)據(jù)庫應(yīng)用場景也呈現(xiàn)出多元化形態(tài)。
面向?qū)I(yè)研究,數(shù)字人文數(shù)據(jù)庫幫助研究者從中發(fā)現(xiàn)更加宏觀、差異化的規(guī)律性趨勢,不同程度上拓展了文學、語言學、歷史學等多個領(lǐng)域。以文學研究領(lǐng)域為例,數(shù)字人文數(shù)據(jù)庫打破了一直以來的近距閱讀傳統(tǒng),通過運用自然語言處理能力使遠讀場景成為一種規(guī)?;厔?,即對大量文本形成全景式觀照,從中提煉差異性與整體性,發(fā)掘總體趨勢和演變規(guī)律。如中南民族大學王兆鵬教授團隊主導推出的唐宋文學編年地圖,通過大數(shù)據(jù)復(fù)現(xiàn)了唐宋著名詩人一生的行跡及詩文寫作具體地點。類似的案例還有北京大學團隊開發(fā)的宋元學案知識圖譜可視化系統(tǒng)、[12]上海圖書館主導的中國家譜知識服務(wù)平臺[13]等。
面向公眾,數(shù)字人文數(shù)據(jù)庫可以從地理空間和時間意義上較大幅度地壓縮知識獲取成本,其開源性能夠催生討論學術(shù)話題的公共領(lǐng)域,并使專業(yè)知識的去專業(yè)化成為可能?!皵?shù)字人文為業(yè)余學術(shù)提供了一個平臺,使人文研究成為一個在世界范圍內(nèi)可參與、相關(guān)聯(lián)的新的多人在線游戲?!盵14]眾多眾包式數(shù)字人文數(shù)據(jù)庫凸顯了數(shù)字媒介的可重寫性,創(chuàng)造了一種公眾參與創(chuàng)作、編輯和評述的互動式應(yīng)用場景,由多倫多大學士嘉堡分校師生團隊發(fā)起的Resemblage項目就是一項社區(qū)公眾廣泛參與、個性化詮釋對衰老的理解的數(shù)字敘事研究項目。[15]此外,也有部分數(shù)字人文項目通過開發(fā)在線教育課程等形式,使得專業(yè)數(shù)據(jù)庫不只用于瀏覽、檢索,還可為教育服務(wù)提供支持。如“歐洲大屠殺研究基礎(chǔ)設(shè)施” ( EHRI)項目,就在其網(wǎng)站專設(shè)大屠殺研究在線課程,以特定案例為線索,串聯(lián)相關(guān)史料和背景信息,以幫助教師和學生了解歷史研究的最新趨勢;[16]再如“暗影之谷”(The Valley of the Shadow)項目,不僅為教師提供包括教學目標、所需材料等信息在內(nèi)的詳細教案,還為論文寫作提供規(guī)劃指導和檢索建議。
三、面向數(shù)字人文的專業(yè)數(shù)據(jù)庫融合出版可行性路徑與思考
新的技術(shù)語境呼喚新的出版業(yè)態(tài)。數(shù)字人文導向下的專業(yè)數(shù)據(jù)庫建設(shè),可成為出版業(yè)走融合發(fā)展之路的重要載體。在國內(nèi)外既有數(shù)字人文數(shù)據(jù)庫建設(shè)經(jīng)驗基礎(chǔ)之上,專業(yè)數(shù)據(jù)庫融合出版發(fā)展可行性路徑應(yīng)包括以下幾個方面。
1. 理念之維∶以角色轉(zhuǎn)型、優(yōu)勢資源深挖帶動出版觀念升級
數(shù)字人文的興起提升了人文學科對數(shù)據(jù)科學、內(nèi)容資源聚合重要性的認知。作為一種研究范式,數(shù)字人文可對多元異構(gòu)的海量數(shù)字資源進行挖掘整合、融通利用。同理,我國出版領(lǐng)域的專業(yè)數(shù)據(jù)庫建設(shè)可向數(shù)字人文靠攏,提高對自身內(nèi)容資源及其數(shù)字化轉(zhuǎn)化價值的認識。數(shù)字技術(shù)更新迭代的大背景下,出版人對自身角色認知、數(shù)據(jù)庫出版的定位考量也亟須轉(zhuǎn)型升級。面向數(shù)字人文的專業(yè)數(shù)據(jù)庫不應(yīng)只是簡單地對現(xiàn)有紙質(zhì)資源進行電子化,編輯應(yīng)從選題策劃、數(shù)據(jù)資源篩選整合到內(nèi)容建模、可視化呈現(xiàn)等環(huán)節(jié)全流程介入、深度參與。
出版業(yè)還需充分借鑒數(shù)字人文數(shù)據(jù)庫鮮明的問題意識,從本社專業(yè)優(yōu)勢、自身特色出發(fā)實現(xiàn)建庫理念的升維。專業(yè)數(shù)據(jù)庫從含義上就強調(diào)了其內(nèi)容的專業(yè)性和服務(wù)對象的鮮明指向性。各出版社應(yīng)結(jié)合自身的專業(yè)定位,圍繞特定問題整合該專業(yè)領(lǐng)域的知識資源,在垂直領(lǐng)域做精做深。社會科學文獻出版社在數(shù)字出版領(lǐng)域的領(lǐng)先優(yōu)勢正是得益于專業(yè)化,其立足中國發(fā)展與中國經(jīng)驗、國際國別問題研究、中國鄉(xiāng)村研究、古籍與大型學術(shù)文獻四大支撐體系,開發(fā)建設(shè)了皮書數(shù)據(jù)庫、“一帶一路”數(shù)據(jù)庫、中國鄉(xiāng)村研究數(shù)據(jù)庫等多個影響力較大的精品專業(yè)數(shù)據(jù)庫。
2. 方法之維∶以人文研究為框架,運用前沿技術(shù)延伸數(shù)據(jù)庫價值鏈
數(shù)字人文注重運用多樣數(shù)字技術(shù)方法為人文研究構(gòu)筑嶄新、高效的數(shù)據(jù)知識環(huán)境,該范式主導下的專業(yè)數(shù)據(jù)庫實則是一個完整的知識服務(wù)系統(tǒng)。我國出版業(yè)數(shù)字化轉(zhuǎn)型正處在關(guān)鍵階段,在專業(yè)數(shù)據(jù)庫這一數(shù)字基礎(chǔ)設(shè)施的建設(shè)上需合理地進行先進技術(shù)引入、完整服務(wù)體系搭建,多維度延伸價值鏈。
注重將前沿數(shù)字技術(shù)融入專業(yè)數(shù)據(jù)庫建設(shè),首先建立在具體人文研究的整體認知框架之上。這就要求相關(guān)人員從策劃階段就要運用好用戶畫像技術(shù),與具體使用需求有效銜接。不僅如此,還應(yīng)將技術(shù)邏輯貫穿于數(shù)據(jù)庫建設(shè)、發(fā)布、運營、營銷等全流程,延伸數(shù)據(jù)庫價值鏈。數(shù)據(jù)庫產(chǎn)品的后期可持續(xù)化運營及精準化營銷等工作,是目前數(shù)字人文數(shù)據(jù)庫大多缺失的一環(huán),而這恰恰是出版機構(gòu)的優(yōu)勢所在。因此,出版機構(gòu)更應(yīng)有的放矢地加強對云計算、人工智能、大數(shù)據(jù)等數(shù)智化技術(shù)的跟蹤和探索,推動技術(shù)創(chuàng)新驅(qū)動知識內(nèi)容呈現(xiàn)、數(shù)據(jù)庫產(chǎn)品形態(tài)和使用體驗的升級優(yōu)化。如在知識組織、知識表示等環(huán)節(jié)除借鑒數(shù)字人文的精細化實踐以外,也可學習其眾包技術(shù),讓更多潛在用戶參與其中,實現(xiàn)數(shù)據(jù)資源的可持續(xù)更新,提高效率的同時進行口碑營銷,在后期運營階段增強用戶黏性。
3. 體系之維∶人才、融資、機構(gòu)協(xié)作齊發(fā)力,打造融合出版新生態(tài)
數(shù)字人文多以眾多獨立、規(guī)?;难芯宽椖繛槌尸F(xiàn)形態(tài),每個項目內(nèi)部多元背景的人員構(gòu)成、可持續(xù)化的資金鏈以及體系化的運作模式,都是我國出版界可學習的樣板。以數(shù)字人文范式為思路,出版機構(gòu)想要實現(xiàn)專業(yè)數(shù)據(jù)庫出版走向深度融合,就不應(yīng)只將其視為一個閉環(huán)的、狹隘的技術(shù)基礎(chǔ)設(shè)施建設(shè)問題,而是應(yīng)秉持更寬闊的視域,將其放置于出版生態(tài)系統(tǒng)中,以當前專業(yè)數(shù)據(jù)庫出版的種種痛點、不足為切口,考察其折射出的數(shù)字出版體系在人才培養(yǎng)、資金獲得等方面的諸多漏洞與缺失。
(1)建立健全數(shù)字人文復(fù)合型人才培養(yǎng)機制。面向數(shù)字人文的專業(yè)數(shù)據(jù)庫出版需要的是既熟稔于數(shù)據(jù)處理、技術(shù)應(yīng)用,又在文學、歷史學等人文學科領(lǐng)域有廣博知識積淀的專業(yè)編輯。一方面,出版機構(gòu)在人才吸納環(huán)節(jié)就要以此為導向,針對數(shù)字出版在全社會范圍內(nèi)招聘符合條件的科研型高層次人才;另一方面,扎實做好人才培訓環(huán)節(jié)工作,與各大高校的數(shù)字人文中心、圖書館等機構(gòu)建立長期的合作關(guān)系,為有意向、有能力的專業(yè)編輯創(chuàng)造交換學習、繼續(xù)教育條件,以優(yōu)質(zhì)數(shù)字出版人才培養(yǎng)打造融合出版新高地。
(2)多渠道獲取數(shù)據(jù)庫開發(fā)、運營的資金支持。目前國內(nèi)大多數(shù)專業(yè)數(shù)據(jù)庫獲得資金支持主要依靠售賣給機構(gòu)用戶或申請國家出版基金、國家社科基金等,渠道較為單一?;诖耍霭鏅C構(gòu)可通過資本介入、向各類文化產(chǎn)業(yè)基金或私人基金會申請資助等方式廣泛獲得資金支持,以保證數(shù)據(jù)庫的可持續(xù)運營。出版業(yè)內(nèi)首個針對出版融合項目的基金——“中圖數(shù)傳出版融合投資基金”已于2023年2月發(fā)起成立。各出版社應(yīng)在融資渠道方面拓展思路,尋找契合本社融合出版發(fā)展實際的資金支持。
(3)探索協(xié)同作業(yè)、資源整合的開發(fā)運營模式。資源重復(fù)、分散建設(shè)是目前專業(yè)數(shù)據(jù)庫出版存在的又一困境。同一領(lǐng)域的各數(shù)據(jù)庫知識資源的區(qū)隔化增加了知識挖掘的繁瑣程度,無法真正助力于學者的具體研究。由此,出版業(yè)的融合出版實踐應(yīng)在數(shù)字人文數(shù)據(jù)庫跨機構(gòu)、跨學科、跨文化的運作機制中汲取養(yǎng)分,在策劃開發(fā)之初就廣泛與研究機構(gòu)、圖書館、檔案館、博物館及業(yè)界同行建立聯(lián)系,并就版權(quán)歸屬問題協(xié)商一致,以大視野謀篇布局。協(xié)同作業(yè)、資源整合的數(shù)據(jù)庫開發(fā)運營模式不僅能更好地服務(wù)研究需求,跨文化的專業(yè)數(shù)據(jù)庫合作還能聯(lián)通中外學術(shù)交流,打造數(shù)據(jù)庫產(chǎn)品國際品牌,增強文化“走出去”實效。
4. 場景之維∶適配移動時代用戶的個性化需求,打造多元應(yīng)用場景
羅伯特·斯考伯、謝爾·伊斯雷爾在《即將到來的場景時代:大數(shù)據(jù)、移動設(shè)備、社交媒體、傳感器、定位系統(tǒng)如何改變商業(yè)和生活》中提出互聯(lián)網(wǎng)時代的場景是大數(shù)據(jù)、移動設(shè)備、社交媒體、傳感器、定位系統(tǒng)“五力”共同作用下的復(fù)合型情境。打造多元場景,成為數(shù)智時代包括專業(yè)數(shù)據(jù)庫在內(nèi)的互聯(lián)網(wǎng)產(chǎn)品在產(chǎn)品設(shè)計和提升用戶體驗方面需要考慮的新要素。數(shù)字人文在對內(nèi)容資源深度挖掘加工的基礎(chǔ)上,開拓歷史場景復(fù)原、遠程閱讀等多形態(tài)、個性化的知識服務(wù)場景,這對出版機構(gòu)主導的專業(yè)數(shù)據(jù)庫IP開發(fā)、使用場景拓展等有著重要的啟示作用。
目前由出版機構(gòu)主導開發(fā)的專業(yè)數(shù)據(jù)庫產(chǎn)品仍然是基于PC端的用戶使用習慣之上的,然而移動時代,無論是學者從事學術(shù)研究還是大眾進行知識搜索,都呈現(xiàn)出隨時隨地的流動性趨勢,因此對專業(yè)數(shù)據(jù)庫的建設(shè)也要充分適應(yīng)新趨勢、新需求,做到場景適配。如加大產(chǎn)品移動APP的開發(fā)力度,在知識呈現(xiàn)、功能設(shè)計上更加符合用戶在移動場景下的個性化需求等。
此外,專業(yè)數(shù)據(jù)庫產(chǎn)品還應(yīng)在垂直應(yīng)用領(lǐng)域持續(xù)延伸,打通專業(yè)出版、大眾出版與教育出版的壁壘?;谖膶W、歷史學等特定專業(yè)領(lǐng)域,持續(xù)深挖知識資源的其他可利用價值,針對不同用戶群體進行個性化定制與分發(fā),如制作與學術(shù)研究相關(guān)的在線課程,將專業(yè)數(shù)據(jù)庫的使用場景由專業(yè)研究拓展到教育培訓、大眾知識普及等。
結(jié)語
近年來,技術(shù)、社會、市場、政策四方驅(qū)動,出版業(yè)融合發(fā)展逐漸步入深水區(qū)。專業(yè)數(shù)據(jù)庫作為融合出版的主要產(chǎn)品形態(tài),在知識資源組織、整合、呈現(xiàn)等方面的優(yōu)勢引來業(yè)界高度重視和廣泛推廣。如何最大化發(fā)揮其價值功用、在專業(yè)領(lǐng)域或更大范圍內(nèi)提升影響力,數(shù)字人文的數(shù)據(jù)庫實踐可在理念、方法、運營模式、場景應(yīng)用四個層面為我們提供有價值的參考。通過開發(fā)建設(shè)面向數(shù)字人文的專業(yè)數(shù)據(jù)庫,出版機構(gòu)可充分發(fā)揮自身在知識資源貯藏、連接知識生產(chǎn)者與知識消費者關(guān)系等方面的優(yōu)勢,抓住技術(shù)與時代賦予的機遇,搶占融合出版高地,真正為國家文化數(shù)字化戰(zhàn)略貢獻自己的力量。
同時,出版機構(gòu)在專業(yè)數(shù)據(jù)庫建設(shè)實踐中還會遭遇更多更細節(jié)性的問題和困境,如版權(quán)眾包模式下的著作權(quán)歸屬及數(shù)據(jù)質(zhì)量控制、多機構(gòu)共建共享在經(jīng)濟效益和社會效益雙考核的現(xiàn)實環(huán)境中的可實施性、數(shù)據(jù)開放涉及的隱私權(quán)問題等,這些需要通過更微觀、更具體的研究和探索來解決。但不可否認,數(shù)字人文影響下專業(yè)數(shù)據(jù)庫的融合出版將會前景廣闊、大有可為。
參考文獻:
[1] 包弼德,夏翠娟,王宏甦. 數(shù)字人文與中國研究的網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)[J]. 圖書館雜志,2018(11):18-25.
[2] 許旸. 為賡續(xù)中華文脈注入新活力|專訪上海古籍出版社黨委書記、社長呂健[EB/OL].[2023-06-07].https://www.whb.cn/zhuzhan/xinwen/20230607/524789.html.
[3] 張軒慧,趙宇翔,劉煒,等. 數(shù)字人文眾包抄錄平臺用戶體驗優(yōu)化的行動研究:基于社會技術(shù)系統(tǒng)理論[J]. 中國圖書館學報,2020(5):94-113.
[4] 包弼德,王宏蘇,傅君勱,等. “中國歷代人物傳記資料庫”(CBDB)的歷史、方法與未來[J]. 數(shù)字人文研究,2021(1):21-33.
[5] Transcribe Bentham[EB/OL].[2017-12-06].https://blogs.ucl.ac.uk/transcribe-bentham/.
[6] Operation War Diary[EB/OL].[2023-09-10].https://www.operationwardiary.org.
[7] Kr?mer Sybille. Should We Really "Hermeneutise" the Digital Humanities? A Plea for the Epistemic Productivity of a "Cultural Technique of Flattening" in the Humanities[J]. Journal of Cultural Analytics, 2023(7): 4.
[8] Time Machine Organisation TMO Operational Plan 2020-2021[EB/OL].[2020-12-01].https://www.timemachine.eu/wp-content/uploads/2020/09/TMO-Operational-Plan_2020-2021.pdf.
[9] 饒梓欣. 可持續(xù)發(fā)展下的數(shù)字人文數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)現(xiàn)狀研究[D]. 上海:華東師范大學,2022.
[10] Dan Edelstein, Paula Findlen, Giovanna Ceserani, et al. Historical Research in a Digital Age: Reflections from the Mapping the Republic of Letters Project[J]. The American Historical Review, 2017(2): 400.
[11] Slave Voyages-Acknowledgements[EB/OL].[2023-09-10].https://www.slavevoyages.org/about/about#acknowledgements/4/en/.
[12] 宋元學案知識圖譜—學案遙讀[EB/OL].[2021-02-18].https://www.zhonghongwang.com/show-258-196490-1.html.
[13] 中國家譜知識服務(wù)平臺[EB/OL].[2023-09-10].https://jiapu.library.sh.cn/#/.
[14] 安妮·伯迪克,約翰娜·德魯克,彼得·倫恩費爾德,等. 數(shù)字人文:改變知識創(chuàng)新與分享的游戲規(guī)則[M]. 馬林青,韓若畫,譯. 北京:中國人民大學出版社,2018:65.
[15] About the Project[EB/OL].[2023-09-10].https://resemblageproject.ca/the-resemblage-project/.
[16] EHRI Online Course in Holocaust Studies[EB/OL].[2023-09-10].https://training.ehri-project.eu/overview.
The Path to Professional Database Fusion Publishing from the Perspective of Digital Humanities
ZHAO Yu, WANG Hua(School of Journalism and Communication, Shandong University, Jinan 250100,China)
Abstract: As the intersection of computer technology and humanities, the rise of digital humanities has injected new vitality into humanities research and industry practice. From the perspective of digital humanities, this paper takes some professional databases developed at home and abroad as case to deeply explore the database construction concept, function design, operation mode and application scenarios under the influence of digital humanity. On the basis of case analysis, this paper tries to provide reference for the feasibility path to professional database fusion publishing practice of publishing institutions, and proposes that we should change the role cognition in the concept dimension, dig deep into their own characteristics, and realize the integration of superior resources. In the method dimension, humanities research should be taken as the cognitive framework and cutting-edge digital technology as the key means to extend the database value chain. In the system dimension, we should pay attention to personnel training, institutional coordination and multi-party financing. In the scene dimension, it should meet the personalized needs of users in the mobile era and open up multiple application scenarios.
Key words: digital humanities; professional database; fusion publishing
(責任編輯:李晶)
基金項目:山東省社會科學規(guī)劃研究項目“人類文明新形態(tài)對外傳播話語體系構(gòu)建研究”(22CXWJ04);山東大學人文社會科學研究重大項目“人類文明新形態(tài)話語體系構(gòu)建與全球傳播研究”
作者信息:趙雨(1993— ) ,女,山東濟南人,山東大學新聞傳播學院博士研究生,主要研究方向:新聞理論、出版實務(wù);王華(1981— ),男,江蘇宿遷人,山東大學新聞傳播學院教授、博士生導師,主要研究方向:新聞史論、紀錄影視。