何凱
經(jīng)過10年布局,中華書局?jǐn)?shù)字化發(fā)展戰(zhàn)略初見成效,自主研發(fā)的大型數(shù)字出版產(chǎn)品《中華經(jīng)典古籍庫》于6月10日在京舉行捐贈開通儀式暨發(fā)布研討會。研討會上,中華書局向國家圖書館進行了捐贈。《中華經(jīng)典古籍庫》是中華書局版點校本古籍的首度數(shù)字化,收錄包括“二十四史”及《清史稿》《資治通鑒》等經(jīng)典系列在內(nèi)的權(quán)威整理本,一期收錄300種,計2億余字。產(chǎn)品不僅提供了保留全部整理成果的數(shù)字文本,更實現(xiàn)了文本與原書圖像的一一對照,并能自動生成引用格式,除支持全文檢索外,還添加了獨具特色的人名異稱關(guān)聯(lián)檢索等。
鄔書林(國家新聞出版廣電總局副局長):對《中華經(jīng)典古籍庫》的上線服務(wù),我有幾點建議。第一,百年老店中華書局緊跟數(shù)字化的步伐,與時俱進,推出了符合數(shù)字時代需要的中國古籍的經(jīng)典產(chǎn)品,這是件值得慶幸的事情。第二,這個庫有別于國內(nèi)外其他的古籍?dāng)?shù)據(jù)庫,它設(shè)定的內(nèi)容是權(quán)威的,是經(jīng)過幾代學(xué)者和出版人積累下的經(jīng)典而集成的一個庫。雖然目前只有300種,但是它已經(jīng)是中國傳統(tǒng)文化經(jīng)典的相當(dāng)一部分集成。出版工人和一般的傳播工人有區(qū)別,出版最重要的是工人在傳播知識、信息,提供各種文化服務(wù)的時候有一個最重要的基本功能——質(zhì)量控制,要確定出版社的出版物代表了這個時代,是現(xiàn)在人類已有的最高水平的認(rèn)識,如果沒有做到這個,出版工作就失實了。第三,這個數(shù)據(jù)庫能更好地服務(wù)讀者,并能大范圍傳播,讓世界上更多的人了解中華文化的精髓。大家知道,以中國為例,我們從甲骨,到青銅名器、鑄件、紙張印刷,每一次都是速度很快,而這次數(shù)字化進程還有本質(zhì)區(qū)別,它使知識在更大范圍,更大的空間,更方便讀者使用。在現(xiàn)行的數(shù)字化的條件下,大家可以隨時隨地通過手機、平板電腦等終端閱讀各種內(nèi)容,幾乎不受任何限制。它使知識傳播的效能和受眾有了本質(zhì)的變化,也就是說人類掌握的知識會越來越多,掌握知識的人在改造社會的時候起的作用就越大。
譚躍(中國出版集團公司總裁):《中華經(jīng)典古籍庫》是我國第一款基于整理本的古籍?dāng)?shù)據(jù)庫,也是中國出版集團確立品牌與數(shù)字化發(fā)展戰(zhàn)略以后第一個古籍?dāng)?shù)據(jù)庫產(chǎn)品。入庫資源不僅特色與專業(yè)突出,品質(zhì)在國內(nèi)也處于一流地位,充分體現(xiàn)了國家級出版集團的資源優(yōu)勢。2012年,中國出版集團公司召開“數(shù)字化戰(zhàn)略推進會”,制定了《中國出版集團公司數(shù)字出版規(guī)劃》,明確提出數(shù)字化戰(zhàn)略的基本定位和發(fā)展思路,要建設(shè)開放式、國際化、延展性的內(nèi)容集聚、傳播、交易和服務(wù)功能的綜合平臺。中華書局的《中華經(jīng)典古籍庫》正是集團數(shù)字化戰(zhàn)略、品牌戰(zhàn)略的重要組成部分和具體體現(xiàn)。中華書局要以此次《中華經(jīng)典古籍庫》的產(chǎn)品發(fā)布和營銷為契機,以國家“十二五”重點項目“中華基本史籍知識庫”的項目建設(shè)和產(chǎn)品研發(fā)為重點,創(chuàng)新體制機制,積極探索古籍?dāng)?shù)據(jù)庫研發(fā)及產(chǎn)品化的商業(yè)模式,培養(yǎng)人才隊伍,將中國出版集團的資源、平臺、項目和品牌優(yōu)勢有效地轉(zhuǎn)化為產(chǎn)品和經(jīng)營優(yōu)勢。
徐?。ㄖ腥A書局總經(jīng)理):近幾十年來,閱讀的方式日新月異,學(xué)術(shù)研究獲取資料和成果發(fā)表的方式都在不斷變化,數(shù)字出版風(fēng)起云涌,無論是大眾出版,還是數(shù)字出版,都面臨融入轉(zhuǎn)型的問題。我們一直在思考和探索,在數(shù)字時代中華書局如何保持古籍整理和學(xué)術(shù)出版的優(yōu)勢,如何保持中華書局的影響力,如何滿足數(shù)字時代讀者的需求、學(xué)術(shù)研究的需求和大眾閱讀的需求,實現(xiàn)出版轉(zhuǎn)型。中華書局古籍?dāng)?shù)字化十多年的實踐大致經(jīng)歷了三個階段:一是,基礎(chǔ)的數(shù)據(jù)整理階段,利用已經(jīng)完成的數(shù)據(jù)化成果提升傳統(tǒng)出版的能力,推動紙本的更新;二是,結(jié)合專業(yè)出版數(shù)字化的實踐,專注于內(nèi)容的深加工,并以中小型數(shù)據(jù)庫進行探索、嘗試;三是,產(chǎn)品化階段,包括古籍?dāng)?shù)據(jù)庫,以及國家“十二五”數(shù)字出版骨干工程、中華基本史籍知識庫的研發(fā)。在多年的古籍?dāng)?shù)字化實踐中,我們逐步體會到數(shù)字化的過程并不是一個文本的簡單還原過程,而是一個標(biāo)準(zhǔn)化的過程,需要投入大量的編輯力量,為了保存古籍整理成果,每一本書的加工都需要針對不同的內(nèi)容確定不同的標(biāo)引格式,每本書的體例要具體分析,根據(jù)每本書的結(jié)構(gòu)研究它在數(shù)字庫的呈現(xiàn),添加必要的標(biāo)題信息,還要處理原始書中的錯誤,有時需要查找原始文件才能摸索。在這樣的過程中我們?yōu)楣偶臄?shù)據(jù)整理制定規(guī)范。我們也一直在思考古籍?dāng)?shù)字出版的發(fā)展,以谷歌為代表的檢索不斷在為用戶提供免費的數(shù)據(jù),我們認(rèn)為專業(yè)領(lǐng)域的數(shù)字出版一定要提供更加專業(yè)的內(nèi)容才有出路,因此我們將體現(xiàn)已有古籍整理成果,確定古籍整理標(biāo)準(zhǔn)作為我們的基本目標(biāo)。《中華經(jīng)典古籍庫》從內(nèi)容上講是通過知識關(guān)聯(lián)將古籍條目等有機結(jié)合,而建立了立體化系統(tǒng),該系統(tǒng)通過知識檢索、鏈鋸、鏈接、知識提示等功能,呈現(xiàn)古籍文獻的內(nèi)容,建立內(nèi)容間的關(guān)聯(lián),打破專家與讀者之間的知識和信息的壁壘。之后我們將依托于史籍知識庫,發(fā)展按需印刷出版業(yè)務(wù),建立符合傳統(tǒng)文化的門戶網(wǎng)站,不僅服務(wù)專業(yè)讀者,也承擔(dān)起向大眾傳播優(yōu)秀傳統(tǒng)文化的重任。應(yīng)該說古籍?dāng)?shù)字化的工作仍然處于艱難的起步階段,我個人覺得政府支持、資源聚合、盈利能力、復(fù)合型人才等是關(guān)鍵要素。未來幾年中華書局將會堅持走穩(wěn)扎穩(wěn)打的路線,不盲目追隨,專注于提供最佳的數(shù)字服務(wù),為社會提供真正的有價值的古籍?dāng)?shù)字化產(chǎn)品。通過我們長期不懈的努力,在數(shù)字出版領(lǐng)域樹立起中華書局的優(yōu)質(zhì)品牌。
安平秋(全國高校古籍整理研究工作委員會主任、北京大學(xué)中文系教授):1981年,陳云同志曾經(jīng)兩次談到古籍整理和古籍的出版工作,并做了指示。當(dāng)時中共中央做了討論,并且在1981年下發(fā)了當(dāng)年的37號文件,也就是中共中央關(guān)于整理我國古籍的指示。在那個文件里面,明確指出整理古籍是一項十分重要的工作。從那以后,國內(nèi)的整理工作像雨后春筍那樣,許多大學(xué)都建立了研究所,古籍的整理工作、古籍的出版工作、古籍的研究工作,蓬蓬勃勃地開展起來。30多年過去了,今天情況有了明顯的變化,中華書局這樣的一個古籍庫的出現(xiàn)就是一個證明。隨著時代的變遷,信息時代的到來,計算機和互聯(lián)網(wǎng)技術(shù)的普遍應(yīng)用,古籍整理和出版的技術(shù)手段發(fā)生了很大的變化。數(shù)字化的古籍整理產(chǎn)品,加上無所不在的互聯(lián)網(wǎng)技術(shù),具有傳播迅捷、獲取方便、覆蓋廣泛的特點。這對于從事古籍整理工作的人來說,對于文化遺產(chǎn)繼承、傳播、發(fā)揚的學(xué)者來說,具有重要的意義。相對于傳統(tǒng)的印刷,古籍?dāng)?shù)據(jù)庫是古籍整理的一種新形式,具有方便傳播、便于檢索的特點?!吨腥A經(jīng)典古籍庫》把中華書局出版的整理本,就是本版書的古籍進行數(shù)字化加工,形成了可供讀者瀏覽的全文檢索數(shù)據(jù)庫產(chǎn)品。從使用者的角度來看,《中華經(jīng)典古籍庫》有以下幾個特點:一是,數(shù)據(jù)是基于中華書局多年積累的古籍整理的圖書,質(zhì)量經(jīng)過時間的檢驗,并且保留了全部的校刊注釋的成果,可以直接引用。二是,提供了引用自動添加校注的功能,校注的內(nèi)容包括書名、出版時間、頁碼等,非常方便。三是,《中華經(jīng)典古籍庫》是中華書局古籍整理數(shù)據(jù)化的一個開始,對推動數(shù)據(jù)化技術(shù)推廣、普及中國文化有著積極的意義。
洪濤(中華書局?jǐn)?shù)字出版中心古籍資源部主任):在此之前,市場上已經(jīng)出現(xiàn)很多古籍庫的產(chǎn)品,但是經(jīng)過調(diào)研我們發(fā)現(xiàn),這些產(chǎn)品還不能完全滿足用戶的需求,用戶想要什么?他們想要利用古籍整理的成果,他們想要能直接引用的數(shù)字資源,省去復(fù)合指數(shù)的麻煩,這是中華書局的資源優(yōu)勢。中華書局經(jīng)過幾十年的積累有了大量古籍出版的資源,因此我們想建立一個符合用戶需要的古籍?dāng)?shù)據(jù)庫——《中華經(jīng)典古籍庫》?!吨腥A經(jīng)典古籍庫》收集了中華書局圖書的全部內(nèi)容,從出版說明到正文、專名線(音)、書名線(音),等等,用戶閱讀的過程中正文閱讀可以跳轉(zhuǎn),跳轉(zhuǎn)是雙面的,方便用戶找到注釋的內(nèi)容。有很多用戶在閱讀的時候想要看到中華書局原版圖書的圖像,這里也可以實現(xiàn)數(shù)字化文本和中華書局原版圖像的跳轉(zhuǎn),可以放大。系統(tǒng)提供了復(fù)制功能,除此之外,在復(fù)制的基礎(chǔ)上還提供了引用復(fù)制的功能。在閱讀的時候,我們也提供了聯(lián)機字典的功能,不光是檢索的字,還有同義字都會在面前。在全文檢索這塊,我們對基本的全文檢索提供了一些檢索范圍,比如說正文、校注、書名、標(biāo)題等,按照范圍檢索,讓檢索的結(jié)果更加準(zhǔn)確。我們檢索一個人名的時候,在人名里檢索,檢索結(jié)果會更加準(zhǔn)確。如果我們想擴大檢索范圍,可以選擇同義詞檢索,比如說檢索曹操,選擇同義詞,系統(tǒng)列出20幾個曹操的亦稱。這對用戶是一種幫助,在用戶知識結(jié)構(gòu)方面很不完整的時候可以給用戶提示。這是《中華經(jīng)典古籍庫》的一個重要內(nèi)容,有一些額外的,比如說紀(jì)年、換算、檢索、瀏覽歷史、書簽等,這些是針對用戶的其他輔助功能。
劉惠平(國家圖書館副館長、黨委副書記):中華書局自主研發(fā)的《中華經(jīng)典古籍庫》將古籍?dāng)?shù)字化編輯和計算機用字處理標(biāo)準(zhǔn)化有機融入,將進一步滿足大中專院校、研究機構(gòu)、圖書館的研究需要,推進古籍?dāng)?shù)字化服務(wù)。中華書局能夠以弘揚傳統(tǒng)文化為己任,引領(lǐng)時代步伐,樹立行業(yè)標(biāo)桿,堪為業(yè)界楷模。國家圖書館作為國家總書庫,負(fù)責(zé)采集各種文獻資源,是國家文獻資源信息保存基地。截至2013年底,國家圖書館館藏文獻總量已經(jīng)超過3240萬冊件,其中館藏善本超過30萬冊件,館藏普通古籍超過160萬冊件。近年來國家圖書館大力推進國家數(shù)字圖書館建設(shè),加快數(shù)字化服務(wù)進程,截至2013年底,館藏數(shù)字資源總量已經(jīng)達到875TB,發(fā)布圖書350萬件,其中自建和合作建設(shè)的古籍庫12個,發(fā)布甲骨、碑帖、古籍特藏等特色古籍?dāng)?shù)字化產(chǎn)品10萬種,還為讀者提供外購的古籍庫等。此次中華書局《中華經(jīng)典古籍庫》將進一步豐富國家圖書館古籍館的數(shù)字資源?!吨腥A經(jīng)典古籍庫》在國家圖書館上線開通后,我們將做好向讀者宣傳使用該《中華經(jīng)典古籍庫》的工作,及時反饋讀者意見和建議。同時我們也期待中華書局在現(xiàn)有質(zhì)量和數(shù)量上不斷修訂完善,不斷向縱深處發(fā)展,開發(fā)更多特色資源庫、數(shù)據(jù)庫等,以滿足不同讀者的需求。