錢律進
國家圖書館國家古籍保護中心辦公室,北京 100081
我國古籍數字化發(fā)展策略探析
錢律進
國家圖書館國家古籍保護中心辦公室,北京 100081
本文介紹了我國古籍數字化的現(xiàn)狀,探討了以古籍保護中心為主導,以國家專項資金為保障,以互聯(lián)網為信息平臺的古籍數字化發(fā)展策略。
古籍;數字化;發(fā)展策略
ancient books;digitization;development strategy
《國家“十二五”時期文化改革發(fā)展規(guī)劃綱要》明確提出:“加強公共文化產品和服務供給。加強文化館、博物館、圖書館、美術館、科技館、紀念館、工人文化宮、青少年宮等公共文化服務設施和愛國主義教育示范基地建設并完善向社會免費開放服務。鼓勵其他國有文化單位、教育機構等開展公益性文化活動,各類公共場所要為群眾性文化活動提供便利。加快現(xiàn)代科技應用步伐,提高公共文化服務的數字化、網絡化水平。以公共圖書館、學校電子閱覽室、社區(qū)文化中心為依托,建立和完善未成年人公益性上網場所?!阎饕参幕a品和服務項目、公益性文化活動納入公共財政經常性支出預算。采取政府采購、項目補貼、定向資助、貸款貼息、稅收減免等政策措施鼓勵各類文化企業(yè)參與公共文化服務。鼓勵國家投資、資助或擁有版權的文化產品無償用于公共文化服務?!?011年10月18日中國共產黨第十七屆中央委員會第六次全體會議通過《中共中央關于深化文化體制改革推動社會主義文化大發(fā)展大繁榮若干重大問題的決定》,中央提出了建設優(yōu)秀傳統(tǒng)文化傳承體系,推進文化典籍資源數字化,廣泛開展優(yōu)秀傳統(tǒng)文化教育普及活動,加強同香港、澳門的文化交流合作,加強同臺灣的各種形式文化交流,共同弘揚中華優(yōu)秀傳統(tǒng)文化。這說明國家非常重視和大力支持古籍數字化,并依托圖書館等公共服務平臺,為社會公眾提供服務。本文根據目前古籍數字化的現(xiàn)狀,略述古籍數字化發(fā)展的策略。
古籍數字化是利用現(xiàn)代信息技術對古籍文獻進行加工處理,使其轉化為電子數據形式,并通過光盤、網絡等介質進行保存和傳播。這是一門揭示古籍文獻信息資源建設的新興學科,屬于古籍整理的研究范疇,其涉及文獻學、古籍整理、信息學、計算機科學與技術、圖書館學等多個學科,具有邊緣性、綜合性、交叉性的學科特點。要以相關各學科的知識積累為基礎,不斷充實自己的研究內容,才能保證其自身研究成果的準確性、可靠性。隨著科學技術的發(fā)展,促使電子產品日趨成熟和完善,以及公眾閱讀習慣的改變,大型電子文獻資料庫的開發(fā)和建設,近年來逐漸成為圖書館界和相關技術部門的一個熱門話題。目前正在開發(fā)的古籍數字化相關工程主要包括:
中國數字圖書館工程。國家圖書館自1995年起開始跟蹤國際上數字圖書館的研發(fā)進展。1998年,國家圖書館向文化部提出申請,由國家立項實施 “中國數字圖書館工程”,并開始了中國數字圖書館工程的籌備工作。2001年10月,“國家圖書館二期暨國家數字圖書館基礎工程”經國務院批準立項,該項目將在國家圖書館新館內建成“國家數字圖書館國家中心”。這個項目的成功立項是中國數字圖書館工程發(fā)展歷史上極為關鍵的一步。目前,該工程已被列為國家“十五”重點建設項目。目前,工程已制訂完成《中國數字圖書館工程建設一期規(guī)劃》及《中國數字圖書館工程一期規(guī)劃實施方案》;在數字資源建設方面,以圖書文獻機構的豐富館藏為依托,并結合其它文化機構的資源,累積建設了總量近10TB的數字資源,內容涉及文學、藝術、法律、科技、教育、旅游等各類信息,并依托國家圖書館館藏進行了古籍的數字化加工工作;在技術研發(fā)方面,開發(fā)完成了數字資源加工系統(tǒng)、數字圖書館應用系統(tǒng)、數字圖書館區(qū)域服務系統(tǒng)和文獻數字化工業(yè)化生產加工系統(tǒng);在知識產權解決方面進行了有益的探索,并組織開發(fā)了版權管理系統(tǒng);積極參與數字圖書館標準規(guī)范的研制工作,制訂完成了《中文元數據方案》等。
北京大學“中國基本古籍庫”光盤工程。1998年正式啟動,從傳世的大約十三萬種古籍中,篩選出具有深刻文化意義和廣闊使用價值的歷代典籍一萬余種,每種確定一個通行版本和一至三個重要版本;經過最必要和最基礎的整理,將通行版本全文錄入制成漢字光盤,將其余重要版本原版掃描附于其后;再按照現(xiàn)代科學分類,針對各學科研究和使用的需要,編制解讀和檢索系統(tǒng)。全套光盤庫共500張,分哲學、史地、藝文、綜合4個子庫20個大類。
中國歷史地理信息系統(tǒng)。由中國復旦大學歷史地理研究中心、美國哈佛大學、哈佛燕京學社、澳大利亞格林菲斯大學亞洲空間數據中心等機構合作開發(fā)。項目目標是建立中國歷史時期基礎地理信息系統(tǒng)數據庫,使其成為中國歷史GIS數據的基礎平臺。這是一個研究性、工具實用性都很強的開發(fā)項目,與單純的把古籍轉化成圖片或檢索文本的數字化不同,也顯示出另一種古籍數字化的發(fā)展方向。
中國社會科學院古籍數字化。對《全唐詩》、《先秦漢魏晉南北朝詩》、《全上古三代秦漢三國六朝文》、《十三經》、《全唐文》、《諸子集成》等,進行數字化。中國社會科學院,對全院所有古籍圖書數字化,準備五年完成。
文淵閣《四庫全書》電子版。香港的迪志公司利用自身的資金與技術優(yōu)勢,與北京書同文公司以及上海人民出版社共同研制開發(fā)了“國家九五電子出版重點項目”— —文淵閣《四庫全書》電子版,這項成果也是迄今為止世界上最大的一項中文電子出版物工程之一。
中華古籍語料庫。 中華書局2002年立項,該數據庫將中華書局古籍資源的主體部分數字化,并開發(fā)建設了“資治通鑒知識分析系統(tǒng)”,可以對通鑒全文進行關鍵字檢索,基于時間、人物、地名、事件等文本信息重組,并以圖形方式展現(xiàn)分析成果。項目即將結項。完成后,就可以推出部分數字化產品。
從以上古籍數字化項目可以看出,我國的古籍數字化產品大多由高校、商業(yè)公司或者各單位開發(fā),條塊分割、資源重復,而且大多數讀者只能使用經單位購買的數字化產品,公益性開放資源較少,我國已數字化的古籍占全部古籍的比例無疑是很低,古籍數字化水平及網絡化服務水平低,遠遠不能滿足廣大科研人員的需求。
2.1 建立以國家古籍保護中心為主導,各部門聯(lián)合發(fā)展之路
我國古籍分別藏于在不同系統(tǒng)和部門的圖書館及其它機構,分屬不同部委管理;古籍數字化建設需要各部門相互協(xié)調,相互配合,統(tǒng)一規(guī)劃,統(tǒng)一指揮,以免各自為政,重復建設、資源不能共享。2007年中華古籍保護計劃開展以來,國家古籍保護中心一直開展全國古籍普查與保護工作,各省和相關部委也成立古籍保護中心,工作開展順利。國家古籍保護中心,充分發(fā)揮協(xié)調作用,調整各部門、各單位之間的利益關系,使各信息單位在資源共享的基礎上走聯(lián)合發(fā)展之路。
2.2 制定古籍數字化整體方案
從目前古籍數字化的項目來看,沒有一個全國性的整體規(guī)劃,都是個單位立足于本部門的計劃,沒有整體性、系統(tǒng)性。國家古籍保護中心可以聯(lián)合各部委,制定古籍數字化專項方案,五至十年完成全國古籍數字化。第一年,古籍藏量大單位,首先試點,各省一個試點單位;數字化的古籍,經專家論證通過,可以數字化。第二年各省各部委,再逐步推廣,全面開展古籍數字化工作。古籍藏量小的單位,只數字化特有的古籍,其他古籍數字化資源直接共享。規(guī)范古籍數字化程序,加強古籍數字化的過程監(jiān)理,使古籍的數字化分階段、有步驟地進行。
2.3 申請專項經費,加大資金投入
資金是影響我國古籍數字建設最現(xiàn)實、最重要的因素之一,是我國古籍數字化、現(xiàn)代化的保障。古籍數字化建設還處在建設初期,需要投入系統(tǒng)研制費、維護費、技術人員和管理人員培訓費、自身數據庫建設費等等。資金需要量大,不是個人和一個部門能夠承擔的,只有政府加大投入?!吨泄仓醒腙P于深化文化體制改革推動社會主義文化大發(fā)展大繁榮若干重大問題的決定》,中央提出了建設優(yōu)秀傳統(tǒng)文化傳承體系,推進文化典籍資源數字化,說明中央支持古籍數字化,這就需要我們做好古籍數字化方案,說明資金用途和支付方式。國家古籍保護中心聯(lián)合各部委申請古籍數字化專項,??顚S?,財政部以專項資金方式,將資金調撥到各省財政廳,由省財政廳將資金劃轉到各單位。各省每年向國家古籍保護中心申報下一年度古籍數字化專項方案,國家古籍保護中心組織專家對方案進行審核。通過方案,再提交古籍保護部際聯(lián)席會議審議。審議通過后,財政部才能調撥資金。
2.4 抓住核心,制定古籍數字化標準,做好資源庫建設
古籍數字化標準研究,包括為古籍元數據、著錄規(guī)則、分類標引規(guī)則、字符編碼等,完成書目數據庫、索引數據庫、題錄數據庫、全文數據庫、知識庫等數據庫建設。實現(xiàn)文獻全文檢索,所數字化的古籍必須保留原書風貌,文字重新錄入的數字化古籍,只是內容數字化,不是真正意義上的古籍數字化,失去古籍的真實性,對古籍版本界定沒有意義?,F(xiàn)在技術可以達到既保留古籍原貌,又可以全文檢索和編輯功能,滿足不同層次公眾的需要。
2.5 完善古籍數字化服務平臺
現(xiàn)有的古籍數字化產品,是電子產品,只有少數人享有數字化成果使用權。真正數字化,是要將電子產品,利用網絡進行傳播,以便服務更多的公眾。依托互聯(lián)網、有線電視網絡、衛(wèi)星直播傳輸數字信息。不同受眾,按需索取,充分利用數字化信息。
2.6 聯(lián)合港臺和海外,實現(xiàn)數字化資源共享
港臺、歐美一些國家和大陸缺乏溝通與合作,造成許多資源的重復開發(fā),浪費了巨額人力、物力和財力。臺灣典藏數字化起于2001年,參加機構有臺灣“中央研究院”、臺灣“故宮博物院”、臺灣“歷史博物館”、臺灣大學等。1984年,臺灣的最高學術機構“中央研究院”開始了“史籍自動化計劃”,建立《廿五史》全文資料庫,作為學術研究的輔助工具。經過數年的積累和發(fā)展,現(xiàn)在全球因特網上,由臺灣地區(qū)研發(fā)的中國古典文獻資料已有數億字,而且檢索功能齊全,媒體資料多樣。香港的欒貴明先生、田奕女士以及文化傳信副主席朱邦復先生,數十年來刻苦經營,完成漢文化聯(lián)盟“漢文化資料庫”工程。文化傳信集團的“漢文化資料庫”,為全球首個電子中國古文獻資料庫。英國圖書館從1993年開始,開發(fā)英藏敦煌文獻,將敦煌文獻數字化,供讀者使用。
隨著數字技術及存儲技術的不斷完善和提高,古籍數字化將成為古籍整理和傳播的未來發(fā)展方向,它除了有利于推動學術研究的良性發(fā)展以外,在加強文化遺產保護尤其是保存古籍善本方面也有著光明的前景和難以替代的功能。
[1]葉莉.對古籍數字化進程中若干問題的思考.圖書館界,2010年4期
[2]王桂平.我國古籍數字化的現(xiàn)狀及展望.圖書情報知識,2000年第4期
[3]王立清,董梅香,肖衛(wèi)飛.港臺地區(qū)古籍數字化現(xiàn)狀分析及啟示.圖書情報工作,2006年第8期
[4] 曾莉紅.圖書館數字化建設的發(fā)展對策探討.重慶工商大學學報(社會科學版),2003年第6期
This paper introduces the present situation of ancient books digitization in our country. Discusses the ancient books protection center as the leading,national special funds for the protection ,the Internet for information platform of ancient books digitization development strategy.
10.3969/j.issn.1001-8972.2012.09.052
錢律進(1967-),女,碩士研究生,館員,古典文獻學,任職于國家圖書館國家古籍保護中心辦公室。