国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

2008-2017 年我國典籍?dāng)?shù)字化研究綜述

2019-12-16 06:14:26李林澳夏南強(qiáng)湖北中醫(yī)藥高等??茖W(xué)校圖書館華中師范大學(xué)信息管理學(xué)院
圖書館理論與實(shí)踐 2019年11期
關(guān)鍵詞:典籍古籍數(shù)據(jù)庫

李林澳,夏南強(qiáng)(.湖北中醫(yī)藥高等專科學(xué)校圖書館;.華中師范大學(xué)信息管理學(xué)院)

“典籍”指古代重要文獻(xiàn),常用泛指古代圖書,也可稱為“古籍”。中華文化源遠(yuǎn)流長,典籍文獻(xiàn)在中華知識寶庫中占據(jù)了相當(dāng)重要的位置。中文典籍文獻(xiàn)蘊(yùn)含著豐富的文化內(nèi)涵,但由于年代久遠(yuǎn),加之自然、人為損耗因素,許多珍貴典籍已經(jīng)失傳,以紙張為載體的典籍文獻(xiàn)不僅不便于使用,更不利于保存與傳承。因此,利用現(xiàn)代信息技術(shù)對其進(jìn)行加工,是提高典籍文獻(xiàn)利用率的有效措施,也是典籍保護(hù)工作的重要內(nèi)容之一。

所謂利用現(xiàn)代信息技術(shù)對典籍進(jìn)行加工,就是利用計(jì)算機(jī)技術(shù)把紙質(zhì)載體等上面的文字圖像符號轉(zhuǎn)化為計(jì)算機(jī)能識別的數(shù)字符號,并通過網(wǎng)絡(luò)、光盤等介質(zhì)進(jìn)行傳遞、保存、利用的數(shù)字化過程。中國的古籍?dāng)?shù)字化工作始于20 世紀(jì)80 年代初,當(dāng)時稱為“計(jì)算機(jī)化”或“電子化”。古籍?dāng)?shù)字化在中國的真正發(fā)展是20 世紀(jì)90 年代中期以后的事情。[1]1997 年,劉煒首次正式提出了“古籍?dāng)?shù)字化”這一術(shù)語概念。[2]自此之后,關(guān)于古籍?dāng)?shù)字化的研究才日益增多。李運(yùn)富將古籍?dāng)?shù)字化定義為:“利用現(xiàn)代信息技術(shù),將歷來以抄寫本、刻鑄本、雕版、活字版、套版及鉛字印刷等方式所呈現(xiàn)的古代文獻(xiàn),轉(zhuǎn)化為電子媒體的形式?!保?]在此基礎(chǔ)上,喬紅霞[4]、劉琳[5]、毛建軍[6]等進(jìn)行了補(bǔ)充論說。其中,毛建軍認(rèn)為,古籍?dāng)?shù)字化是以利用和保護(hù)古籍文獻(xiàn)為目的的,其數(shù)字化過程應(yīng)包括加工對象、加工工具、著錄標(biāo)準(zhǔn)、實(shí)施者和協(xié)調(diào)管理者五個要素。[6]根據(jù)不同的標(biāo)準(zhǔn),曹天曉對古籍?dāng)?shù)字化的成果進(jìn)行了分類,按使用平臺的不同分為電腦端和移動端;按網(wǎng)絡(luò)的使用情況分為離線型與在線型;按呈現(xiàn)方式的不同分為古籍電子書和古籍?dāng)?shù)據(jù)庫。[7]

雖然近年來對于典籍?dāng)?shù)字化的研究已引起學(xué)界的重視,但仍有許多有待深入探究的領(lǐng)域需要挖掘。本文對中國知網(wǎng)上2008-2017 年有關(guān)典籍?dāng)?shù)字化研究的文獻(xiàn)進(jìn)行了梳理,歸納介紹了典籍?dāng)?shù)字化的研究現(xiàn)狀,以期為進(jìn)一步的深入探究提供參考與借鑒。

1 研究數(shù)據(jù)的來源

為了解我國典籍?dāng)?shù)字化研究概況,本文選取了中國知網(wǎng)(CNKI)為數(shù)據(jù)來源,采取高級檢索方式,發(fā)表時間限定于2008 年1 月1 日-2017 年12 月31 日,以“典籍* 數(shù)字化”“古籍* 數(shù)字化”“古籍* 數(shù)據(jù)庫”為檢索詞進(jìn)行初步檢索,檢索時間為2018 年3月30 日,共檢索出1,122 條記錄。按學(xué)科分布,圖書情報(bào)方面共有論文864 篇,占比68.35%,其次是計(jì)算機(jī)軟件及計(jì)算機(jī)應(yīng)用(115 篇) 和中醫(yī)學(xué)研究(90篇)方面的論文。此外,還有一些出版研究、中國語言文字研究等方面的相關(guān)論文。

2 研究數(shù)據(jù)的統(tǒng)計(jì)與分析

2.1 文獻(xiàn)數(shù)量及分布

研究領(lǐng)域內(nèi)文獻(xiàn)數(shù)量的增長在一定程度上能反映該領(lǐng)域知識量的增長,因此科學(xué)文獻(xiàn)的數(shù)量是衡量科學(xué)知識量的重要尺度之一。[8]分析近十年來有關(guān)典籍?dāng)?shù)字化的論文數(shù)量,可以大致了解該研究熱點(diǎn)在我國學(xué)術(shù)界的研究發(fā)展進(jìn)度與未來趨勢。

圖 文獻(xiàn)年度分布趨勢

上圖是2008-2017 年關(guān)于典籍?dāng)?shù)字化研究文獻(xiàn)的年度趨勢分布圖。從圖中我們可以看出,2008-2012年文獻(xiàn)數(shù)量呈上升趨勢且年均增幅15 篇以上,發(fā)展迅速,可以看出典籍?dāng)?shù)字化的相關(guān)研究呈上升趨勢。2012 年后研究整體趨于平穩(wěn)。發(fā)文數(shù)量最多的年份是2012 年(131 篇),其次是2016 年(127 篇)。2010 年至今,發(fā)文數(shù)量均穩(wěn)定在100 篇以上,年均量達(dá)112.2 篇。以上數(shù)據(jù)表明,我國學(xué)術(shù)界重視典籍?dāng)?shù)字化的研究,雖然其不是研究熱點(diǎn),但有較穩(wěn)定的研究隊(duì)伍和研究成果。

2.2 文獻(xiàn)期刊分布

論文在期刊上的分布,也能一定程度上反應(yīng)該領(lǐng)域的學(xué)術(shù)發(fā)展水平。通過分析文獻(xiàn)的期刊來源,可以確定該領(lǐng)域內(nèi)的重點(diǎn)期刊以及學(xué)術(shù)取向,也能為相關(guān)文獻(xiàn)的搜集與管理提供可靠的依據(jù)。表1 為刊載論文大于等于8 篇的論文期刊分布。

從表1 可知,刊載典籍?dāng)?shù)字化方面的論文,檔案學(xué)領(lǐng)域的核心期刊《蘭臺世界》發(fā)文量最多,高達(dá)31篇,占總數(shù)的6%。其次是《圖書館學(xué)研究》《圖書館理論與實(shí)踐》《圖書館學(xué)刊》,分別為28 篇、27 篇和26 篇。這三種期刊是圖書情報(bào)類的核心期刊,占發(fā)文總數(shù)的17%。在多種類型的期刊中,圖書情報(bào)和檔案類最多,約占發(fā)文總數(shù)的77%左右。

表1 論文期刊分布統(tǒng)計(jì)

需要注意的是,發(fā)文量并不能成為評判某領(lǐng)域內(nèi)期刊是否重要的唯一標(biāo)準(zhǔn)。以本次分析中發(fā)文量最高的《蘭臺世界》 為例,它是檔案期刊中唯一的半月刊,每期載文量50-80 篇不等,其年總載文量較多,因此在排名中位居第一,也在情理之中。因此在確定重點(diǎn)期刊時,載文量只能作為一個方面的參考因素。

2.3 文獻(xiàn)被引頻次

評判一篇論文的學(xué)術(shù)影響力,可結(jié)合其刊載期刊登記、獲獎情況、轉(zhuǎn)載引用頻次等多重因素進(jìn)行考慮。但一般情況下,我們可以通過被引頻次的高低來對該論文的學(xué)術(shù)影響力進(jìn)行評價。與此同時,我們需要注意被引頻次的滯后性,即論文從刊載到被引,會經(jīng)歷一個較為漫長的時間跨度。表2 為2008-2017 年典籍?dāng)?shù)字化文獻(xiàn)排名前五的被引頻次。

表2 文獻(xiàn)被引頻次

從表2 可知,被引頻次最高的為趙東于2014 年撰寫的博士論文,在3 年時間內(nèi)被引頻次高達(dá)53 次。其次是劉家真和程萬高的《古籍保護(hù)與開發(fā)的策略與建議》 一文,被引37 次。上述論文起到了一定的理論參考與指引作用,引起了學(xué)術(shù)界對典籍?dāng)?shù)字化資源保護(hù)與開發(fā)利用問題的探討與研究。但縱觀整體情況,仍有將近一半的文章從來未被引用,且被引文章中大部分僅被引一次,說明目前典籍?dāng)?shù)字化的研究相對屬于“冷門”研究領(lǐng)域,重視程度不夠,缺少影響力較強(qiáng)的學(xué)者群體。

3 我國典籍?dāng)?shù)字化主題熱點(diǎn)分析

3.1 典籍?dāng)?shù)字化保護(hù)

結(jié)合國家古籍保護(hù)政策對古籍進(jìn)行數(shù)字化保護(hù)與開發(fā)利用,近年來受到研究者越來越多的關(guān)注。張利認(rèn)為,古籍?dāng)?shù)字化載體產(chǎn)品能延續(xù)古代文獻(xiàn)典籍的保存。古代文獻(xiàn)載體形式經(jīng)歷了從甲骨、青銅到最為普遍的紙質(zhì)的變遷,雖然紙質(zhì)易于獲取,但難以長久保存,而數(shù)字化則正是有效保護(hù)古籍文獻(xiàn)的手段。[9]郭春鳳針對古籍?dāng)?shù)字化保護(hù)平臺的構(gòu)建提出了自己的思路。她認(rèn)為在數(shù)字時代下,古籍的保護(hù)應(yīng)遵循系統(tǒng)整體科學(xué)性、針對性、安全性、通用性和標(biāo)準(zhǔn)化的原則,在構(gòu)建數(shù)字化保護(hù)平臺時應(yīng)注重檢索平臺和交互服務(wù)平臺的建立,強(qiáng)調(diào)信息檢索平臺要提供全方位的檢索服務(wù),整合古籍網(wǎng)絡(luò)資源;而交互服務(wù)平臺則要體現(xiàn)個性化服務(wù),主動推送信息,在古籍研究中使用交互工具來進(jìn)行用戶咨詢與培訓(xùn)教育。[10]湯印華認(rèn)為,古籍修復(fù)信息數(shù)字化建設(shè)不僅能更好地記錄、管理、推廣優(yōu)秀修復(fù)技術(shù)與原則,更能規(guī)范化修復(fù)工作,使其向科學(xué)邁進(jìn),促進(jìn)文獻(xiàn)的保護(hù)與交流,進(jìn)而實(shí)現(xiàn)古籍?dāng)?shù)字資源共建與共享。[11]

除此之外,紅外線傳感裝置、交感技術(shù)等先進(jìn)科技手段應(yīng)用到各館藏機(jī)構(gòu)中,也更能保證珍貴古籍的安全。[12]上海圖書館的家譜數(shù)字化資源建設(shè)和服務(wù)是古籍資源保護(hù)的顯著成效之一。從整理未編家譜到全文數(shù)字化家譜正式開放使用,上海圖書館經(jīng)歷了一段漫長的摸索過程,但自2006 年投入使用后,利用電腦閱讀家譜呈增長趨勢,家譜數(shù)字化對圖書館的服務(wù)方式和文獻(xiàn)的利用方式均帶來了一系列可喜的變化。由此可見,古籍?dāng)?shù)字化有利于古籍的保護(hù)和修復(fù),降低紙質(zhì)古籍的流通量,從而減少人為損壞。[13]

在少數(shù)民族古籍?dāng)?shù)字化保護(hù)方面,韓晶從古籍文獻(xiàn)現(xiàn)狀、古籍文獻(xiàn)保護(hù)方式、數(shù)字化文獻(xiàn)保護(hù)方式與進(jìn)展、數(shù)字化資源的開放獲取以及云端存儲和保護(hù)等五個方面介紹了新疆古籍文獻(xiàn)資源的數(shù)字化保護(hù)情況。[14]高建輝指出,彝文古籍?dāng)?shù)字化保護(hù)目前面臨著對數(shù)字化的認(rèn)識不足、資源分散、收集整理困難、數(shù)字化預(yù)處理難度大、專業(yè)型復(fù)合人才和知識產(chǎn)權(quán)保護(hù)手段匱乏等問題。[15]他針對彝文古籍的特點(diǎn)及保存現(xiàn)狀,設(shè)計(jì)出了具體的彝文古籍?dāng)?shù)字化保護(hù)步驟。同時他還針對彝文古籍知識產(chǎn)權(quán)的保護(hù)提出了見解,建議利用水印、PKI 體系等先進(jìn)技術(shù)追蹤版權(quán)歸屬信息,同時推動相關(guān)法律法規(guī)的建立。[16]

3.2 典籍?dāng)?shù)字化標(biāo)準(zhǔn)體系建設(shè)

典籍?dāng)?shù)字化的標(biāo)準(zhǔn)指在數(shù)字化過程中以達(dá)到最佳有序化程度為目的,共同遵守的準(zhǔn)則和依據(jù)。由于存儲格式眾多、檢索平臺各異、方式千差萬別,制定切實(shí)可行的數(shù)字化標(biāo)準(zhǔn)非常必要。姚俊元從概念的認(rèn)識、存儲的格式、工作宗旨、數(shù)據(jù)形式、方式標(biāo)準(zhǔn)和漢字的編碼等方面探討建立標(biāo)準(zhǔn)化的體系。[17]張文亮認(rèn)為,應(yīng)當(dāng)制定相應(yīng)的合作標(biāo)準(zhǔn),避免重復(fù)數(shù)字化現(xiàn)象的進(jìn)一步惡化,要采用相互兼容的文件格式,統(tǒng)一字符處理標(biāo)準(zhǔn),制定專門的數(shù)據(jù)加工標(biāo)準(zhǔn)和數(shù)據(jù)庫檢索標(biāo)準(zhǔn),規(guī)范資源的分類與管理。他還提到,目前我國古籍?dāng)?shù)字化標(biāo)準(zhǔn)體系主要由技術(shù)標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)和工作標(biāo)準(zhǔn)構(gòu)成,尚未涉及管理標(biāo)準(zhǔn)和工作標(biāo)準(zhǔn)方面,也沒有與國際接軌的通用合作標(biāo)準(zhǔn)。因此,他結(jié)合生命化周期理論,對古籍?dāng)?shù)字化的全過程進(jìn)行了分析探討,構(gòu)建出了適合我國國情的古籍?dāng)?shù)字化標(biāo)準(zhǔn)體系框架:項(xiàng)目規(guī)劃標(biāo)準(zhǔn)、古籍版本選擇標(biāo)準(zhǔn)、古籍?dāng)?shù)字資源生產(chǎn)標(biāo)準(zhǔn)、古籍?dāng)?shù)字資源保存標(biāo)準(zhǔn)、古籍?dāng)?shù)字資源發(fā)布標(biāo)準(zhǔn),與古籍?dāng)?shù)字化生命周期的各個環(huán)節(jié)相對應(yīng)。[18-21]

為了順應(yīng)數(shù)字化可持續(xù)發(fā)展的需要,葛懷東提出了典籍?dāng)?shù)字化標(biāo)準(zhǔn)體系的構(gòu)建原則,即開放性、系統(tǒng)性、實(shí)用性和拓展性。[22]李小平等以此為基礎(chǔ),提出了適用于醫(yī)藥方面的醫(yī)藥古籍文獻(xiàn)數(shù)字化標(biāo)準(zhǔn)體系。[23]基于西北地區(qū)的特色歷史文化,王海花介紹了西北古籍文獻(xiàn)的收集與利用現(xiàn)狀,認(rèn)為理想的數(shù)字化標(biāo)準(zhǔn)應(yīng)當(dāng)能提供文本與原版古籍對照功能,正常顯示生僻字。[24]

3.3 典籍?dāng)?shù)據(jù)庫建設(shè)

關(guān)于典籍?dāng)?shù)據(jù)庫的研究,王雁行認(rèn)為,應(yīng)當(dāng)以“中華古籍保護(hù)計(jì)劃”為依托,統(tǒng)籌規(guī)劃,在全國范圍內(nèi)組織建設(shè)國家古籍資源數(shù)據(jù)庫,保障國家文化安全,促進(jìn)中華優(yōu)秀傳統(tǒng)文化的繼承與弘揚(yáng)。[25]劉聰明認(rèn)為,未來的古籍全文數(shù)據(jù)庫應(yīng)當(dāng)至少能具備智能轉(zhuǎn)換功能,能準(zhǔn)確的定位檢索結(jié)果,主動支持智能化研究??梢酝ㄟ^建立簡、繁、異體字對照表,建立分類導(dǎo)航來達(dá)到這個目標(biāo)。[26]為了更為直觀地了解古籍?dāng)?shù)據(jù)庫的標(biāo)準(zhǔn),毛建軍選取了上海圖書館古籍書目查詢數(shù)據(jù)庫、學(xué)苑汲古——高校古文獻(xiàn)資源庫、國家圖書館古籍善本查詢數(shù)據(jù)庫和(臺灣)中文古籍書目數(shù)據(jù)庫這四個大型數(shù)據(jù)庫進(jìn)行比較,提出機(jī)讀目錄格式、古籍著錄規(guī)則、古籍分類法、主題標(biāo)引、統(tǒng)一字庫的5 個建設(shè)標(biāo)準(zhǔn)。他還調(diào)查和分析了國內(nèi)外甲骨文全文數(shù)據(jù)庫的建設(shè)情況,指出目前最迫切的任務(wù)是做好甲骨文資源整合工作。[27,28]林紅狀詳細(xì)介紹了南開大學(xué)圖書館家譜數(shù)據(jù)庫的構(gòu)建流程,指出該舉措不僅能發(fā)揮大學(xué)圖書館的教育職能,還能提高自身數(shù)字化服務(wù)能力,加強(qiáng)古籍特色數(shù)據(jù)庫的聯(lián)合共建。[29]王莉分析了湖北省方志數(shù)據(jù)庫的建設(shè)模式和內(nèi)容設(shè)置,并詳細(xì)展示了數(shù)據(jù)庫的建設(shè)流程,指出在方志數(shù)據(jù)庫建設(shè)中應(yīng)當(dāng)注重使用頁面的友好性。[30]

隨著信息技術(shù)的高速發(fā)展,典籍?dāng)?shù)據(jù)庫知識產(chǎn)權(quán)的問題日益突出。毛建軍從自建數(shù)據(jù)庫的著作權(quán)、購買數(shù)據(jù)庫的著作權(quán)、數(shù)字資源導(dǎo)航的著作權(quán)和信息資源共建共享的角度對高校數(shù)據(jù)庫進(jìn)行了深入探討。[31]楊思洛等對微信平臺和手機(jī)客戶端進(jìn)行了調(diào)研,分析其運(yùn)行模式和主要功能,指出當(dāng)今古籍?dāng)?shù)據(jù)庫的移動應(yīng)用內(nèi)容較為單一,無法吸引大量用戶關(guān)注,還需從檢索功能和閱讀體驗(yàn)等方面進(jìn)一步完善平臺建設(shè)。[32]

3.4 中醫(yī)藥典籍?dāng)?shù)字化

中醫(yī)藥古籍是中華民族幾千年來的珍貴智慧結(jié)晶,其養(yǎng)生保健知識、理法方藥等都具有極高的使用價值,是現(xiàn)代中醫(yī)學(xué)術(shù)創(chuàng)新與進(jìn)步的根基。陳素美認(rèn)為,出于保護(hù)中醫(yī)古籍的需要,尤其是已經(jīng)破損的孤本、善本,利用數(shù)字化技術(shù)盡快恢復(fù)和還原其本來面貌刻不容緩。中醫(yī)古籍?dāng)?shù)字化也能進(jìn)一步的傳播中醫(yī)信息,構(gòu)建中醫(yī)知識庫。[33]程新論述了中醫(yī)藥古籍?dāng)?shù)字化過程中應(yīng)遵循的9 個原則。除保真原則、整理原則、標(biāo)準(zhǔn)化原則、共建共享原則等較為常見的原則外,還需遵循保護(hù)與利用相結(jié)合原則、統(tǒng)一規(guī)劃與分步實(shí)施原則、可持續(xù)發(fā)展原則、圖文對照原則和技術(shù)服務(wù)于內(nèi)容原則。[34]對中醫(yī)藥古籍進(jìn)行校對也是一項(xiàng)基礎(chǔ)性工作,關(guān)系到整個數(shù)字化成果的質(zhì)量。陳曉迪提出,數(shù)字媒體形式的書目數(shù)據(jù)庫或全文數(shù)據(jù)庫能大幅度的提高點(diǎn)校效率,尤其是在對校法、本校法及他校法的使用中,中醫(yī)古籍的數(shù)字化能比其他形式的古籍?dāng)?shù)字化更快捷深入。[35]劉毅則倡導(dǎo)利用現(xiàn)代計(jì)算機(jī)技術(shù),深入挖掘中醫(yī)藥古籍中的知識,改變重藏輕用的傳統(tǒng)觀念,強(qiáng)化知識深層次開發(fā),培養(yǎng)中醫(yī)古籍管理復(fù)合人才。[36]

李小平等介紹了醫(yī)藥文獻(xiàn)數(shù)字化的發(fā)展歷程,提出要尋求技術(shù)突破、全面統(tǒng)籌規(guī)劃、完善專業(yè)人才隊(duì)伍建設(shè)、結(jié)合需求結(jié)構(gòu)和用戶信息行為分層次地開發(fā)的總體建設(shè)思路。[37]吳桂英則列舉了書目著錄、檢索限制、版權(quán)保護(hù)等方面存在的障礙,認(rèn)為要建立專業(yè)的醫(yī)藥文獻(xiàn)數(shù)字化人才隊(duì)伍,加強(qiáng)對數(shù)據(jù)庫的檢索功能建設(shè)。[38]

目前許多科研機(jī)構(gòu)和高校圖書館已認(rèn)識到了中醫(yī)古籍?dāng)?shù)字化的重要性。藍(lán)韶清等人則從基于信息構(gòu)建的角度構(gòu)建了中醫(yī)藥數(shù)字化系統(tǒng),他認(rèn)為信息構(gòu)建的核心要素包括信息組織系統(tǒng)、標(biāo)識系統(tǒng)、導(dǎo)航系統(tǒng)和搜索系統(tǒng),而這也正是中醫(yī)藥數(shù)字系統(tǒng)需要研究的核心部分。[39]裴麗和曹霞指出中醫(yī)古籍?dāng)?shù)字化多功能閱讀環(huán)境必須具備個性化信息檢索系統(tǒng)、基于超文本鏈接的閱讀環(huán)境和輔助研究支持功能平臺。她們認(rèn)為,中醫(yī)藥古籍?dāng)?shù)字化平臺不應(yīng)當(dāng)只是一個用戶查找信息的平臺,而更應(yīng)是中醫(yī)古籍整理、研究、交流的平臺。[40]

3.5 民族典籍和地方志的數(shù)字化

少數(shù)民族的古籍文獻(xiàn)是少數(shù)民族文明成果的重要表現(xiàn)成果之一,目前,在數(shù)字化過程中,藏文、蒙古文、彝文等少數(shù)民族文字的字符輸入法技術(shù)、識別技術(shù)等已有初步進(jìn)展,但仍不完善,不利于傳統(tǒng)文化的傳承。朱宗曉、何紅一等人提出在少數(shù)民族古籍?dāng)?shù)字化傳播中,利用載體還原、場景重現(xiàn)、文化傳承這三個循序漸進(jìn)的傳播策略。[41]貴州省是一個少數(shù)民族世居的省市,各民族古籍文獻(xiàn)載體的形式也豐富多彩。有文獻(xiàn)類、文書類、口傳類、金石銘刻類等。陳世莉提出對于有文字類的典籍文獻(xiàn),可以進(jìn)行收集、修復(fù)、整理、編目、分類、掃描、影印、建庫的步驟來擴(kuò)大民族利用范圍,而無文字類的古籍(如口傳詩歌、民間故事等)則可以通過采訪民族民間藝人、錄音錄像、田野調(diào)查等方法來全方位采集文獻(xiàn),建立音像資料數(shù)據(jù)庫。[42]蘇日娜介紹了蒙古文古籍文獻(xiàn)的收藏情況,指出目前蒙古文古籍具有文獻(xiàn)收藏地分散、損毀情況惡劣、利用困難等特點(diǎn),強(qiáng)調(diào)了加快建設(shè)蒙古文古籍文獻(xiàn)數(shù)字化共建共享系統(tǒng)的必要性和緊迫性。[43]

地方志是中國典籍的重要組成部分,但目前我國古舊方志存在底數(shù)不清的問題,管理與利用都不能達(dá)到需求。陳紅彥認(rèn)為,除了進(jìn)一步展開地方志資源普查,為后續(xù)利用打下基礎(chǔ)外,還應(yīng)在共建共享基礎(chǔ)上開展數(shù)字化建設(shè),統(tǒng)一規(guī)劃,統(tǒng)一平臺發(fā)布,分步驟實(shí)現(xiàn)資源數(shù)字化。[44]胡以濤揭示了南京農(nóng)業(yè)大學(xué)抄寫本地方志古籍?dāng)?shù)字化的整理過程,摸索出了一套優(yōu)化升級的改進(jìn)版圖文對照模式,以期獲得更大的效益。[45]

3.6 典籍?dāng)?shù)字化特殊技術(shù)應(yīng)用

楊賢林對古籍整理中常用的文本挖掘、GIS、文本可視化和語料庫數(shù)字化技術(shù)作了介紹。[46]吳茗以北京大學(xué)數(shù)字圖書館古文獻(xiàn)資源庫的時空檢索和復(fù)旦大學(xué)歷史地理研究中心的CHGIS 為例,闡述了GIS 技術(shù)的應(yīng)用。認(rèn)為要想讓技術(shù)日臻成熟,就得加深對元數(shù)據(jù)的研究,同時對時空信息進(jìn)行采集,建立相關(guān)的時空數(shù)據(jù)庫,組織統(tǒng)一的時空描述參考框架,這是在古籍資源建設(shè)中利用GIS 技術(shù)進(jìn)行共享和分析的基礎(chǔ)支撐。[47]熊靜對古籍元數(shù)據(jù)的定義和范圍進(jìn)行了界定,比較了MARC 格式和基于DC 的元數(shù)據(jù)標(biāo)準(zhǔn)后,認(rèn)為DC 元數(shù)據(jù)無論是在信息對象描述能力和完整性上,還是對數(shù)字化的適應(yīng)性和格式可拓展性上,都更強(qiáng)于MARC 格式。[48]

黃鑫海列舉了常用的均值濾波算法、中值濾波算法和小波變換算法的優(yōu)缺點(diǎn),并選用《本草綱目》第一頁作為實(shí)驗(yàn)樣本,得出在處理古籍圖片時,可以使用APG 算法優(yōu)化噪點(diǎn)圖片這一結(jié)論。[49]肖禹概述了動態(tài)組字的發(fā)展過程,探討了古籍?dāng)?shù)字化對漢字編碼的需求,著重論述了動態(tài)組字在集外字描述、集外字管理和集外字顯示上的應(yīng)用。[50]另外,他結(jié)合中華珍貴古籍?dāng)?shù)字資源庫建設(shè)和《古籍?dāng)?shù)字化工作手冊》(試用本),從設(shè)備與環(huán)境、設(shè)備校正和圖像校色三個出發(fā)點(diǎn)分析了色彩管理技術(shù)的應(yīng)用。[51]

3.7 其他方面的研究

除了上述主題之外,在檢索到的文獻(xiàn)中還有一部分文章主題新穎,從不同方面對典籍?dāng)?shù)字化進(jìn)行了研究。

文學(xué)經(jīng)典是中文古籍中不可或缺的一部分。錢智勇以《楚辭》的數(shù)字化為例,將楚辭的數(shù)字化分為載體外觀數(shù)字化、相關(guān)古籍背景資料數(shù)字化和相關(guān)古籍內(nèi)容數(shù)字化三個層次,抽取主要概念對楚辭文獻(xiàn)本體進(jìn)行建模,根據(jù)本體建立對象屬性并建立了28 個關(guān)聯(lián),最終實(shí)現(xiàn)了基于楚辭的可視化關(guān)聯(lián)檢索。[52]趙新以《儒藏》精華編的數(shù)字化為例,認(rèn)為古籍?dāng)?shù)字化應(yīng)以學(xué)術(shù)研究為優(yōu)先取向,讓技術(shù)系統(tǒng)設(shè)計(jì)轉(zhuǎn)移到研究者本位上來。至于文化普及工作方面也需要數(shù)字技術(shù)的進(jìn)步,讓讀者也能參與其中。[53]在佛教文獻(xiàn)數(shù)字化研究方面,方廣锠分析了佛教文獻(xiàn)整理工作模式,認(rèn)為應(yīng)當(dāng)在提供整理本的同時一并提供原始數(shù)據(jù),這樣才能降低對佛教文獻(xiàn)整理成果評價的盲目性。他指出,漢文佛教文獻(xiàn)數(shù)字化總庫的建設(shè)應(yīng)遵守起于最底層、信息全覆蓋、過程可追溯、功能可擴(kuò)展四項(xiàng)基本原則,以整理而非編纂全部漢文佛教文獻(xiàn)為目標(biāo)建設(shè)漢文佛教文獻(xiàn)數(shù)字化總庫。[54]

我國數(shù)字化主體類型的多元性決定了公益性的古籍?dāng)?shù)字化和商業(yè)性的古籍?dāng)?shù)字化應(yīng)有不同的控制與管理模式。公益性古籍?dāng)?shù)字化的國家控制與管理模式可采用選題控制模式和成本效益評估模式;商業(yè)性的可以采用市場調(diào)節(jié)控制模式,通過市場這只“看不見的手”間接的進(jìn)行管理與控制。[55]郜麗紅認(rèn)為制定典籍?dāng)?shù)字化國家宏觀政策有利于國家對古籍信息資源進(jìn)行宏觀規(guī)劃和管理,促進(jìn)資源共享。數(shù)字化宏觀政策體系的內(nèi)容應(yīng)該包括信息選擇、采集、統(tǒng)一標(biāo)準(zhǔn)、資金及人才政策等方面。[56]

陳得媛分析了古籍?dāng)?shù)字化工作中的亂象,認(rèn)為構(gòu)建協(xié)調(diào)機(jī)制勢在必行。成立古籍?dāng)?shù)字化業(yè)界聯(lián)盟,統(tǒng)籌協(xié)調(diào)各方面的利益關(guān)系以解決版權(quán)之爭。[57]

古籍文獻(xiàn)數(shù)字化的人文意義在于它關(guān)系到敬畏圖書館制度、維護(hù)圖書館權(quán)利、對弱勢群體關(guān)懷及堅(jiān)持圖書館職業(yè)精神等諸多方面。涂湘波認(rèn)為典籍?dāng)?shù)字化的過程體現(xiàn)了信息技術(shù)和人文精神的融合,人文精神需要信息技術(shù)的支撐,信息技術(shù)的發(fā)展更需要關(guān)注人文因素,要克服“重技術(shù),輕人文”的思想弊端,時刻體現(xiàn)圖書館的人文精神。[58]

4 結(jié)語

近十年來我國典籍?dāng)?shù)字化在不斷的摸索研究中獲得了許多優(yōu)秀成果,本文通過對近十年典籍?dāng)?shù)字化領(lǐng)域論文的梳理,發(fā)現(xiàn)研究中也存在一些不足之處。

(1)國外經(jīng)驗(yàn)的參考借鑒較少。在檢索到的文獻(xiàn)中,只有寥寥幾篇文章介紹了日本、英國以及美國的古籍?dāng)?shù)字化概況。雖然中文文本數(shù)字化有其特殊性與復(fù)雜性,外國文本抽取技術(shù)對我國參考意義不大,但外國的標(biāo)準(zhǔn)體系建設(shè)、數(shù)字化指導(dǎo)方針等方面值得我國借鑒學(xué)習(xí)。[59,60]我國的典籍?dāng)?shù)字化研究,可以大力開展國際間合作,參考國外的實(shí)踐和理論方法,創(chuàng)建國際信息交流平臺,建立全球性的古籍?dāng)?shù)字化合作模式,提升典籍?dāng)?shù)字化共享水平,共同促進(jìn)中國典籍的數(shù)字化保護(hù)與利用。

(2)對典籍?dāng)?shù)字化進(jìn)行研究的學(xué)者,超過一半以上來自于圖書情報(bào)領(lǐng)域,而典籍?dāng)?shù)字化的工作涵蓋了包括計(jì)算機(jī)學(xué)、中醫(yī)藥學(xué)、中國古典文學(xué)、中國歷史、語言學(xué)、宗教學(xué)等不同學(xué)科方面的知識,需要綜合運(yùn)用不同學(xué)科知識進(jìn)行研究,僅從單一學(xué)科出發(fā)進(jìn)行研究很難實(shí)現(xiàn)新的突破??鐚W(xué)科專家學(xué)者合作,融合不同學(xué)科知識,為典籍?dāng)?shù)字化的研究提供不同的知識養(yǎng)分,充分利用計(jì)算機(jī)技術(shù)等其他學(xué)科方法,可以推動典籍?dāng)?shù)字化研究和實(shí)踐的發(fā)展。

(3) 我國典籍?dāng)?shù)字化迄今仍未建立統(tǒng)一的標(biāo)準(zhǔn)。雖然諸多學(xué)者都對此進(jìn)行了探討,強(qiáng)調(diào)了建立統(tǒng)一數(shù)字化標(biāo)準(zhǔn)的必要性,但關(guān)于標(biāo)準(zhǔn)的建立眾說紛紜,沒有形成共識。學(xué)術(shù)界可以以建立統(tǒng)一的數(shù)字化標(biāo)準(zhǔn)為重點(diǎn),深入研究并達(dá)成共識,擬定準(zhǔn)則并通過實(shí)踐來驗(yàn)證其可行性,逐步向規(guī)范體系發(fā)展,進(jìn)一步促進(jìn)典籍?dāng)?shù)字化資源的共建共享研究。

猜你喜歡
典籍古籍數(shù)據(jù)庫
中醫(yī)古籍“疒”部俗字考辨舉隅
《典籍里的中國》為什么火?
金橋(2021年4期)2021-05-21 08:19:24
關(guān)于版本學(xué)的問答——《古籍善本》修訂重版說明
天一閣文叢(2020年0期)2020-11-05 08:28:06
關(guān)于古籍保護(hù)人才培養(yǎng)的若干思考
天一閣文叢(2018年0期)2018-11-29 07:48:08
我是古籍修復(fù)師
金橋(2017年5期)2017-07-05 08:14:41
在詩詞典籍中賞春日盛景
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
长宁区| 新安县| 澄城县| 阳新县| 通辽市| 四平市| 同仁县| 泾川县| 汉沽区| 文山县| 鹤山市| 顺义区| 远安县| 新源县| 化隆| 库伦旗| 广西| 浮山县| 龙江县| 准格尔旗| 伊川县| 象山县| 集贤县| 渭南市| 公主岭市| 石林| 广宁县| 怀来县| 高陵县| 阿克陶县| 木兰县| 潮州市| 民和| 农安县| 上林县| 台东县| 胶州市| 察隅县| 闻喜县| 丽水市| 绥棱县|