国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于TPI的特色數(shù)據(jù)庫建設(shè)探索——以民國文獻數(shù)據(jù)庫為例

2012-02-15 13:39
圖書館學刊 2012年8期
關(guān)鍵詞:標引文獻數(shù)據(jù)庫民國

(遼寧省圖書館,遼寧 沈陽 110015)

郭 男,1981年生。本科學歷,館員。

民國元年(1911年)至民國38年(1949年)是從清王朝到中華人民共和國成立之間的一個歷史時期,它經(jīng)歷了辛亥革命、五四運動、北伐戰(zhàn)爭、抗日戰(zhàn)爭和解放戰(zhàn)爭,是中國社會發(fā)生深刻變革的歷史時期,圖書報刊等文獻資料作為重要的傳播手段,在這一變革中發(fā)揮了重要作用。民國文獻即指1911年辛亥革命到1949年9月期間我國出版發(fā)行的中文文獻。這些文獻從不同側(cè)面反映了民國時期的政治軍事、社會經(jīng)濟、教育科學、歷史文化、文學藝術(shù)等多方面的內(nèi)容,既具有重要的史料價值,也具有很高的研究利用價值。

1 建設(shè)民國文獻數(shù)據(jù)庫的意義

1.1 保護珍貴文獻的需要

民國文獻的年代雖距今并不久遠,但卻是館藏所有文獻中很不易保存、損壞情況非常嚴重的。由于當時機械造紙工藝落后,造紙材料混雜,使用酸性化學漿紙,使得紙張的酸性強、質(zhì)量差、保存期短。據(jù)2004年國家圖書館完成的“館藏紙質(zhì)文獻酸性和保存現(xiàn)狀的調(diào)查與分析”課題顯示,國家圖書館收藏的民國文獻老化、損毀現(xiàn)象相當嚴重,這些紙張的酸堿度平均值低于4.5。遼寧省圖書館也同樣存在這一情況,民國圖書普遍紙張發(fā)黃發(fā)脆掉渣,讀者每翻閱一次都加大了其損壞的程度。據(jù)國內(nèi)一些專家研究,民國時期普通報紙的保存壽命一般為50至100年,民國時期圖書的保存壽命為100至200年,也就說,現(xiàn)存的民國文獻大都已經(jīng)達到或接近保存壽命,如果任由其發(fā)展下去,收藏于館內(nèi)的民國文獻很有可能在50年至100年間消失殆盡。如何有效保護民國文獻,延長其存世壽命,同時又能方便讀者使用,解決保存與利用的矛盾,這是所有收藏有民國文獻的圖書館所面臨的一個重大問題。而對民國文獻進行數(shù)字化處理,建立民國文獻全文圖片數(shù)據(jù)庫,是一個最佳選擇。所有民國文獻進行數(shù)字化加工后,讀者可上網(wǎng)瀏覽,而不必翻閱原件,原件可以在適合的環(huán)境中保存,這樣就能使民國文獻得到有效的保護。

1.2 民國文獻數(shù)據(jù)庫的建設(shè)有利于豐富圖書館資源,便于讀者使用

遼寧省圖書館所保存的民國文獻為讀者研究中國現(xiàn)代史提供了豐富的原始資料,然而繁瑣的借閱手續(xù)、損毀的圖書,以及民國圖書不能復印等等不利條件,都給讀者查閱民國文獻制造了不小的障礙,影響了讀者的使用,而建立民國文獻數(shù)據(jù)庫就能很好地解決這一問題。讀者只需有一臺連通互聯(lián)網(wǎng)的計算機,就能隨時隨地上網(wǎng)查詢。讀者可通過書名、著者、主題詞檢索等途徑進行檢索,方便又快捷,并且不受限制,一次可供多人查詢,極大地滿足了讀者的需求。同時民國文獻專題數(shù)據(jù)庫的建立也極大地豐富、充實了本館的數(shù)字資源,為開展網(wǎng)絡(luò)信息服務(wù)提供了堅實的基礎(chǔ)。

2 數(shù)據(jù)庫建庫模式與設(shè)計

2.1 電子書掃描與制作

此數(shù)據(jù)庫將民國文獻進行掃描(或縮微膠片轉(zhuǎn)換)形成電子文檔,通過著錄得到每本書的題錄信息,入庫形成民國文獻數(shù)據(jù)庫。因圖書文本為繁體字,豎排版,加之有破損情況,因此很難進行文字識別,所以應以圖片形式存儲為宜。使用TPI(清華同方專業(yè)數(shù)據(jù)庫制作管理系統(tǒng))系統(tǒng)的電子書制作工具制作成電子書,每條題錄作為一條數(shù)據(jù),對應一本CAJ電子書(顯示為CAJ圖片格式),生成圖書名稱索引,實現(xiàn)文獻資料的題名、日期、作者、目錄等的檢索。這樣做的優(yōu)點是:用戶接口多為菜單驅(qū)動型,易學易用,檢索直接。確定收錄范圍后,由工作人員對圖書進行掃描或者縮微拍攝。由于我們制作的是全文數(shù)據(jù)庫,所以圖書的每一頁包括封面、書名頁、前言頁、目錄、正文、后記頁、封底等等都要掃描進計算機。掃描時要保持與原書頁面內(nèi)容的一致性和完整性,忠實于原始文獻形態(tài)。假如某一頁只有頁碼而無任何文字,這一空白頁也要掃描,以保持頁碼的連貫性。掃描完成后,須從頭到尾檢查是否有漏掃的頁面及重復掃描的頁面,若有,則及時添加或刪除。

2.2 元數(shù)據(jù)制定及錄入

此庫的元數(shù)據(jù)采取學術(shù)性和實用性的原則,嚴格按照《中國數(shù)字圖書館基本元數(shù)據(jù)標準規(guī)范》制定,著錄時對照規(guī)范,結(jié)合此庫特點,設(shè)立了包括題名、責任者、內(nèi)容提要、目錄、出版者等10個核心元素和包括副題名、出版發(fā)行年、地區(qū)、人名等項內(nèi)容的12個修飾詞,能較全面地反映圖書的客觀信息。同時為方便讀者檢索,將出版發(fā)行年同時轉(zhuǎn)換并著錄公元紀年。元數(shù)據(jù)在錄入過程中,錄入人員要做到認真核對,仔細校驗,保證錄入數(shù)據(jù)的準確。在錄入后,上傳已經(jīng)制作好的電子書,這樣,一條數(shù)據(jù)就制作完成了。

3 加工平臺的使用

針對文獻數(shù)字化加工的特點,遼寧省圖書館使用清華同方公司開發(fā)的TPI平臺系統(tǒng),以保證加工的高效及數(shù)據(jù)的質(zhì)量。清華同方知網(wǎng)自主研發(fā)的TPI平臺是基于非結(jié)構(gòu)化文檔管理而開發(fā)的大型智能內(nèi)容管理系統(tǒng),它圍繞著數(shù)字圖書館建設(shè)內(nèi)容而設(shè)計,能夠同時管理文字、圖片、多媒體、電子檔案等信息。支持網(wǎng)頁的動態(tài)發(fā)布,支持分級權(quán)限認證;電子圖書制作及元數(shù)據(jù)加工工具系統(tǒng)共同實現(xiàn)了原始文獻資料的數(shù)字化和組織;內(nèi)容發(fā)布、檢索網(wǎng)關(guān)和TPI檢索服務(wù)器等共同實現(xiàn)資源的發(fā)布。平臺具有以下功能:

3.1 電子書制作功能

TPI系統(tǒng)中的電子書加工工具為書籍電子化提供了一種快捷、方便、高效的全面解決方案。Book-Shop尤其支持各類紙質(zhì)文檔加工成電子書的全過程。其中包括書頁圖像掃描及管理、書面圖像處理、書面圖像識別導入及編改、目錄加工處理、書頁圖像及目錄合并形成電子書。利用這一特色功能,我們可以把掃描的每頁圖片加工成一整本書,便于讀者下載和瀏覽。

3.2 元數(shù)據(jù)標引工具(MET)

MET是通過TCPPIP與FTS(全文檢索服務(wù)器)相配合,對分配的元數(shù)據(jù)進行標引,因此標引工具與檢索服務(wù)不必運行在同一臺計算機上,可以進行遠程標引工作,也可以多臺機器同時運行,提高效率。數(shù)據(jù)標引就是給項目中記錄的部分或全部字段填上合適的值,以此來標識這條記錄,使用戶能通過對字段的檢索來搜索到此記錄。數(shù)據(jù)標引中對原文類型為KDH、NH、PDF、HTML和WORD文件的記錄可以通過原文進行標引。對不能通過原文進行標引的記錄,需要利用相應的文檔編輯器配合進行間接標引。

3.3 檢查功能

檢查工具(CKT)。CKT也是采用TCPPIP與FTS相聯(lián)接,實現(xiàn)分布式的并行數(shù)據(jù)加工。檢查操作是對標引、分類操作結(jié)果進行檢查,將錯誤數(shù)據(jù)記錄重新返回給標引工序,確保數(shù)據(jù)的正確性、準確性。

3.4 內(nèi)容發(fā)布功能

內(nèi)容發(fā)布系統(tǒng)(CPS)。CPS完成圖書館數(shù)據(jù)的分布式采編入庫,實現(xiàn)網(wǎng)站信息的發(fā)布與管理,實現(xiàn)動態(tài)實時發(fā)布,即發(fā)即得,立即生效。CPS中提供了多種庫結(jié)構(gòu)模板以供選擇,同時還可以根據(jù)需要進行自定義。在CPS中還可以建立Web訪問數(shù)據(jù)庫的賬號及操作員賬號。前者允許限定賬號的有效期限及指定訪問的數(shù)據(jù)庫,還可以通過IP地址限定訪問者的范圍。操作員的設(shè)置是為了更好地實現(xiàn)職責明確的信息加工,支持多人協(xié)同采編,實現(xiàn)信息發(fā)布之前的編審控制。根據(jù)需要賦予操作員標引、分類、檢查等權(quán)限。CPS還可以進行數(shù)據(jù)庫的分類管理,建立導航分類。

4 數(shù)據(jù)庫發(fā)布

數(shù)據(jù)加工制作完畢后,就可以使用TPI系統(tǒng)中“內(nèi)容發(fā)布工具”的“Web發(fā)布向?qū)А惫δ苓M行數(shù)據(jù)庫網(wǎng)上發(fā)布的相關(guān)配置。通過該向?qū)Э梢詫崿F(xiàn)設(shè)置數(shù)據(jù)庫的版權(quán)信息、選擇數(shù)據(jù)庫發(fā)布模板、確立檢索點指定字段屬性、配置個性化的初級和高級檢索界面等。根據(jù)數(shù)據(jù)庫內(nèi)容的不同,TPI系統(tǒng)預制了與之相對應的不同形式和不同特點的發(fā)布模板。系統(tǒng)提供了CNKI模板、Google模板、EI模板和OCLC模板等,本數(shù)據(jù)庫采用的是CNKI模板。

5 問題與思考

5.1 提高數(shù)據(jù)庫利用效率

圖書館自建數(shù)據(jù)庫是為了更充分地滿足用戶對某專題信息的需求。自建數(shù)據(jù)庫利用率的高低決定數(shù)據(jù)庫建設(shè)效果的好壞。因此自建數(shù)據(jù)庫的名稱、專業(yè)類型是否清晰,在主頁上的位置是否明顯,是否具有使用幫助、檢索界面友好性、檢索策略的多樣性、查準率與查全率、檢索結(jié)果的輸出方式、檢索結(jié)果輸出速度、系統(tǒng)穩(wěn)定性等都將直接影響數(shù)據(jù)庫的使用率。民國文獻數(shù)據(jù)庫與其他自建數(shù)字資源被一并整合在遼寧省圖書館主頁中的數(shù)字資源欄目內(nèi),檢索界面清晰、直觀、界面友好,同時TPI系統(tǒng)的優(yōu)點是檢索結(jié)果準確,響應時間快,并且可以提供多種排序方式,便于讀者使用,提高了利用率。

5.2 數(shù)據(jù)庫后期維護與安全問題

民國文獻數(shù)據(jù)庫數(shù)據(jù)量比較大,在制作的過程中投入了大量的人力、物力,所以后期的維護與安全防護是一個很重要的問題。在數(shù)據(jù)庫制作的過程中,每天進行自動備份,在數(shù)據(jù)庫完成后,我們準備將這些數(shù)據(jù)刻錄成光盤,作為物理備份,這樣,即使服務(wù)器數(shù)據(jù)出現(xiàn)問題導致無法瀏覽,也可用物理備份進行恢復。這就為讀者查閱使用和數(shù)據(jù)的安全性提供了保障。

5.3 知識產(chǎn)權(quán)問題

知識產(chǎn)權(quán)是數(shù)字圖書館發(fā)展中遇到的最大阻力。從圖書館發(fā)展建設(shè)的角度來看,特色館藏資源是具有較高學術(shù)和史料價值的資料,比如本館所建立的《盛京時報》數(shù)據(jù)庫、東北抗戰(zhàn)書目庫、建國前東北期刊數(shù)據(jù)庫等。但數(shù)據(jù)庫開發(fā)涉及著作權(quán)許可和確認問題。如果對已經(jīng)發(fā)表作品進行數(shù)字化,會涉及署名權(quán)、修改權(quán)、保護作品完整權(quán)、使用權(quán)和獲得報酬的權(quán)利。圖書館進行公益性的文獻數(shù)字化主要是為保護文獻、方便讀者使用,借助網(wǎng)絡(luò)使更多人共享,但這又將侵害權(quán)利人的網(wǎng)絡(luò)傳播權(quán),是建庫的矛盾所在。為此,我們盡量選擇年代久遠的,過了保障期或即將過期的作品來規(guī)避版權(quán)問題,同時通過控制用戶權(quán)限、IP登陸等方式,避免惡意下載,保護數(shù)據(jù)的安全性,以此來最大限度地保護著作權(quán)人的知識產(chǎn)權(quán)。

[1] 黃立華.TPI與我國數(shù)字圖書館建設(shè)[J].圖書館論壇,2004(4):76-78.

[2] 孫琴.民國文獻數(shù)字化建設(shè)現(xiàn)狀分析研究[J].山東圖書館季刊,2008(1):71-73.

[3] 溫泉.館藏民國圖書數(shù)據(jù)庫建設(shè)探討[J].河南圖書館學刊,2010(8):96-98.

[4]萬華英.民國文獻數(shù)字化建設(shè)——以重慶圖書館為例[J].四川圖書館學報,2008(4):31-33.

猜你喜歡
標引文獻數(shù)據(jù)庫民國
《感染、炎癥、修復》雜志檢索數(shù)據(jù)庫
《感染、炎癥、修復》雜志檢索數(shù)據(jù)庫
檔案主題標引與分類標引的比較分析
他們?yōu)楹味紣勖駠?
論我國學術(shù)文獻數(shù)據(jù)庫的質(zhì)量調(diào)控
大數(shù)據(jù)時代數(shù)字資源的主題標引研究
民國人愛刷朋友圈
中文文獻數(shù)據(jù)庫中撤銷論文的分布規(guī)律研究
關(guān)于關(guān)鍵詞標引的要求
關(guān)于關(guān)鍵詞標引的要求
鄂托克前旗| 民权县| 江孜县| 犍为县| 石狮市| 潼关县| 深州市| 崇州市| 突泉县| 米易县| 西乡县| 德惠市| 景德镇市| 吉林省| 岱山县| 浏阳市| 剑阁县| 黔西县| 绥阳县| 定日县| 大理市| 山阳县| 巫山县| 绍兴县| 灵武市| 东兴市| 承德县| 嘉义市| 马尔康县| 保康县| 沙湾县| 万安县| 镇雄县| 邓州市| 孝义市| 四会市| 廊坊市| 上饶县| 德化县| 津南区| 西青区|