張軼雯++韋成府++崔海媛
摘要 以讀者需求作為根本導向一直是北京大學圖書館的技術(shù)發(fā)展路線,該文介紹了始于2001年的學位論文數(shù)字化建設(shè):包括2600多篇燕京大學論文,3萬多篇2000年以來的北京大學碩士、博士研究生學位論文全文,旨在從學位論文發(fā)布流程、知識產(chǎn)權(quán)保護、傳統(tǒng)借閱和開放獲取服務(wù)、用戶統(tǒng)一管理、結(jié)合OPAC技術(shù)等方面闡述北京大學圖書館學位論文系統(tǒng)建設(shè)的新探索,以期為國內(nèi)外同行提供借鑒。
關(guān)鍵詞 學位論文 學位論文系統(tǒng) 知識產(chǎn)權(quán)保護 開放獲取 創(chuàng)新服務(wù) 高校圖書館
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,互聯(lián)網(wǎng)已經(jīng)成為人們獲取知識和交流信息的重要渠道。學位論文電子版的使用與保存比印刷版更方便、更快捷。本文對中國大陸高校學位論文T作的現(xiàn)狀進行了分析,并以北京大學圖書館為例闡述了學位論文的T作流程,以及學位論文系統(tǒng)建設(shè)的新探索。
1 高校圖書館學位論文系統(tǒng)建設(shè)的現(xiàn)狀分析
2000年以來,高校圖書館相繼開始通過互聯(lián)網(wǎng)提交電子版學位論文,并建設(shè)了學位論文全文數(shù)據(jù)庫。經(jīng)過十幾年的發(fā)展,學位論文初期工作中出現(xiàn)的一些問題基本上都得到了解決,并逐漸規(guī)范、趨于成熟。但是隨著信息技術(shù)的不斷發(fā)展,學位論文工作中又出現(xiàn)了一些新問題,主要體現(xiàn)在以下幾個方面:
1.1 電子版學位論文的上傳格式問題
2003年,CALIS對全國高校圖書館的學位論文工作進行了調(diào)查,調(diào)查顯示,圖書館要求學位論文電子版提交的格式有4種:DOC、PDF、WPS和LA-TEX。隨著個人電腦的普及和計算機技術(shù)突飛猛進的發(fā)展,越來越多的人開始使用Microsoft Office的文件編輯器,隨著Microsoft Office的不斷升級,DOCX格式文件成了新的主流的電子學位論文提交格式之一。同時,越來越多的人注重自己的版權(quán)而選擇pdf作為提交電子版學位論文的格式,PDF生成的版本頻繁升級,也產(chǎn)生了新的文件格式。因此,學位論文系統(tǒng)應(yīng)及時支持新文件格式的提交,并解決加密、發(fā)布等相關(guān)問題,確保學位論文工作能夠順利進行。
1.2 學位論文的版權(quán)問題
在這個信息大爆炸的時代,互聯(lián)網(wǎng)拉近了人與人之間的距離,成為了人們獲取各種信息的主要來源,由此信息似乎變得十分“廉價”。隨著時代的發(fā)展,版權(quán)意識開始逐漸進入到社會的方方面面。學位論文作為高校獨一無二的重要學術(shù)資源之一,特別是民國時期的手稿,如燕京大學學位論文,則更加珍貴。因此,如何獲取學位論文全文,為教學科研所用,同時又保護學位論文的版權(quán),成了學位論文建設(shè)的重點之一。
1.3 開放獲取問題
隨著互聯(lián)網(wǎng)在各個領(lǐng)域的發(fā)展壯大,已經(jīng)成為了一個重要發(fā)展方向,越來越多的實驗數(shù)據(jù)、灰色文獻等非正式出版的學術(shù)資源在網(wǎng)上公開。學位論文作為高校圖書館的重要資源,具有較高學術(shù)性和傳承性,利用網(wǎng)絡(luò)技術(shù)和計算機技術(shù),及時、全面地揭示學位論文的學術(shù)價值和貢獻,實現(xiàn)開放獲取,成為必然。涉及到保密和版權(quán)等問題,學位論文的全文獲取仍然是比較難以突破的瓶頸,實現(xiàn)學位論文的開放獲取成為高校圖書館今后的奮斗目標。
2 北京大學圖書館學位論文系統(tǒng)的現(xiàn)狀
2.1 北京大學學位論文系統(tǒng)的工作流程
北京大學圖書館對學位論文電子版的收集T作已經(jīng)開展了十幾年了,平均每年學位論文的提交量為3200篇左右,并持續(xù)增長。由最初的軟盤收集、光盤存儲方式變?yōu)橥ㄟ^學位論文提交系統(tǒng)收集,按年進行歸檔,以服務(wù)器備份的方式進行學位論文收集和長期保存。目前的具體工作流程如圖1所示。畢業(yè)生首先登錄北京大學圖書館學位論文提交系統(tǒng)進行在線的元數(shù)據(jù)錄入和電子版學位論文的提交,提交后由圖書館的審核老師對提交內(nèi)容進行審核,接下來收繳紙本論文,進行編目,然后開展全文數(shù)字加工和發(fā)布工作。上述工作完成后,還需將發(fā)布平臺的數(shù)據(jù)轉(zhuǎn)換為marc導人本館的OPAC系統(tǒng)中,提供檢索服務(wù)。最后,每年將學位論文進行備份歸檔、長期保存。
2.2 北京大學學位論文庫的知識產(chǎn)權(quán)保護
北京大學圖書館通過系統(tǒng)的數(shù)字版權(quán)保護(Digital Rights Management,DRM)技術(shù)和政策兩個方面來對學位論文進行版權(quán)保護。對于紙質(zhì)版學位論文采取了“到館閱讀、部分復(fù)制”的版權(quán)維護方式;對電子版學位論文采取了“論文加密、校內(nèi)全文、校外部分”的版權(quán)維護方式:用戶在校園網(wǎng)IP范圍內(nèi)訪問“北京大學學位論文庫”獲取全文,不在范圍內(nèi)的則可以閱讀每篇論文的前16頁?!氨本┐髮W學位論文庫”將電子版學位論文轉(zhuǎn)換為CEB格式后再發(fā)布,采用DRM隨機密鑰對數(shù)字內(nèi)容進行加密,隨機密鑰由服務(wù)器保存和管理,客戶端必須得到授權(quán)后才能使用數(shù)字內(nèi)容,實現(xiàn)了對CEB格式文件的控制,包括展示權(quán)利(如顯示、打印等)、傳輸權(quán)利(借閱)和使用權(quán)利(如摘錄),防止數(shù)字內(nèi)容的非法復(fù)制。在實踐中發(fā)現(xiàn),政策定制和技術(shù)手段相結(jié)合,不僅使學位論文資源得到了有效使用,同時也實現(xiàn)了版權(quán)保護。
2.3 北京大學學位論文庫的開放獲取
北京大學圖書館自2000年開始收集學位論文電子版,并建立了北京大學學位論文庫,結(jié)合CA-LIS學位論文項目,對項目的參建館開放了北京大學學位論文庫的元數(shù)據(jù),以及每篇論文的前16頁內(nèi)容,并提供館際互借服務(wù)。但由于學位論文的原創(chuàng)性和獨特性,學位論文全文庫的建設(shè)是在共享資源的同時,對其進行了一定的版權(quán)保護,有限制地實現(xiàn)了開放獲取,也為今后能夠完全實現(xiàn)開放獲取奠定了基礎(chǔ)。
3 北京大學圖書館學位論文系統(tǒng)的創(chuàng)新服務(wù)
為給讀者提供更加合理便捷的服務(wù),在學位論文系統(tǒng)建設(shè)與服務(wù)過程中,北京大學圖書館通過技術(shù)與服務(wù)創(chuàng)新,不斷改進學位論文服務(wù)。
3.1 學位論文電子版提交文件格式的擴展性
目前,本館使用的是自主開發(fā)的方正Tasi系統(tǒng)。使用過程中,筆者發(fā)現(xiàn)系統(tǒng)對學位論文電子版文件的處理存在格式兼容問題。雖然DOCX格式的文件可以被轉(zhuǎn)換為DOC格式,但是部分轉(zhuǎn)換后的文件包含了一定的錯誤信息,導致在審核時不能通過,給學生順利畢業(yè)帶來了一定延誤。同時在對轉(zhuǎn)換后的文件進行加密時成功的幾率也比較低。為了在最大程度上減少因提交文件格式而造成不能及時通過審核這一問題,升級后的提交系統(tǒng)中支持了DOCX格式和生成版本為1.4以上的PDF格式電子版學位論文的提交。為了保障電子版學位論文的及時發(fā)布,采取了“線下轉(zhuǎn)換”這種折中方式,流程如圖2所示。首先通過腳本獲取待轉(zhuǎn)換論文的信息,將結(jié)果保存至excel表中,包括論文的源路徑、轉(zhuǎn)換的目標路徑、論文在數(shù)據(jù)庫中的PaperID,然后在excel表中生成拷貝文件的bat腳本;第二步,執(zhí)行第一步中的bat腳本,將服務(wù)器上的電子版學位論文拷貝到本地計算機,同時每一條數(shù)據(jù)都生成兩個job文件(一個前16頁job文件,一個全文job文件);第三步,在本地執(zhí)行job文件來對電子版學位論文進行批量格式轉(zhuǎn)換和前16頁的生成工作;第四步,將格式轉(zhuǎn)換后的全文和前16頁文件復(fù)制到服務(wù)器相應(yīng)的目錄;第五步,更新轉(zhuǎn)換成功的論文在數(shù)據(jù)庫中的信息。endprint
通過“線下轉(zhuǎn)換”這一方式,及時將數(shù)據(jù)發(fā)布到學位論文全文庫中,保障了相關(guān)工作的順利進行,使讀者用戶能夠盡快獲得學位論文全文。
3.2 燕京大學學位論文的管理與服務(wù)
燕京大學是中國近代著名的教會大學之一,在1952年全國高等院系調(diào)整中并入北京大學。燕京大學的辦學歷史雖然不長,但是培養(yǎng)了大批精英人才,保存下了許多珍貴的學士和碩士論文,大部分為手稿,更不乏當代名家的手跡,具有很高的學術(shù)研究價值和收藏價值。北京大學圖書館于2010年將燕京大學學位論文作為特色資源劃到特藏部,按其分類排架特點分配了館藏號,對最初的編目卡片也給予了妥善整理和保管,并完成了大部分論文的編目和數(shù)字化,建立了燕京大學學位論文特色庫。燕京大學學位論文采取方正DESI系統(tǒng)進行元數(shù)據(jù)編目及掃描后的加密,發(fā)布在方正Apabi數(shù)字資源平臺上。作為珍貴特藏資源,燕京大學學位論文可在北京大學校園IP范圍內(nèi)閱讀全文,若不在校園IP范圍內(nèi)則僅能查看元數(shù)據(jù)。
3.3 與OPAC系統(tǒng)、發(fā)現(xiàn)系統(tǒng)相整合
在學位論文數(shù)據(jù)庫的建設(shè)初期,我們就考慮到將其與聯(lián)機目錄檢索系統(tǒng)的數(shù)據(jù)整合,從而自主開發(fā)了marc數(shù)據(jù)轉(zhuǎn)換工具,成功地將轉(zhuǎn)換后的marc數(shù)據(jù)導人OPAC系統(tǒng),并逐年增加。用戶可以通過OPAC一站式檢索,更方便地獲取學位論文。下一代資源發(fā)現(xiàn)與獲取系統(tǒng)已經(jīng)得到我國高校圖書館的重視,北京大學圖書館作為中國大陸第一家使用Summon發(fā)現(xiàn)系統(tǒng)的高校圖書館,已經(jīng)對本館的多種資源進行了數(shù)據(jù)優(yōu)化和整合,其中就包括多個自建的數(shù)字特藏和館藏書目數(shù)據(jù)。目前,用戶可以通過“未名學術(shù)搜索”檢索北京大學學位論文的元數(shù)據(jù)。近期,還嘗試將燕京大學學位論文的數(shù)據(jù)與“未名學術(shù)搜索”整合。
3.4 統(tǒng)一用戶管理與畢業(yè)離校系統(tǒng)
學位論文電子版的提交是畢業(yè)生在畢業(yè)前必須進行的環(huán)節(jié)。電子版學位論文在提交后必須經(jīng)過審核并通過后才能畢業(yè)。以往畢業(yè)生離校,需要轉(zhuǎn)單,即到學校多個部門現(xiàn)場辦理手續(xù),并蓋章為證。由于受場地限制和其他方面的原因,往往離校手續(xù)的辦理集中在最后一周,給圖書館學位論文的審核工作和學位論文提交系統(tǒng)都造成了較大壓力。同時在畢業(yè)離校的整個期間,畢業(yè)數(shù)據(jù)不能及時共享,容易出現(xiàn)紕漏。為改變這種情況,畢業(yè)生離校由傳統(tǒng)的轉(zhuǎn)單方式變?yōu)槭褂卯厴I(yè)離校系統(tǒng)辦理離校手續(xù),在明確的流程指導下完成辦理。在離校系統(tǒng)的建設(shè)過程中,圖書館提供了學位論文狀態(tài)查詢的相關(guān)接口,并與學校IAAA認證相結(jié)合,學生可通過校園卡賬戶登錄離校系統(tǒng),查詢學位論文的審核情況。同時,圖書館也可在離校系統(tǒng)的后臺查看全部畢業(yè)生的學位論文提交情況及審核狀態(tài),隨時關(guān)注學位論文提交工作的進展,為畢業(yè)生提供方便、高效、一站式的離校服務(wù),加強學校各相關(guān)部門的信息共享和工作配合,使畢業(yè)離校工作更為規(guī)范、有效和有序,促進學校管理質(zhì)量和服務(wù)水平的提高。
3.5 建設(shè)機構(gòu)知識庫的嘗試
隨著開放獲取的理念被越來越多的科研機構(gòu)所認可,機構(gòu)知識庫作為開放獲取的模式之一處于迅速發(fā)展之中。2011年,CALIS管理中心與北京大學圖書館聯(lián)合開展的中國大陸高校圖書館機構(gòu)知識庫建設(shè)現(xiàn)狀的調(diào)研結(jié)果顯示,我國大陸高校的機構(gòu)知識庫建設(shè)在認識理念、政策支持、技術(shù)平臺、標準規(guī)范等各方面都較為薄弱,需加速發(fā)展。北京大學圖書館于2013年7月正式發(fā)布了“北京大學機構(gòu)知識庫(Beta版)”,其作為北京大學學術(shù)研究的基礎(chǔ)設(shè)置,為北京大學教師、科研人員和學生的學術(shù)研究和學術(shù)交流提供系列服務(wù),包括存檔、管理、發(fā)布、檢索和開放共享。學位論文作為具有較高參考價值的科研學術(shù)資源,應(yīng)該在機構(gòu)知識庫中實現(xiàn)開放獲取,我們已開始對學位論文的開放獲取做準備。即在對各分館進行調(diào)研和與學位論文工作相關(guān)部門討論的基礎(chǔ)上,使用北京大學機構(gòu)知識庫系統(tǒng)來收集、揭示本科學位論文。
4 總結(jié)
北京大學圖書館的學位論文數(shù)字化建設(shè)已經(jīng)開展了十幾年,形成了較為成熟的工作流程、數(shù)據(jù)規(guī)范和服務(wù),取得了一些顯著的成效,對于由于技術(shù)不斷發(fā)展而產(chǎn)生的新問題也能夠及時有效地解決,保障學位論文的利用。然而,學位論文系統(tǒng)仍存在一些值得改進的地方:1)學位論文數(shù)據(jù)的發(fā)布存在一定時間的滯后,不能及時地為教學科研提供服務(wù),今后將在工作流程上不斷改進;2)將北京大學學位論文庫與移動閱讀技術(shù)結(jié)合,讓用戶能夠使用移動端在線閱讀學位論文全文;3)鑒于學位論文涉及保密和版權(quán)等問題,現(xiàn)階段完全開放各高校學位論文的時機還不夠成熟,實現(xiàn)開放獲取是今后努力的方向。endprint