劉燕權(quán),劉曉東,楊晴虹
(1. 美國南康涅狄格州立大學,紐黑文 06515,美國;2. 河北醫(yī)科大學圖書館,石家莊 050017;3. 北京航空航天大學經(jīng)濟管理學院,北京 100191)
地方民俗數(shù)字圖書館
——阿爾伯塔傳統(tǒng)與當?shù)貧v史典藏中心
劉燕權(quán)1,劉曉東2,楊晴虹3
(1. 美國南康涅狄格州立大學,紐黑文 06515,美國;2. 河北醫(yī)科大學圖書館,石家莊 050017;3. 北京航空航天大學經(jīng)濟管理學院,北京 100191)
阿爾伯塔傳統(tǒng)與當?shù)貧v史典藏中心致力于收藏加拿大阿爾伯塔地區(qū)歷史和風俗知識,為阿爾伯塔文化的傳播和共享做出貢獻。主要藏品為1941-1946年間收藏的資料,從2000年6月開始實施數(shù)字化,收集的各種類型資料多達1000多份,具有較高的文獻價值。本案例介紹該項目的歷史背景、信息資源組織狀況,服務(wù)和技術(shù)特點。
數(shù)字圖書館;阿爾伯塔傳統(tǒng)與當?shù)貧v史典藏;地方史;檔案典藏
阿爾伯塔傳統(tǒng)與當?shù)貧v史典藏(The Alberta Folklore and Local History Collection,以下簡稱AFLHC[1])由“展望未來,回顧過去:阿爾伯塔數(shù)字化項目(Our Future,Our Past:the Alberta Heritage Digitization Project,以下簡稱AHDP)”主辦,并獲得政府、歷史、教育機構(gòu)等多方資助,如加拿大的數(shù)字化博物館、加拿大千年博物館、加拿大阿爾伯塔歷史資料基金會、阿爾伯塔知識網(wǎng)、阿爾伯塔和Calgary大學聯(lián)合會、阿爾伯塔法律基金會,以及Calgary社區(qū)彩票局等。AFLHC的文獻主要收藏在加拿大阿爾伯塔州埃德蒙頓大學的布魯斯·皮爾特藏圖書館中,該項目在1941-1946年收集的資料成為所藏資料的核心內(nèi)容。2000年6月該項目作為AHDP的重要組成部分開始了數(shù)字化進程,主要目的是收集阿爾伯塔地區(qū)的傳統(tǒng)和當?shù)貧v史風俗,幫助各類學者、學生及研究人員探索加拿大西部地區(qū)的歷史和文化,以在全球范圍內(nèi)共享該地區(qū)的歷史和文化資源。其中,關(guān)于該地區(qū)的石油和替換能源發(fā)展等內(nèi)容引起了包括美國在內(nèi)的多個國家的重視,因此了解該地文化與風俗對于進一步開展商務(wù)交流具有重要價值。
圖1 阿爾伯塔傳統(tǒng)與當?shù)貧v史典藏主頁
1.1數(shù)字資源
AFLHC收集的內(nèi)容包括軼事、論文、詩歌、神話、個人回憶錄、學校歷史、年鑒、圖片、信件、戲劇和錄音制品、出版物的剪報和故事節(jié)選等,近1000份藏品詳實的記錄了阿爾伯塔的歷史和風俗?!瓣P(guān)于我們”中的“文件”一欄還提供了項目計劃和時間軸、項目進程和工作流程、元數(shù)據(jù)參考、數(shù)據(jù)安全、資源處理、AFLHC會議紀要、文獻保存進程、文本圖像掃描指導和結(jié)果、Minolta PS 3000掃描指導、館藏總結(jié)以及問題和解決辦法等內(nèi)容。需要注意的是,所選的數(shù)據(jù)庫無視覺字符檢測軟件,因此在進行圖像轉(zhuǎn)換過程中無法實現(xiàn)所含文本的數(shù)字化和文本索引。
1.2收集政策
AFLHC的收集工作現(xiàn)已完成,雖然AFLHC的網(wǎng)站上并無任何涉及到館藏版權(quán)和法律事務(wù)的信息,但是皮爾草原諸省(Peel’s Prairie Provinces)網(wǎng)站中設(shè)置了版權(quán)和使用權(quán)限的內(nèi)容,免責聲明指出:阿爾伯塔大學負責整理并公布加拿大草原諸省的歷史和發(fā)展內(nèi)容供公眾免費獲取,但不包括未獲得版權(quán)的資源。另一方面,阿爾伯塔大學主要負責提供并維護數(shù)字化資源,并不包括向公眾提供紙質(zhì)資源,同時也不允許在未經(jīng)版權(quán)所有者允許的情況下復制館藏資源。在版權(quán)方面項目組花費了很多精力以保證所有有價值的資料都在收錄范圍,只有那些確實無法獲得版權(quán)的資料才會被排除在外。
1.3數(shù)字化方法
數(shù)字化除了可以更好保護這些古老易損的藏品之外還能讓更多的人通過網(wǎng)絡(luò)途徑接觸到這段歷史,AFLHC的數(shù)字化資源能夠通過AHDP[2]和UAL’s Peel’s Prairie Provinces的網(wǎng)站[3]直接獲取。Banski 在2002年即指出該項目實現(xiàn)數(shù)字化的基本過程,即:①收集并整理AFLH資源,制定收錄標準和目標;②掃描檔案文件,選擇數(shù)據(jù)庫軟件存儲元數(shù)據(jù)、制作元數(shù)據(jù)、保存重要文檔的電子版本;③將掃描的電子文件轉(zhuǎn)化為圖像形式實現(xiàn)大眾獲取,為重要文件的首頁制作縮略圖,實現(xiàn)公共獲取。
1.4元數(shù)據(jù)方法
館藏的描述內(nèi)容遵循都柏林核心集標準,主要是由于該標準易用性強,可實現(xiàn)與MARC數(shù)據(jù)的有效轉(zhuǎn)換,能更便捷的實現(xiàn)一站檢索,同時還擁有來自圖書館組織最強大的非傳統(tǒng)元數(shù)據(jù)支持等優(yōu)勢?;谠摌藴剩许椖康拿枋鰞?nèi)容都包括標題、責任者、內(nèi)容、類別、覆蓋時間、語言、來源、系列、出版商、圖書編號、版權(quán)、作者、地域和主題詞等。雖然現(xiàn)階段AFLHC使用的是都柏林核心集來構(gòu)建元數(shù)據(jù),但為了實現(xiàn)與皮爾草原諸省各網(wǎng)站的有機對接,未來的元數(shù)據(jù)將被轉(zhuǎn)化為元數(shù)據(jù)目標描述計劃(Metadata Object Description Scheme, MODS)。
AFLHC依靠加拿大主題詞組織(Canadian Subject Headings, CSH)來組織數(shù)據(jù)。CSH負責構(gòu)建和組織與國會圖書館類似的主題詞,但它可以更準確的區(qū)分術(shù)語(如state和province)和拼寫(如catalog和catalogue)。雖然網(wǎng)站上并沒有明確指出CSH的正式使用情況,但一些詞匯的拼寫已經(jīng)顯示了該系統(tǒng)的應(yīng)用痕跡,如centre代替了center。
AFLHC使用的元數(shù)據(jù)體制表述詳盡且支持直觀的示例演示,方便用戶使用。該項目并未給出明確信息說明何時及如何增加新內(nèi)容,對于網(wǎng)站的維護也無過多說明信息,但可以推測出它是作為AHDP的一個部分進行維護和更新的。
1.5文獻組織
阿爾伯塔傳統(tǒng)和當?shù)貧v史典藏是用來組織年刊、出版物和各種文檔、傳記、專輯的知識寶庫,收錄的許多資料都是手寫或者通過打字機用各種顏色的墨水打出來的。文字可能模糊褪色,紙質(zhì)也可能從光滑變得粗糙,還有部分文件曾被揉皺或折疊,這些都對掃描造成了一定程度的困難。在這種情況下,掃描的主要目的則從恢復原圖變?yōu)楸M量提高圖片可讀性。掃描文件包含了描述原始文件的數(shù)據(jù),如標題、創(chuàng)建者或作者、出版商、資料來源以及書籍編碼等,還包含原始文件的電子檔案信息,如電子化圖像的命名信息、格式、分辨率(DPI)、尺寸(Pixel)以及版權(quán)信息等。為了保證收錄的資料能持續(xù)被查閱,所有圖像同時存儲在兩臺中央動態(tài)存儲器上,其中第二個作為第一個的備份運行以防后者受損。為了更好的保障數(shù)字圖書館的成功建設(shè),系統(tǒng)還提供了一個給Alberta和Calgary大學教職員工使用的編輯板來完成數(shù)字化編輯等功能。
2.1檢索和瀏覽
AFLHC的網(wǎng)站免費向公眾開放,并提供瀏覽和檢索功能。網(wǎng)站的瀏覽功能支持標題、作者、出版項、類別、地域名稱、責任者和主題等信息的展示,并允許用戶按字順檢索各類別內(nèi)容。書籍的封面和書頁都實現(xiàn)了數(shù)字化掃描,用戶通過在頁面下端輸入頁碼即可跳躍到指定頁面。AFLHC網(wǎng)站還支持17種檢索途徑,其中包括按項目文獻、音頻資料、阿爾伯塔傳統(tǒng)季度、頁碼和年鑒等方式檢索資源。用戶不必上傳或下載任何數(shù)字化文獻,在獲取檢索結(jié)果后,只需要點擊縮略圖,即可在新頁面打開高清圖像并瀏覽所有的文本內(nèi)容。
網(wǎng)站支持簡單檢索和高級檢索。簡單檢索允許用戶使用自然語言鍵入任何檢索內(nèi)容;高級檢索則會根據(jù)用戶鍵入的部分或全部關(guān)鍵詞返回結(jié)果,可實現(xiàn)對特定內(nèi)容,如類別、書號、內(nèi)容描述、地名、責任者、著者、來源和標題等的檢索,支持布爾邏輯算法。另外,用戶還可以基于文獻的書簽、標簽、主題詞和描述等來檢索文獻。
圖2 AFLHC瀏覽檢索功能
2.2聯(lián)系信息
網(wǎng)站的“聯(lián)系我們”界面提供了該項目的相關(guān)聯(lián)系信息,鼓勵用戶評價、反饋和糾正網(wǎng)站信息,方便讀者推薦資源。用戶可以直接聯(lián)系阿爾伯塔大學圖書館,更正錯誤文本、咨詢相關(guān)版權(quán)問題等。
該網(wǎng)站服務(wù)內(nèi)容簡單,AFLHC網(wǎng)站并不包括索引、網(wǎng)站地圖、傳輸服務(wù)、參考服務(wù)、幫助工具、論壇、博客和播客等服務(wù)內(nèi)容。網(wǎng)站也未給出進一步發(fā)展、評估或維護的計劃。
3.1主頁設(shè)計
AFLHC數(shù)字圖書館的交互界面基于文本進行設(shè)計,簡單直觀。網(wǎng)站允許用戶選擇字體和頁面色彩風格,每一頁都延續(xù)主頁布局,僅在主頁面區(qū)顯示變化內(nèi)容。主頁采用黑色背景及白色文檔顯示區(qū),主頁頂部為藍色背景襯托AFLH標示,并列六個精選內(nèi)容,分別是:阿爾伯塔大學圖書館、阿爾伯塔大學學習服務(wù)學院、Bruce Peel特藏圖書館和阿爾伯塔傳統(tǒng)數(shù)字化項目(AHDP)網(wǎng)站等指示圖標,指引用戶到不同界面進行瀏覽。頁面左側(cè)設(shè)置有瀏覽目錄,用戶可選擇檢索或瀏覽工具獲取信息資源?!捌渌Y源”區(qū)為用戶提供“檢索工具”和“關(guān)于我們”的相關(guān)信息,其中“檢索工具”區(qū)除了可以瀏覽基于資源類型(如年鑒、圖片等)等,還為圖書館員和項目管理者提供部分專業(yè)數(shù)據(jù),暫不對外開放。主頁最下方設(shè)有阿爾伯塔大學圖書館的主頁、學習系統(tǒng)主頁和阿爾伯塔大學的主頁鏈接。
3.2應(yīng)用設(shè)備
數(shù)據(jù)庫的創(chuàng)建需要Macintosh 電腦、掃描儀和CD的共同支持。圖片資料多為簡單版本,文本可以快速下載和瀏覽。該網(wǎng)站使用Minolta PS 3000行星掃描儀和愛普生平板掃描儀進行書籍的數(shù)字化,部分文獻使用PhotoShop Limited Edition 5.0進行修整。由于服務(wù)器空間有限,掃描的圖片文檔暫存于CD中,在所有的掃描完成之后則被轉(zhuǎn)存入獨立服務(wù)區(qū)實現(xiàn)網(wǎng)絡(luò)訪問。項目編目人員使用Microsoft Access數(shù)據(jù)庫軟件創(chuàng)建和保存元數(shù)據(jù)記錄,多數(shù)內(nèi)容使用都柏林核心集標準,也適時加入通俗解釋以增加準確性。
在移動技術(shù)服務(wù)層面,AFLHC網(wǎng)頁也提供了有效的移動設(shè)備服務(wù)。筆者使用IPhone 4S中的火狐瀏覽器進入頁面,所有的頁面都可快速準確打開。憑借下載速度快,所占內(nèi)存小的優(yōu)勢,JPG格式的內(nèi)容在移動設(shè)備上呈現(xiàn)效果良好。
3.3文件格式
后臺數(shù)據(jù)庫采用MySQL設(shè)計,AFLHC網(wǎng)站無多媒體文檔和資源,其主要內(nèi)容多為簡單圖片格式并且沒有過高的分辨率,作者通過調(diào)研一系列的檢索結(jié)果來源發(fā)現(xiàn),大多數(shù)的文獻被直接掃描為或后期轉(zhuǎn)換為JPG格式,而且大部分的圖片和文本都顯示出部分破損。另外,AFLHC網(wǎng)頁的資源幫助用戶學習到不同的HTML標簽格式,如部分在主頁中使用的標簽形式為<head>,<style>,<body> 和<script>。
AFLHC具有獨特的優(yōu)勢。從結(jié)構(gòu)和內(nèi)容上來說,AFLHC是一個簡潔直觀的網(wǎng)站,頁面布局和內(nèi)容設(shè)置科學合理,用戶在自己的電腦上就可以便捷地檢索和使用資源。該項目館藏資源豐富多樣,掃描圖像質(zhì)量較高且檢索和瀏覽功能便捷易用。它為歷史專業(yè)的研究者和學生提供了一個免費門戶,非專業(yè)研究者也可以輕易使用其收集資源。用戶也可以通過主題標簽或書簽的超鏈接獲得同類別或同類目文獻,且方便查找上級分類目錄的相關(guān)內(nèi)容。書籍的主要內(nèi)容通過主題詞或簡要綜述體現(xiàn),一旦用戶確定了所需內(nèi)容,圖書館則為用戶提供有效的細節(jié)內(nèi)容。
同時,AFLHC也不可避免的存在一些問題。如加拿大阿爾伯塔大學不提供雙語版本,數(shù)字圖書館作為加拿大網(wǎng)站通常讓用戶選擇法語或英語界面。部分死鏈和空白占位符也耗費了有效的網(wǎng)絡(luò)空間?!瓣P(guān)于”頁面中指出AFLH共有“大約1000份收錄文獻”,但自2000年的初始文獻至今,AFLH并無技術(shù)更新。技術(shù)方面的問題是該數(shù)字圖書館面臨的最大挑戰(zhàn),對于掃描設(shè)備和存儲設(shè)備的更新將會是該數(shù)字圖書館持續(xù)發(fā)展的重要因素。同時,如果特定書籍或文獻的標題不清楚,則在該數(shù)字圖書館中定位和瀏覽文獻有一定難度。
總之,作為地域特征明顯的阿爾伯塔傳統(tǒng)與當?shù)氐洳貫槿蚋鞯貐^(qū)的歷史文化和風俗傳承提供了良好的借鑒經(jīng)驗,為數(shù)字圖書館事業(yè)的發(fā)展貢獻了重要力量,也為對阿爾伯塔文化感興趣的全球人民提供了一個高質(zhì)量全方位的知識寶庫,我們期待阿爾伯塔數(shù)字化項目的進一步發(fā)展與優(yōu)化。
[1] Alberta Folklore and Local History Collection [EB/OL].[2015-02-03]. http://folklore.library.ualberta.ca.
[2] The Alberta Heritage Digitization Project [EB/OL].[2015-02-03]. http://ourfutureourpast.ca.
[3] Peel’s Prairie Provinces[EB/OL].[2015-02-03].http://peel.library. ualberta.ca/aboutsite.html.
Alberta Folklore and Local History Collection--A Digital Library of Local Folklore
Yan Quan LIU1, LIU XiaoDong2, YANG QingHong3
(1. Southern Connecticut State University, New Haven 06515, USA; 2. Library, Hebei Medical University, Shijiazhuang 050017, China;3. School of Economics and Management, Beihang University, Beijing 100191, China)
Alberta Folklore and Local History Collection aims at providing the local history and culture of Alberta in Canada. The majority of the collections were completed during 1941-1946 while the digitalization started in June 2000. The collection boasts nearly 1000 anecdotes, essays, poetry, tall tales, personal reminiscences of Alberta pioneers, school histories and yearbooks, photographs, correspondences, plays and radio scripts, newspaper clippings, and excerpts of stories from published documents. Those materials play an important role in broadcasting and sharing of the Alberta culture. This paper tries to explore the project based on the background,collection organization, service and technology features, then make objective comments.
Digital library; AFLHC; Local history; Archival collection
G259
10.3772/j.issn.1673-2286.2015.03.011
劉燕權(quán),男,博士,美國南康涅克州立大學教授,研究方向:數(shù)字圖書館、數(shù)字化及多媒體技術(shù),E-mail: liuscsu@gmail.com。
劉曉東,女,碩士,河北醫(yī)科大學圖書館采編部館員,E-mail: bnugyliuxiaodong@126.com。
2015-02-20;編輯:王立學)