□ 劉燕權(quán)/美國(guó)南康涅狄格州立大學(xué) 美國(guó)康州紐黑文 06515
劉曉東/北京師范大學(xué)管理學(xué)院 北京 100875
古騰堡項(xiàng)目
——數(shù)字圖書館的先驅(qū)者
□ 劉燕權(quán)/美國(guó)南康涅狄格州立大學(xué) 美國(guó)康州紐黑文 06515
劉曉東/北京師范大學(xué)管理學(xué)院 北京 100875
古騰堡項(xiàng)目(Project Gutenberg)被普遍認(rèn)定是最早出現(xiàn)的數(shù)字圖書館。1971年7月4日,創(chuàng)始人Michael Hart將美國(guó)《獨(dú)立宣言》輸入計(jì)算機(jī),開啟了古騰堡項(xiàng)目的第一步。40年后,在Mr. Hard的領(lǐng)導(dǎo)和無數(shù)志愿者的幫助下,該項(xiàng)目的免費(fèi)電子書等目前已經(jīng)超過4萬本,而其附屬網(wǎng)站收集的電子書更是超過了10萬本。古騰堡項(xiàng)目作為最早的數(shù)字圖書館在數(shù)字圖書館發(fā)展史中扮演了十分重要的角色。文章對(duì)該項(xiàng)目的歷史背景、信息資源組織、服務(wù)和技術(shù)特點(diǎn)等進(jìn)行客觀的介紹和評(píng)價(jià)。
數(shù)字圖書館,古騰堡項(xiàng)目,數(shù)字化藏書,免費(fèi)電子藏書
1.1 背景介紹
古騰堡項(xiàng)目(Project Gutenberg,以下簡(jiǎn)稱PG,網(wǎng)址www.gutenberg.org)是一個(gè)非盈利的數(shù)字圖書館,它免費(fèi)為大眾提供該館的數(shù)字資源。1971年,還在大學(xué)就讀的Michael Hart利用做計(jì)算機(jī)實(shí)驗(yàn)的時(shí)間將《獨(dú)立宣言》輸入電腦(Hart, 1992),后又相繼完成了美國(guó)《人權(quán)法案》、美國(guó)《憲章》以及《圣經(jīng)》和莎士比亞戲?。↙ebert, 2008)等。這些數(shù)字資源被放到了當(dāng)時(shí)處于起步階段的因特網(wǎng)上,成為一個(gè)可供大眾免費(fèi)使用的數(shù)據(jù)庫(kù)。隨著因特網(wǎng)在20世紀(jì)九十年代中期的迅速發(fā)展,古騰堡項(xiàng)目所收藏的書籍?dāng)?shù)量也迅速增長(zhǎng),截至2008年,該項(xiàng)目的電子書籍一直以每年上千本的數(shù)量增加。Hart致力于“推動(dòng)電子書的創(chuàng)作和傳播,通過志愿者的努力完成文化內(nèi)容書籍的數(shù)字化和收藏”,他積極鼓勵(lì)志愿者將他們認(rèn)為有價(jià)值的書籍進(jìn)行數(shù)字化。Hart在2005年接受采訪時(shí)強(qiáng)調(diào),PG對(duì)大型數(shù)字化項(xiàng)目如Google Books等的出現(xiàn)起到了重要作用(Vaknin, 2005),并指出該項(xiàng)目是網(wǎng)絡(luò)信息擴(kuò)散和傳播的重要組成部分。
1.2 項(xiàng)目使命
PG以“推動(dòng)電子書的創(chuàng)作和傳播,用盡可能多的格式和語言向全世界提供數(shù)字資源,沖破無知和愚昧的限制”作為自己的使命(Hart, 1992),其目標(biāo)用戶為任何需要信息資源的個(gè)人。Hart表示“PG的理念在于將信息、書籍和其他資源以電腦、程序和用戶可以接受的電子數(shù)字格式提供給大眾”(Project Gutenberg Literary Archive Foundation, 2010)。而要實(shí)現(xiàn)這一目標(biāo),文本文檔和開放格式是最佳選擇。為此PG收藏的書籍多使用可以被近99%的人接受的“Plain Vanilla ASCII”格式(American Standard Code for Information Interchange,美國(guó)信息交流標(biāo)準(zhǔn)編碼),用戶可按照自己的喜好對(duì)完成下載的文獻(xiàn)進(jìn)行裝幀和格式調(diào)整。
1.3 合作機(jī)構(gòu)
PG數(shù)字圖書館是在個(gè)人和機(jī)構(gòu)的共同努力下建立的。PG文獻(xiàn)檔案基金會(huì)(Project Gutenberg Literary Archival Foundation,簡(jiǎn)稱PGLAF)是一個(gè)非盈利機(jī)構(gòu),為PG提供法律咨詢,監(jiān)督PG運(yùn)營(yíng)并代表其接受捐贈(zèng),組織籌資活動(dòng)等,其成立目的在于收藏文獻(xiàn)和其他智力作品;古騰堡項(xiàng)目合作中心(Gutenberg Consortia Center,簡(jiǎn)稱PGCC)成立于1997年,致力于收藏、組織和傳播在線數(shù)字資源。PG僅有少數(shù)兼職領(lǐng)薪的工作人員,主要依靠志愿者的合作實(shí)現(xiàn)書籍?dāng)?shù)字化、校正和其他工作(“About,” 2008)。另有分布式校對(duì)員機(jī)構(gòu)(Distributed Proofreaders)負(fù)責(zé)監(jiān)督校對(duì)志愿者提交到PG的數(shù)字資源。
PG在獨(dú)立制作電子書籍的同時(shí),也積極與其他機(jī)構(gòu)合作生成多種類型數(shù)字資源:如PG與Librivox.org合作,用英語、西班牙語和中文在內(nèi)的多種語言錄制有聲讀物(MP3/VoggOrbis格式)(Librivox.org, 2012);PG也與ClassicalArchives.com合作對(duì)公共領(lǐng)域的樂譜進(jìn)行數(shù)字化。Carnegie Mellon University幫助PG優(yōu)化了在線目錄,大幅減少了瀏覽和使用的難度。IBiblio是PG主要的電子書發(fā)布網(wǎng)站,它管理PG的網(wǎng)頁(yè)內(nèi)容,提供多種輔助服務(wù)(Project Gutenberg, 2011c),并在現(xiàn)階段與University of North Carolina – Chapel Hill共同管理PG。作為歷史上第一個(gè)數(shù)字圖書館,PG也激發(fā)了其他國(guó)際性姊妹項(xiàng)目的出現(xiàn),如歐洲、澳洲、加拿大項(xiàng)目等(Lebert, 2008; Project Gutenberg, 2011c)。PG與這些堅(jiān)持相同理念的獨(dú)立機(jī)構(gòu)合作共贏,提升其在信息時(shí)代的影響力。
1.4 資金支持
作為一個(gè)非盈利機(jī)構(gòu),PG主要經(jīng)濟(jì)來源是社會(huì)捐贈(zèng)。Apple、IBM和Microsoft等公司都曾資助過PG的運(yùn)營(yíng)(Weller, 2000)。為了購(gòu)買更多書籍完成電子化,PG鼓勵(lì)用戶使用多種途徑實(shí)施捐贈(zèng),如使用PayPal、Flattr客戶端或者直接使用支票和現(xiàn)金等①http://www.gutenberg.org/wiki/Gutenberg:Project_Gutenberg_Needs_Your_Donation捐贈(zèng)頁(yè)面,2012-10-11。PG將其運(yùn)作費(fèi)用有意識(shí)地控制在較低水平,以確保其獨(dú)立性,避免來自政治和經(jīng)濟(jì)利益方面的壓力。PG對(duì)一般讀者提供免費(fèi)服務(wù),但要求任何以盈利為目的而使用PG版權(quán)資源的組織和個(gè)人必須支付收入總額的20%作為回報(bào)。
PG數(shù)字圖書館網(wǎng)站創(chuàng)建于1992年。
2.1 主頁(yè)設(shè)計(jì)
PG網(wǎng)站設(shè)計(jì)簡(jiǎn)潔清晰,以黑色和栗色作為全站的主色調(diào)。網(wǎng)站主頁(yè)包括歡迎內(nèi)容及說明內(nèi)容。網(wǎng)站標(biāo)識(shí)以哥特式字體撰寫,位于主頁(yè)左上角的顯著位置,下面分列不同的鏈接。用戶可以通過輸入標(biāo)題、作者和主題檢索書目和網(wǎng)頁(yè)內(nèi)容獲取資源,還可以通過文獻(xiàn)標(biāo)題、作者和主題列表瀏覽文獻(xiàn)。網(wǎng)頁(yè)還提供捐贈(zèng)入口和多語言選擇鏈接,方便用戶瀏覽和使用。頁(yè)面中心展示了主要資源分類、新增項(xiàng)目及相關(guān)鏈接,包括自助出版入口、項(xiàng)目創(chuàng)始人Michael Hart的訃告、使用條款和網(wǎng)站地圖等。
圖1 古騰堡項(xiàng)目主頁(yè)
2.2 數(shù)字資源
至今為止,已有超過五萬名志愿者參與了PG的建設(shè)工作,使PG館藏電子書超過42000部。PG的文本資源并非直接儲(chǔ)存在PG數(shù)據(jù)庫(kù),而是通過FTP從相關(guān)網(wǎng)站上提取,PG提供索引指向特定文獻(xiàn)(“Readers’,”2010)。館藏中近29000部文獻(xiàn)為英文文種,另有法語、中文、德語、西班牙語、葡萄牙語等外文文獻(xiàn)。文獻(xiàn)類型除了小說、詩(shī)歌、短篇小說、戲劇、食譜、參考資源和期刊文章等文本內(nèi)容,還有非文本資源,如有聲讀物、樂譜、動(dòng)態(tài)及靜態(tài)圖片等。同時(shí),PG允許其他圖書館將其館藏書籍的標(biāo)題上傳至本地目錄,大大減少了查找數(shù)字資源的難度。
2.3 館藏政策
PG并無正式的館藏收集政策,Hart在其項(xiàng)目歷史和理念(The History and Philosophy of Project Gutenberg)中提到:“PG基于實(shí)用原則選擇電子圖書……我們選擇大部分用戶需要并會(huì)頻繁使用的書籍”(Hart, 1992)。在收集圖書過程中,PG嚴(yán)格遵守版權(quán)法,只發(fā)布進(jìn)入公共領(lǐng)域的內(nèi)容或者獲得作者授權(quán)的書籍。PG向用戶提供了精簡(jiǎn)版的版權(quán)法來判斷所推薦的書目是否已進(jìn)入公共領(lǐng)域。盡管重重預(yù)防,PG卻依舊難逃版權(quán)訴訟,如Poul Anderson的The Escape則屬越權(quán)文件,PG不得不將其移出館藏。
2.4 數(shù)字化方法
從1971年到1999年,PG收藏的所有文檔都是手動(dòng)完成輸入的。現(xiàn)階段,項(xiàng)目雇用了大量不定時(shí)志愿者借助圖像掃描儀和OCR(光學(xué)字符識(shí)別系統(tǒng))軟件等現(xiàn)代化工具完成數(shù)字化。潛在志愿者首先向網(wǎng)站提交他們認(rèn)為有價(jià)值的數(shù)字化文獻(xiàn)樣本,經(jīng)PG工作人員審閱確定其版權(quán)保護(hù)內(nèi)容后即可開始進(jìn)行數(shù)字化工作。經(jīng)過審核的書籍諸頁(yè)會(huì)被掃描成圖像文件,并通過OCR軟件將圖像處理為文本格式。PG并不只是簡(jiǎn)單地提供文獻(xiàn)書籍,而且非常注重產(chǎn)品的質(zhì)量,因此需要校對(duì)人員對(duì)文本進(jìn)行二次審核。每一部書在上傳之前都需要經(jīng)歷三輪校對(duì),三輪格式調(diào)整,并完成發(fā)布流程和檢測(cè)用戶友好性的流暢閱讀環(huán)節(jié)。
2.5 元數(shù)據(jù)方法
PG使用美國(guó)國(guó)會(huì)圖書館的標(biāo)準(zhǔn)書籍元數(shù)據(jù)組,將作者、標(biāo)題、簡(jiǎn)介和關(guān)鍵詞制作為文獻(xiàn)索引。通過作者、標(biāo)題、編碼和電子書序列描述文本文檔(Project Gutenberg, n.d.; Project Gutenberg, 2006a)。Newby表示,PG使用EPUB Maker軟件將文本文檔轉(zhuǎn)變?yōu)镋PUB格式,該軟件能在新書發(fā)布時(shí)從語法上分析元數(shù)據(jù),并激發(fā)其他多種自動(dòng)生成的格式。PG使用電子書序列號(hào)表示數(shù)據(jù)相關(guān)性,使用機(jī)讀目錄記錄貢獻(xiàn)者,都柏林核心集則被用于搜索引擎和目錄軟件(“Metadata,” 2010)。雖然PG聲稱其檢索功能是“自產(chǎn)自營(yíng)”的,但它卻是由Yahoo!和Anacleto生成索引,并提供收藏書籍的離線目錄。PG還有一個(gè)總索引文檔羅列了所有館藏目錄,此文檔包括對(duì)PG的描述、圖書館藏的完整列表和PG的正式執(zhí)照。
2.6 文獻(xiàn)組織
PG的資源按內(nèi)容類型進(jìn)行組織:通俗文學(xué)(如彼得潘)、經(jīng)典著作(如圣經(jīng))和參考文獻(xiàn)(如羅格同義詞詞典)。書籍也按照文獻(xiàn)格式進(jìn)行組織,如有聲讀物、音樂數(shù)據(jù)、樂譜、動(dòng)態(tài)圖片和靜態(tài)圖片等(Project Gutenberg, 2010b)。館藏按照23個(gè)子目錄編排,以字母順排列為農(nóng)業(yè)、教育、藝術(shù)、歷史等多個(gè)部分,點(diǎn)擊進(jìn)入后,頁(yè)面顯示國(guó)會(huì)圖書館分類號(hào)標(biāo)識(shí),如教育類目為“L”,下設(shè)子類別教育史-LA、教育理論與實(shí)踐-LB、教科書-LT等。收藏文獻(xiàn)還按主題和主題詞組織為“書架(Bookshelves)”,以字順排列為動(dòng)物、圣經(jīng)、兒童小說、教育等共133個(gè)子類別,點(diǎn)擊進(jìn)入后,用戶將看到該類目下的相關(guān)書目。
2.7 館藏記錄——描述和組織
一旦用戶選定特定館藏進(jìn)行瀏覽,他們將進(jìn)入該館藏的詳細(xì)記錄。該記錄包括三個(gè)標(biāo)簽:下載、書目記錄、二維碼。下載標(biāo)簽羅列了一系列可供下載的格式,如HTML、EPUB、Kindle、Plucker、QiOO Mobile和文本文檔等,用戶可選擇所需格式從鏡像網(wǎng)站快速下載。書目記錄羅列了作者、標(biāo)題、語言、國(guó)會(huì)圖書館分類號(hào)、主題、類別、電子書序列號(hào)、發(fā)布日期、版權(quán)狀況和下載量。用戶可通過“相似館藏”瀏覽“其他用戶也下載了……”的內(nèi)容或同一主題文獻(xiàn)。如George Herbert Betts的The mind and its education與The teaching of history相互關(guān)聯(lián)。二維碼界面直接將用戶帶入手機(jī)訪問界面,方便用戶直接將文獻(xiàn)下載至手機(jī)閱讀。用戶還可以直接通過Facebook、Twitter和Google+分享檢索結(jié)果。
圖2 選定書籍描述頁(yè)面
PG致力于為一般普通人群提供信息服務(wù),故其網(wǎng)頁(yè)結(jié)構(gòu)簡(jiǎn)單,層次較少,設(shè)計(jì)單調(diào)無動(dòng)畫,用戶界面智能性有限。但PG能夠提供多種文獻(xiàn)格式滿足不同信息需求,如Librivox志愿者利用PG的內(nèi)容制作免費(fèi)的有聲讀物為殘障人群提供服務(wù),Kindle和iBook商店都鏈接至PG文檔(PG, n.d.a)為普通信息用戶提供通道等。需要指出的是,PG的主要目標(biāo)在于實(shí)現(xiàn)信息可用性,致力于奉獻(xiàn)而非出借文獻(xiàn),因此并不需要圖書館導(dǎo)向的服務(wù)內(nèi)容如館際互借、館藏更新和數(shù)字參考服務(wù)等。
3.1 檢索和瀏覽
在PG文獻(xiàn)首頁(yè),用戶可以直接瀏覽最新發(fā)布的書籍。PG在線圖書目錄支持用戶通過標(biāo)題、作者、語言和最新發(fā)布進(jìn)行瀏覽,作者和標(biāo)題按首字母順序排列,提供中文、法語、德語、拉丁語等多種語言內(nèi)容。用戶可根據(jù)資源類型瀏覽有聲讀物、編譯文獻(xiàn)、樂譜、動(dòng)靜
態(tài)圖片等,或根據(jù)發(fā)布日期選擇可能感興趣的文獻(xiàn)。PG還在頁(yè)面上多處提示讀者內(nèi)容的更新情況。PG提供簡(jiǎn)單檢索和高級(jí)檢索服務(wù),使用戶可以直接在分類目錄,如最受歡迎書目、最新發(fā)布內(nèi)容、隨意瀏覽和關(guān)注更新等分類目錄中檢索文獻(xiàn),也可設(shè)定多項(xiàng)條件完成檢索,包括作者、標(biāo)題、主題、語言、分類、國(guó)會(huì)圖書館分類號(hào)、文獻(xiàn)類型和電子書序列號(hào)等(Project Gutenberg, 2010a)。除了網(wǎng)站自身的檢索功能,用戶還可以通過Anacleto、Yahoo!和Google等搜索引擎實(shí)現(xiàn)檢索。Anacleto是一個(gè)每周更新的全文元數(shù)據(jù)搜索引擎,“它可實(shí)現(xiàn)對(duì)PG內(nèi)容的字段檢索和全文數(shù)據(jù)庫(kù)檢索”(Newby, 2007)。Yahoo!將PG納入了其內(nèi)容采編計(jì)劃,可實(shí)現(xiàn)對(duì)書籍元數(shù)據(jù)的檢索。Google可實(shí)現(xiàn)對(duì)于文章前100kb內(nèi)容的檢索,除了支持標(biāo)準(zhǔn)元數(shù)據(jù)(如標(biāo)題、作者、主題等)進(jìn)行檢索外,還可使用替代標(biāo)題、語言、文獻(xiàn)類型、編碼類型、創(chuàng)作時(shí)間、內(nèi)容梗概和描述等內(nèi)容檢索。
3.2 聯(lián)系信息
用戶可以通過電子郵件、普通信件直接聯(lián)系PG的工作人員。PG推薦使用電子郵件并提供了一系列郵件地址負(fù)責(zé)不同工作內(nèi)容,如help2010@pglaf.org為用戶提供普通服務(wù),承諾兩日內(nèi)回復(fù)書籍和網(wǎng)頁(yè)請(qǐng)求;糾錯(cuò)郵箱專供用戶糾正書籍、目錄、網(wǎng)站等出現(xiàn)的錯(cuò)誤;copyright2010@ pglaf.org提供版權(quán)內(nèi)容咨詢;用戶還可以直接聯(lián)系項(xiàng)目主管Dr. Gregory Newby獲取深入信息②http://www.gutenberg.org/wiki/Gutenberg:Contact_Information。
3.3 移動(dòng)服務(wù)
PG鼓勵(lì)用戶使用電子閱讀器或移動(dòng)設(shè)備閱讀文獻(xiàn)。用戶可通過掃描二維碼進(jìn)入網(wǎng)站的移動(dòng)版,每一項(xiàng)館藏都有特定二維碼。該移動(dòng)版本提供檢索功能,用戶可通過作者、標(biāo)題等檢索館藏并依據(jù)首字母順序、受歡迎程度和發(fā)布日期對(duì)檢索結(jié)果進(jìn)行重新排序。作者使用關(guān)鍵詞“Jane”試驗(yàn)檢索,共得到69個(gè)結(jié)果,其中按作者名檢索結(jié)果為59,按標(biāo)題名檢索結(jié)果為10,其中Jane Austen的Pride and Prejudice最受歡迎(下載量為18019次),Edith Bancroft的Jane Allen: Center為最新發(fā)布(2012-10-1)。用戶還可對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行瀏覽,如最受歡迎作品、最新作品、隨意瀏覽和新書發(fā)布等。點(diǎn)擊進(jìn)入后則顯示按不同標(biāo)準(zhǔn)排列的書籍列表,如Beowulf為最受歡迎的書籍,下載量已達(dá)42341次,點(diǎn)擊特定書目,則進(jìn)入書籍描述頁(yè)面,如作者、標(biāo)題、電子書序列號(hào)、語言、主題、分類和版權(quán)等內(nèi)容,網(wǎng)頁(yè)還提供多種下載格式(HTML、EPUB、Kindle、Plucker、Qioo Mobile等)和相關(guān)書籍內(nèi)容,用戶可瀏覽其他用戶下載內(nèi)容、同作者作品和同主題作品等。
圖3 PG的手機(jī)版頁(yè)面
3.4 Web 2.0工具:Blog和Wiki
PG網(wǎng)站也融合了一些Web 2.0技術(shù),以增加網(wǎng)站的友好性。Newby指出,大部分非內(nèi)容網(wǎng)頁(yè)都是維基頁(yè)面,這一靈活格式使PG工作人員和志愿者更便捷地增加或修改內(nèi)容。PG網(wǎng)站也擁有一個(gè)博客界面——古騰堡項(xiàng)目新聞(www.gutenbergnews.org),對(duì)PG的發(fā)展歷史、創(chuàng)始人情況、特殊館藏、合作機(jī)構(gòu)等內(nèi)容作了細(xì)致介紹,并提供標(biāo)簽云導(dǎo)航和社交網(wǎng)站鏈接。PG設(shè)有良好的糾錯(cuò)機(jī)制,組織者會(huì)經(jīng)常在PG的網(wǎng)站上、Wiki界面和實(shí)時(shí)通訊界面發(fā)布消息,鼓勵(lì)用戶提供反饋并幫助校正、更新內(nèi)容。同時(shí),用戶還可以通過RSS訂閱新書服務(wù),可以關(guān)注Twitter并通過Facebook和Google+分享內(nèi)容。
4.1 應(yīng)用設(shè)備
PG是一個(gè)開放式文本文檔數(shù)據(jù)庫(kù)。它提供EPUB、Kindle、HTML和其他文本格式書籍(Project Gutenberg, 2011),支持PC、iPad、Kindle、Sony Reader、iPhone、Android和其他多種設(shè)備。PG采用ASCII簡(jiǎn)單文本或其他可修改的開放格式編輯文本,并采用不同的格式發(fā)布資源(PDF、HTML、XML等),只要電腦中安裝有JavaScript及相關(guān)組件,用戶就不必安裝任何軟件來閱讀文獻(xiàn)。同時(shí),從PG下載的MP3格式內(nèi)容也不需要特殊軟件支持。
4.2 文件格式
為了使盡可能多的用戶及其電腦設(shè)備流暢利用其免費(fèi)電子書,PG使用簡(jiǎn)易通用數(shù)字化技術(shù)。PG的文獻(xiàn)都被整理為ASCI格式,因?yàn)樵摳袷娇梢员粠缀跛械能浻布R(shí)別(Project Gutenberg, 2012)。圖書館的總索引文檔的描述說明使用“最普通的格式”:文本文檔、8-bit text、Big-5、Unicode、HTML、TeX、XML、MP3、RTF、PDF、LIT、MS Word Doc和PDB(Project Gutenberg, 2012b)。PG也將EPUB、Kindle納入可用格式。比如,Jane Austen的Emma一書,有HTML、EPUB、Kindle(有影像)、Kindle(無影像)、PDF、Plucker、QIOO Mobile、Plain Text和UTF8等多種格式。
4.3 數(shù)據(jù)庫(kù)結(jié)構(gòu)和網(wǎng)絡(luò)標(biāo)記語言
據(jù)Newby表示,PG“輸出XML和RDF,在后臺(tái)使用Postgre SQL數(shù)據(jù)庫(kù)及不同的自定義腳本(Perl、PHP和python)獲取新標(biāo)題”。其中,Perl是一種適用于統(tǒng)一編碼的開源編程語言(Perl.org, 2012);PHP即hypertext preprocessor(超文本預(yù)處理器),是廣泛使用的通用描述語言,適用于網(wǎng)絡(luò)發(fā)展且能被嵌入HTML語言(PHP Group, 2012b);Python也是開源編程語言(Python Software Foundation, 2011)。PG使用W3C的標(biāo)記語言驗(yàn)證服務(wù)來核查文檔,每一個(gè)文檔都設(shè)有鏈接指向其驗(yàn)證器,其驗(yàn)證器則證實(shí)該網(wǎng)站UTF-8編碼并融合XHTML和RDFa語言,為瀏覽者呈現(xiàn)更清晰的XHTML編碼內(nèi)容。
4.4 其他技術(shù)服務(wù)
為了更進(jìn)一步縮減數(shù)字鴻溝,對(duì)于沒有電腦或新式設(shè)備的人,PG提供可將所需內(nèi)容復(fù)制到CD或DVD上為用戶的定制服務(wù)。PG可為任何有信息需求的用戶免費(fèi)制作、贈(zèng)送CD/DVD,并鼓勵(lì)用戶為朋友、圖書館或?qū)W校制作備份。2003年8月,PG發(fā)布的最佳資料CD囊括了600本電子書,當(dāng)年12月為慶祝PG的第一個(gè)10000部電子書發(fā)布了第一個(gè)DVD,并燙印了9400部書名。
PG的優(yōu)勢(shì)顯而易見:用戶易用性好,無附加費(fèi)用,版權(quán)信息完善,下載數(shù)據(jù)清晰,用戶反饋及時(shí)快捷,資源更新較快,權(quán)威性高,收藏價(jià)值較高等。用戶首次使用時(shí)即可快速定位網(wǎng)站并選定自己想要的文件格式。它從全世界范圍征集盡可能多的資源和幫助,為盡量多的讀者提供不同語言不同類型的免費(fèi)信息資源,對(duì)數(shù)字圖書館的發(fā)展影響重大。但其在提供信息服務(wù)的過程中也不可避免地存在一定問題。
首先,PG的缺陷在于其視覺效果不佳。用戶交互界面較陳舊,網(wǎng)頁(yè)設(shè)計(jì)缺乏網(wǎng)絡(luò)標(biāo)記語言,缺乏吸引力。網(wǎng)站檢索結(jié)果較差,缺乏“聯(lián)想”功能。界面層次不清晰,子目錄和書架(Bookshelf)內(nèi)容交叉,用戶必須多次點(diǎn)擊鼠標(biāo)才能進(jìn)入記錄。
其次,PG無明確目標(biāo)或管理機(jī)制引導(dǎo)館藏發(fā)展,館藏的增加多依靠志愿者個(gè)人意愿。因此,圖書館的收藏文獻(xiàn)失衡,如小說的數(shù)量遠(yuǎn)遠(yuǎn)超過非小說內(nèi)容,原因是大多數(shù)志愿者愿意完成小說類文獻(xiàn)的數(shù)字化。同時(shí),確定的員工和有效的計(jì)劃管理對(duì)于數(shù)字圖書館來說舉足輕重,而PG的發(fā)展主要依靠志愿者的推動(dòng)而不是由PG主動(dòng)設(shè)定目標(biāo)并選擇志愿者完成工作,這可能影響PG的穩(wěn)定和持續(xù)發(fā)展。
最后,版權(quán)限制是PG發(fā)展的最大障礙。PG嚴(yán)格遵守版權(quán)法,任何一部書籍在進(jìn)入獲取領(lǐng)域之前都要經(jīng)過版權(quán)審核,這意味著等待資源進(jìn)入公共領(lǐng)域需要很長(zhǎng)一段時(shí)間。因此除了經(jīng)典讀物,PG提供的大部分內(nèi)容可能并非普通讀者喜歡的內(nèi)容,內(nèi)容信息性強(qiáng)但存在過時(shí)現(xiàn)象。
總而言之,Michael Hart啟動(dòng)了第一個(gè)全球性數(shù)字圖書館。PG為全世界提供長(zhǎng)期免費(fèi)的開放資源,對(duì)于數(shù)字圖書館的資源建設(shè)具有較強(qiáng)的影響力。然而,PG在將來的發(fā)展過程中,需要更精美時(shí)尚的網(wǎng)頁(yè)設(shè)計(jì),提高PG對(duì)用戶的友好程度和服務(wù)娛樂性,收集更豐富多彩的數(shù)字資源,提高PG的社會(huì)影響力和信息服務(wù)能力。
[1]Distributed Proofreaders. DP: Welcome [EB/OL]. [2012-01-31]. http://www.pgdp.net/c/.
[2]WELLER S. Project Gutenberg sets 10,000 book goal [J/OL]. Publisher's Weekly 24/4(2000-04-03). Infotrac, 2000.
[3]iBiblio.org. About [EB/OL]. [2012-02-05]. http://www.ibiblio.org/about/.
[4]Librivox.org. Complete FAQ [EB/OL]. [2012-01-31]. https://forum.librivox.org/viewtopic.php?f=18&t=219&sid=7fd6856af89f3c6bf2905c4d52fb0ce8.
[5]PHP Group. PHP: General Information – Manual [EB/OL]. [2012-02-05]. http://us3.php.net/manual/en/faq.general.php.
[6]Project Gutenberg. Project Gutenberg needs your donation [EB/OL]. [2012-01-31]. http://www.gutenberg.org/wiki/Gutenberg:Project_Gutenberg_Needs_Your_Donat ion.
[7]Project Gutenberg. Project Gutenberg online EpubMaker [EB/OL]. [2012-01-31]. http://epubmaker.pglaf.org/.
[8]Project Gutenberg Literary Archive Foundation. Cease and Desist Responses [EB/OL]. [2012-01-31]. http://cand.pglaf.org/.
[9]Python Software Foundation. About python [EB/OL]. [2012-02-05]. http://python.org/about/.
[10]VAKNIN S. The Ubiquitous Project Gutenberg interview with Michael Hart, its founder [OL]. [2012-02-01]. http://samvak.tripod.com/busiweb46.html.
[11]Project Gutenberg. About: Gutenberg [EB/OL].(2008)[2011-02-03]. http://www.gutenberg.org/wiki/Gutenberg:About.
[12]HART M. The History and Philosophy of Project Gutenberg. Project Gutenberg [EB/OL].(1992)[2012-01-31]. http://www.gutenberg.org/wiki/Gutenberg: The_History_and_.
[13]HART M. Project Gutenberg Mission Statement [EB/OL].(2007)[2012-01-31]. http://www.gutenberg.org/wiki/Gutenberg:Project_Gutenberg_.
[14]NEWBY G. Anacleto Search of Project Gutenberg's eBooks. Project Gutenberg News [EB/OL].(2007)[2012-01-31]. http://www.gutenbergnews.org/20070820/ anacleto-search-of-project-gutenbergs-ebooks/.
Project Gutenberg – The Forerunner of Digital Libraries
Yan Quan Liu/Southern Connecticut State University, New Haven, CT, USA, 06515
Liu Xiaodong/Beijing Normal University, Department of Management, Beijing, 100875
Project Gutenberg has now been universally recognized as the very first informational provider on the internet and the oldest digital library. Project Gutenberg started on July 4, 1971, Michael Hart typed the content of the U.S. Declaration of Independence into a computer, and began a collection of electronic books that built up the Project Gutenberg. With countless volunteers' contribution,the project currently boasts over 42,000 free eBooks on its site and over 100,000 eBooks through its affiliated organizations after 40 years. Hailed as the first digital library, Project Gutenberg has played an important role in the construction and development of digital libraries. This paper explored the project based on its background, collection organization, services and technologies features. Authors' comments were also given.
Digital library, Project Gutenberg, Free E-book collection, Digitization collection
10.3772/j.issn.1673—2286.2013.04.008
劉燕權(quán),男,博士,畢業(yè)于美國(guó)麥迪遜大學(xué)信息圖書館學(xué)院,現(xiàn)在南康涅狄格州立大學(xué)任教。他近年的出版物主要集中在數(shù)字圖書館、數(shù)字化及多媒體技術(shù)、軟件管理、國(guó)家信息基礎(chǔ)結(jié)構(gòu)、信息存儲(chǔ)、圖書館統(tǒng)計(jì)及管理等。E-mail: liuscsu@gmail.com
劉曉東,女,碩士研究生,現(xiàn)就讀于北京師范大學(xué)管理學(xué)院圖書館學(xué)專業(yè)。E-mail: bnugyliuxiaodong@126.com
2013-03-05)