張 雪 周 毅
(蘇州大學(xué)社會學(xué)院,江蘇蘇州 215123)
網(wǎng)絡(luò)全球信息環(huán)境的引入掀起了公共記憶機(jī)構(gòu)信息資源建設(shè)熱潮,這一熱潮下,印本與數(shù)字資源的利用率和公共信息服務(wù)機(jī)構(gòu)的空間經(jīng)費(fèi)預(yù)算重組分配之間的矛盾和用戶需求多樣化和圖書館預(yù)算有限的矛盾進(jìn)一步激化,圖書館達(dá)成了資源建設(shè)的合作共識——基于館藏資源的共建共享。20世紀(jì)90年代末,數(shù)字圖書館工程、中國高等教育文獻(xiàn)保障體系(CALIS)等合作項目推動了我國信息資源建設(shè),其具體內(nèi)容包括:建設(shè)特色館藏體系;實施網(wǎng)絡(luò)聯(lián)合編目;開展館際資源互借;開發(fā)聯(lián)機(jī)公共檢索系統(tǒng);合作進(jìn)行館藏資源數(shù)字化;協(xié)調(diào)書刊文獻(xiàn)的訂購等內(nèi)容,基本形成公共、高校、科研三大圖書館系統(tǒng)三足鼎立的文獻(xiàn)信息資源共建共享體系[1]。
現(xiàn)代信息技術(shù)推動下,圖書館信息資源建設(shè)進(jìn)入了一個由量變到質(zhì)變的跨時空的信息資源共建共享階段,但仍然存在問題。從資源共建的角度來看,各館資源的建設(shè)思路以自身館藏為中心,沿著“大而全”的建設(shè)思路展開建設(shè),資源共建下缺乏跨地域、跨系統(tǒng)下印本和數(shù)字資源全局系統(tǒng)下的規(guī)劃和組織,忽視了資源在整個資源體系中的分散和冗余,富有特色和重點主題的數(shù)字資源被反復(fù)建設(shè)。此外,印本資源和數(shù)字資源之間的矛盾依然是圖書館資源購置和管理的難題。據(jù)統(tǒng)計,104所211工程重點建設(shè)大學(xué)中,Spring Link、PQDD學(xué)位論文全文數(shù)據(jù)庫、EBSCO Host的引入率分別達(dá)到86%、61%和49%。中文學(xué)術(shù)期刊全文數(shù)據(jù)庫、中文科技期刊數(shù)據(jù)庫和萬方數(shù)據(jù)資源系統(tǒng)的引入率達(dá)到100%、89%和54%[2]。不同館內(nèi)的自建特色數(shù)據(jù)庫內(nèi)容存在交叉重復(fù),以家譜專題數(shù)據(jù)庫為例,27%的公共圖書館將家譜數(shù)據(jù)庫作為特色數(shù)據(jù)庫建設(shè)內(nèi)容[3]。此外,南開大學(xué)等高校圖書館也建設(shè)了家譜研究文獻(xiàn)數(shù)據(jù)庫以供校內(nèi)研究使用。單個館內(nèi)的特色數(shù)據(jù)庫之間也存在內(nèi)容的交叉,例如浙江圖書館的35個自建特色數(shù)據(jù)庫中,內(nèi)容重復(fù)和交叉的數(shù)據(jù)庫比例高達(dá)34%。
從資源共享的角度來看,資源共享專注于系統(tǒng)內(nèi)部已有資源的共享傳遞,且系統(tǒng)內(nèi)部的資源共享范圍受限,缺乏同圖書館系統(tǒng)以外的資源聯(lián)結(jié)以及對已有資源深層次的內(nèi)容挖掘。資源共享采用“限制+授權(quán)”的服務(wù)模式,用戶只能在校內(nèi)或校外的授權(quán)IP范圍內(nèi)訪問資源,34家有自建特色數(shù)據(jù)庫的雙一流高校圖書館中,校外不可訪問的圖書館占比高達(dá)76.47%[4]。元數(shù)據(jù)不完備、更新慢、揭示內(nèi)容有限導(dǎo)致機(jī)構(gòu)共享和利用元數(shù)據(jù)的動力匱乏。CALIS聯(lián)機(jī)編目中心的2015—2018年的數(shù)據(jù)指出,僅40%的成員圖書館參與上傳和下載書目數(shù)據(jù),核心活躍成員圖書館僅占8%。書目元數(shù)據(jù)按年更新,更新較慢;揭示內(nèi)容以印本資源為主,且揭示內(nèi)容多為描述文獻(xiàn)資料的內(nèi)容本身和內(nèi)容表現(xiàn)的館藏內(nèi)容信息。
館藏資源的重復(fù)建設(shè)和低效共享直指共建共享的合作效益低下,隨著資源經(jīng)費(fèi)上漲、圖書館經(jīng)費(fèi)緊缺、管理成本上升等問題弊端日益突出。2017年7月《“十三五”時期全國公共圖書館事業(yè)發(fā)展規(guī)劃》從國家文獻(xiàn)信息資源體系化的戰(zhàn)略角度指出加強(qiáng)各級公共圖書館與其它系統(tǒng)圖書館間資源的共建共享,完善文獻(xiàn)資源的協(xié)調(diào)與共享機(jī)制。柯平教授在《圖書館未來2035與“十四五”規(guī)劃編制》中也指出,空間和資源一體化是未來圖書館行業(yè)的重要戰(zhàn)略[5]??臻g資源化意味著打破空間對于資源的限制,離不開當(dāng)下資源共建共享的探索。
2012年OCLC提出的集體館藏為提升資源共建共享效益提供了新思路,利用已有基礎(chǔ)數(shù)據(jù)形成全系統(tǒng)下的館藏視圖,不同角度的數(shù)據(jù)整合和挖掘驅(qū)動了集體館藏資源多角度的優(yōu)化配置并兼顧每個成員圖書館利益的特殊化和最優(yōu)化,幫助以效能作為牽引探尋資源建設(shè)合作的最佳路徑以及對合作對象[6]?,F(xiàn)有研究針對共建共享的低效合作展開探討,并提出以下建議:①加強(qiáng)數(shù)字資源建設(shè)的選題和整體規(guī)劃,建設(shè)全國特色資源的查重制度[7]、統(tǒng)籌協(xié)調(diào)制度避免重復(fù)建設(shè)[8];②對已有資源進(jìn)行縱向整合和橫向共享,突出資源的特色化和專業(yè)化[9];③加強(qiáng)資源標(biāo)準(zhǔn)規(guī)范建設(shè),建立統(tǒng)一共建共享平臺[10];④是強(qiáng)化館藏資源的揭示深度和廣度,增加館藏資源揭示元數(shù)據(jù)的細(xì)粒度和質(zhì)量[11][12];⑤健全信息資源共享政策保障、傳遞交流監(jiān)督保障等機(jī)制[13]。上述建議圍繞圖書館間共建和共享提出,此外有學(xué)者針對合作效益低下的問題提出以數(shù)據(jù)共享為合作基礎(chǔ),基于數(shù)據(jù)實現(xiàn)精準(zhǔn)的資源調(diào)度。上述建議為本文提供了啟發(fā),但現(xiàn)有研究存在兩個問題:一是現(xiàn)有建議更多停留在理論層面,如何從實踐層面聯(lián)結(jié)分布分散的資源并針對區(qū)域、館內(nèi)和用戶的需求實現(xiàn)資源的精準(zhǔn)調(diào)度等相關(guān)內(nèi)容缺乏細(xì)致和深入地探究;二是數(shù)字資源的建設(shè)和利用緊密相連,現(xiàn)有研究多從共建或共用的角度單獨闡述,如何將建和用緊密相連,并解決目前合作中建用脫節(jié)的相關(guān)研究仍然欠缺。
因此,需要研究和解決以下問題:①集體館藏下的資源共建共享如何展開,具有什么特點?②集體館藏下的資源建設(shè)能夠為我國圖書館信息資源建設(shè)提供何種借鑒?為了回答上述問題,研究審思集體館藏背后的資源建設(shè),以期為我國協(xié)同合作下的信息資源建設(shè)提供有益洞見。
集體館藏是聯(lián)盟環(huán)境下多個圖書館共同協(xié)作管理的館藏。相比其它館藏具有4個屬性:①明確承諾:承諾以更協(xié)調(diào)的管理、構(gòu)建和共享館藏;②最佳分布館藏:基于自主館藏發(fā)展層面,有目的地跨圖書館協(xié)調(diào)館藏;③高效的網(wǎng)絡(luò)實現(xiàn):將已有的資源和服務(wù)無縫銜接,幫助用戶輕松發(fā)現(xiàn)并交付資源;④系統(tǒng)全局意識:概覽整個館藏及分布方式,良好掌握聯(lián)盟館藏和資源流量。
計算機(jī)的出現(xiàn)改變?nèi)斯す芾眇^藏資源的方式,MARC格式對題名、責(zé)任者等8大著錄項目進(jìn)行編目,產(chǎn)生的書目元數(shù)據(jù)用于圖書館系統(tǒng)內(nèi)部的資源的描述、存儲和檢索,數(shù)據(jù)驅(qū)動的意識初步顯現(xiàn)。但這種編目的方式具有以下缺點:①以文獻(xiàn)為中心的扁平化結(jié)構(gòu);②MARC記錄僅支持Z39.50和SRU/W等檢索協(xié)議,僅適用于圖書館系統(tǒng)。機(jī)器可讀編目隨著信息獲取途徑的多樣化和圖書館職能的轉(zhuǎn)變弊端日益突出。
集體館藏改變了機(jī)器可讀編目扁平化的資源表述方式,采用Web標(biāo)準(zhǔn)的XML和RDF原生格式描述資源。如圖1,單位XML文件采用Schema語言描述文件中的各種元素,這種描述方式強(qiáng)調(diào)書目記錄作為一個實體(資源),通過書目記錄的單個數(shù)據(jù)元素強(qiáng)調(diào)書目記錄描述的實體、關(guān)系和屬性。單位資源看作一個本體,被賦予一個OCLC編號作為事物的URI以證明其唯一性[14],沿作者、項目、位置、事件、組織、概念等多個維度重新組織內(nèi)容,描述遵循FAST、VIAF、DOI、LC Linked Data Service等詞表,通過詞匯表相互映射,在單語言或多語言環(huán)境下定義實體—關(guān)系模型,一個概念標(biāo)簽就能檢索具有相同語義的概念描述的所有記錄。
圖1 集體館藏模式下單位資源的關(guān)聯(lián)數(shù)據(jù)模型圖
館藏資源量化后形成資源視圖,具有4個特點:①單位資源的全系統(tǒng)視角。機(jī)器可讀編目受限于文獻(xiàn)的類型、版本,資源描述針對某一特定文獻(xiàn),并且以單個館藏為視角進(jìn)行記錄。集體館藏下模式,圍繞某一特定內(nèi)容,不同文獻(xiàn)類型、版本、作者以及相關(guān)內(nèi)容都會作為概念標(biāo)簽并且支持檢索,形成全系統(tǒng)視角下的館藏視圖;②實體—關(guān)系的靈活呈現(xiàn)。機(jī)器可讀編目僅簡單呈現(xiàn)描述內(nèi)容和描述對象之間的關(guān)系,換句話說,僅呈現(xiàn)了資源本身以及資源和資源所屬機(jī)構(gòu)的關(guān)系。集體館藏模式下,資源實體通過不同概念標(biāo)簽表述,相同概念標(biāo)簽的內(nèi)容匹配后反映出不同實體之間的關(guān)系[15]; ③多維度的資源視角。傳統(tǒng)以資源為中心的視角下,OCLC編號是文獻(xiàn)內(nèi)容的檢索途徑,集體館藏模式下,通過對人物、版本等不同維度下概念標(biāo)簽的搜索,能夠從其它資源視角獲取內(nèi)容;④非庫環(huán)境下的資源鏈接。資源描述遵循多個詞表,其中包括外部資源LCSH、DBpedia維基百科的語義網(wǎng)絡(luò)等,支持資源在非庫環(huán)境下的資源交換。
集體館藏模式下圖書館的環(huán)境、館藏、利用等數(shù)據(jù)匯聚成動態(tài)的館藏視圖,利用商業(yè)產(chǎn)品同圖書館的合作儀表盤功能基于館藏數(shù)據(jù)的組合與可視化,基于館藏數(shù)據(jù)分析與決策解決了共建共享什么和同誰共建共享兩個問題。
2.2.1 基于館藏現(xiàn)狀探尋建設(shè)方向
基于worldcat對館藏進(jìn)行重疊性分析幫助成員判斷不同館藏、不同主題以及不同資源在全局系統(tǒng)下的冗余程度和區(qū)域覆蓋狀況,基于館藏的優(yōu)劣勢展開建設(shè)?;^藏資源的重疊性沿著內(nèi)部重疊和外部重疊兩個方面展開,根據(jù)某一出版物不同格式的擁有量及分布場景判斷資源在整個系統(tǒng)內(nèi)部的重疊程度;在外部重疊方面,同Worldcat、Hathitrust等權(quán)威的數(shù)據(jù)集合進(jìn)行比較,得出知識內(nèi)容在同行機(jī)構(gòu)中的持有狀況?;谥丿B性的分析可以得出系統(tǒng)館藏的重疊性和獨特性。例如SACAP項目與會者基于已有的館藏資源分析取消了52個位于“核心區(qū)域”中間地帶的主題類別,釋放的資金用于建立186個新的主題。這些主題涵蓋了新的收藏領(lǐng)域并且涉及的內(nèi)容在全國范圍內(nèi)并未得到較全面的覆蓋[16]。
基于ILL系統(tǒng)和worldcat收集館內(nèi)資源借閱、館際互借等系統(tǒng)下資源流通數(shù)據(jù),將館藏、流通和館際互借數(shù)據(jù)結(jié)合,合理估計圖書館提供和擁有的信息資源的相對收益,基于用戶和區(qū)域范圍內(nèi)的潛在興趣點和需求點展開館藏建設(shè)。主要通過以下三個指標(biāo)進(jìn)行評估[17]:
①館藏持有百分比=特定學(xué)科館藏持有數(shù)量/同一地區(qū)館藏特定學(xué)科館藏持有數(shù)量。
基于worldcat和本地目錄仔細(xì)分析特定學(xué)科領(lǐng)域的館藏持有情況。
②流通使用百分比(PEU)=特定學(xué)科的流通百分比/特定學(xué)科館藏持有百分比。
根據(jù)特定學(xué)科領(lǐng)域的藏書和發(fā)行量評估材料的預(yù)期使用水平。
③借閱與館藏百分比(RBH)=特定學(xué)科的館際互借比/所在地區(qū)館藏比。
評估特定學(xué)科領(lǐng)域的館藏與超出館藏獲取嘗試之間的相關(guān)性。
通過計算特定主題館藏持有的平均值和標(biāo)準(zhǔn)偏差并同PEU和RBH結(jié)果進(jìn)行比較,得出以下四種結(jié)果,當(dāng)PEU和RBH超過館藏持有系數(shù),該學(xué)科領(lǐng)域的館藏材料被過度使用,應(yīng)增加對該學(xué)科領(lǐng)域的資源采購并考慮增加訪問途徑。當(dāng)PEU超過館藏持有系數(shù)而RBH低于該系數(shù),該學(xué)科領(lǐng)域的館藏材料被過度使用,但是現(xiàn)有的館際借閱功能能夠滿足用戶需求,這種情況下,單位館藏應(yīng)增加對該學(xué)科領(lǐng)域的資源采購。當(dāng)PEU低于館藏持有系數(shù)而RBH高于該系數(shù),該學(xué)科領(lǐng)域的館藏未被充分利用,也不符合用戶需求,單位館藏可以擴(kuò)大該領(lǐng)域的館藏并且保持材料的可獲取。當(dāng)PEU和RBH低于館藏持有系數(shù),該學(xué)科領(lǐng)域的館藏材料足夠滿足現(xiàn)有用戶需要,并且需求較少,單位館藏應(yīng)考慮減少購買或者采用其他獲取途徑以釋放館藏空間。
2.2.2 以效能為牽引探尋合作路徑
參與成員的存儲地區(qū)租用成本、存儲容量、存儲設(shè)備數(shù)量、存儲環(huán)境條件、風(fēng)險防范設(shè)備、人員配備、數(shù)字化掃描設(shè)備、數(shù)字化效率等內(nèi)容量化后匯總至決策層,洞察各成員圖書館的集合優(yōu)勢和弱點從側(cè)面反映出成員圖書館在資源數(shù)字化各環(huán)節(jié)中最大參與程度。SACOOP項目中圍繞南亞國家多語種館藏材料展開合作,參與成員參與了數(shù)據(jù)收集的調(diào)查,這一調(diào)查指出當(dāng)前資源的積壓程度和各機(jī)構(gòu)的潛力[18〗。在這一基礎(chǔ)上推動合作,機(jī)構(gòu)之間的合作潛力。其中杜克和伊利諾伊大學(xué)就南非的非傳統(tǒng)材料展開合作,伊利諾伊香檳分校收集了超過1200件由印地語、孟加拉語等南亞語種描繪的漫畫和圖冊故事,杜克大學(xué)圖書館收集了幾百份街頭和市集文學(xué),包括大幅報紙、暢銷故事書、黃色書刊、唱片、寺廟文學(xué)等珍貴材料[19〗。二者除了在合作下繼續(xù)深入和擴(kuò)大該領(lǐng)域的收藏材料,同時嘗試建立非傳統(tǒng)材料的語料庫,加強(qiáng)對非傳統(tǒng)材料的學(xué)術(shù)研究。
表1 SACOOP合作機(jī)構(gòu)調(diào)查表
基于數(shù)據(jù)驅(qū)動的資源共建共享效益體現(xiàn)在三個方面:集體授權(quán)許可的成本效益、印本資源集成管理和維護(hù)的成本效益以及特色館藏資源的互補(bǔ)效益。
2.3.1 集體授權(quán)許可下資源購置的成本效益
圖書館基于集體授權(quán)許可協(xié)議同資源提供商談判并以較低折扣購置館藏資源。資源服務(wù)商憑借壟斷地位采用打包銷售、數(shù)據(jù)庫拆分、漲價等營銷手段進(jìn)行資源訛詐,并制定許可協(xié)議限制控制資源的利用和共享[20]。圖書館在資源選擇和審查中發(fā)揮的作用最小化,在資源購置上被迫投入更多經(jīng)費(fèi)。集體館藏模式下,追蹤成員圖書館的電子資源購入、需求狀況、交付操作、使用限制等情況繪制全系統(tǒng)下的數(shù)字資源授權(quán)狀況圖,通過計算衡量單位或合作區(qū)域的成員對某一特定專題或期刊內(nèi)容的需求程度,創(chuàng)建最大限度的共享電子內(nèi)容預(yù)算,針對授權(quán)用戶、資源開放獲取、價格定制等制定了許可協(xié)議。聯(lián)盟作為授權(quán)代表以優(yōu)勢地位同內(nèi)容提供商談判,基于參與庫的數(shù)量、總體支出或其他創(chuàng)建聯(lián)盟優(yōu)勢的組指標(biāo)享受更高級別的折扣。BTAA的資源購置的折扣目標(biāo)通常為降價65%,是個別學(xué)校實際購買的折扣的50%[21]。據(jù)BATT的許可評估報告,集體許可授權(quán)幫助BTAA在2010年節(jié)省了811183美元,這一金額逐年上升并在2018年達(dá)到2258687美元,表2是BTAA 2010年至2018年集體授權(quán)許可節(jié)省費(fèi)用表[22]。
表2 BTAA集體授權(quán)許可節(jié)省費(fèi)用
集體授權(quán)許可的另一優(yōu)點是打破資源提供商對資源的共享限制,單位成員的資源利用范圍從單個館藏擴(kuò)大到整個系統(tǒng)。傳統(tǒng)許可協(xié)議中資源購置是圖書館從資源提供商獲取資源的唯一途徑。集體許可允許系統(tǒng)范圍內(nèi)資源的共享和利用,如俄亥俄在線訂閱的期刊包為大學(xué)圖書館的用戶提供了平均4倍以上的圖書,文理學(xué)院的在線訂閱期刊增加了20倍[23]。成員通過共享獲取資源而無需重復(fù)購置其它館已有的館藏內(nèi)容,資源購置成本降低。
2.3.2 印本資源集成管理和維護(hù)的成本效益
低使用率印本資源集中存儲降低資源管理和維護(hù)的成本。UKRR一項評估指出2015年英國高等教育圖書館將短缺45億個書架。圖書館館藏空間壓力日益增加,為此,成員圖書館投資了高密度存儲設(shè)施作為紙本共享倉儲,其存儲容量是傳統(tǒng)圖書館書架的15-20倍,有利于轉(zhuǎn)移圖書館的低利用率文獻(xiàn)的管理壓力。15年UKRR處理了近13萬米的印刷期刊材料,釋放了36個圖書館的近9.8萬米的線性貨架空間。集中存儲的印本文獻(xiàn)通過數(shù)字副本傳遞的方式維持其可用性,釋放的館藏除了為富有特色的印本資源提供存儲空間以外還可以為學(xué)生提供研究空間,例如倫敦瑪麗女王大學(xué)釋放的館藏空間被改造為227個學(xué)習(xí)空間,這些空間被改造為研究人員閱讀室、PGT閱讀室和電腦室。
來源于多機(jī)構(gòu)的印本資源在物理上集中整合形成整體化的物理備份體系,其長期管理和維護(hù)成本降低。印本館藏經(jīng)過風(fēng)險評級集中存儲于對應(yīng)館藏保護(hù)條件的紙本共享倉儲,紙本資源的集中存儲分?jǐn)偳鍧?、維修、電力(供暖和制冷)、人員配備和流通費(fèi)用、建筑空間的攤銷建筑費(fèi)用,同每卷4.26美元的開放書庫藏書相比,集體館藏每卷成本在0.86美元,每卷書每年的花費(fèi)相差3.4美元[24],按照CHEMS報告提出的圖書館節(jié)省經(jīng)費(fèi)的計算方法,1m2每年可以節(jié)省191英鎊(1m2=6.6米),截至2018年,UKRR在印本資源的物理管理費(fèi)用上累計節(jié)省1714.3萬英鎊,可以看到,這種物理集體存儲方式產(chǎn)生的成本效益十分龐大。
2.3.3 特色館藏資源的互補(bǔ)效益
傳統(tǒng)信息服務(wù)機(jī)構(gòu)意識到僅靠自身資源和能力不足以適應(yīng)外部環(huán)境的變化,集體館藏模式下,成員間的合作基于創(chuàng)造價值的優(yōu)勢和劣勢展開合作。特色館藏資源互補(bǔ)是互補(bǔ)效益的直接凸顯。以差異化館藏建設(shè)為核心,經(jīng)過館藏量化分析具有各館藏主題的多樣性和相對優(yōu)勢,其中系統(tǒng)范圍內(nèi)覆蓋率低、具有地域文化特色的資源成為館藏建設(shè)的重點,這些內(nèi)容經(jīng)過數(shù)字化上傳至合作項目網(wǎng)站并提供跨所有格式和集合的一站式檢索。大英圖書館和參與圖書館確保了近3萬種期刊的借閱和保存副本的保留,其中8000種期刊中的近1萬卷填補(bǔ)了大英圖書館自身借閱的空白。其中超過16000卷是稀缺的,處理的所有期刊中,近40%的期刊僅有一個參與圖書館持有。這些內(nèi)容可以通過數(shù)字化副本傳遞的方式在全系統(tǒng)范圍內(nèi)共享。
互補(bǔ)式合作下,圖書館能夠?qū)⒂邢薜馁Y源投入到最具價值創(chuàng)造潛力的館藏內(nèi)容上,差異化的館藏建設(shè)加深了某一資源在系統(tǒng)范圍下開發(fā)與利用的深度。同時,各成員館借助網(wǎng)絡(luò)通過數(shù)字副本傳遞的方式彌補(bǔ)自身資源的不足,地理和空間分布各異的特色資源通過網(wǎng)絡(luò)聯(lián)結(jié)形成了一張巨大的資源網(wǎng)絡(luò),擴(kuò)寬了資源獲取廣度,BTAA的Uborrow服務(wù)提供了從中西部15所大學(xué)圖書館和研究圖書館中心收集的超過9000萬本書,是單個館藏提供內(nèi)容的20多倍[25],單位特色館藏優(yōu)勢在資源網(wǎng)絡(luò)上的效益不斷放大。
國際競爭下各國對于信息資源的搶奪日益激烈,國外資源掣肘必然會影響到國內(nèi)的信息資源安全,為此,圖書館作為公共信息服務(wù)機(jī)構(gòu)必須要強(qiáng)化信息資源的戰(zhàn)略支撐價值。對于信息資源來說,首先,信息資源不再是“圖書館系統(tǒng)內(nèi)的信息資源”,Web2.0應(yīng)用由于其便捷性、更新迅速等優(yōu)勢成為用戶獲取信息資源的首選,這些應(yīng)用的出現(xiàn)推動信息資源的產(chǎn)生分布呈現(xiàn)出分散性特征,與此同時,用戶也飽受信息資源質(zhì)量參差不齊的困擾。圖書館作為公共信息服務(wù)機(jī)構(gòu),其信息資源具有權(quán)威性,館藏信息資源同搜索引擎等其它來源的信息資源充分結(jié)合,通過高質(zhì)量和權(quán)威的數(shù)據(jù)資源召回用戶。其次,信息資源不再是圖書、期刊等內(nèi)容,同時也應(yīng)該包括載荷這些內(nèi)容的元數(shù)據(jù)。元數(shù)據(jù)的重要性不僅體現(xiàn)在其對于資源的揭示、著錄以便于資源后續(xù)的檢索和管理,從另外一個角度看,現(xiàn)有的資源研究尤其是圖像、音視頻資源,基于語料庫的研究有助于查找和建立資源之間的聯(lián)系,而這些語料庫的建立同元數(shù)據(jù)息息相關(guān)。信息資源的共建共享中不僅應(yīng)該注重現(xiàn)有的文獻(xiàn)資源的共建共享,同時也應(yīng)實現(xiàn)文獻(xiàn)資源背后的元數(shù)據(jù)資源建設(shè)實時同步。
對于圖書館來說,圖書館的角色定位應(yīng)從信息資源的管理者和提供者轉(zhuǎn)向資源的開發(fā)與利用,專注于如何在現(xiàn)有資源的管理和擁有的基礎(chǔ)上強(qiáng)化資源的價值,建立具有館藏預(yù)識性潛力的穩(wěn)健館藏發(fā)展戰(zhàn)略。當(dāng)前我國已經(jīng)基本形成三大信息資源共建共享系統(tǒng),各機(jī)構(gòu)基本具備資源共建共享的意識,下一階段的信息資源建設(shè)不應(yīng)該再圍繞圖書館這一資源豎井,而是基于整個資源體系的薄弱點戰(zhàn)略性地投入建設(shè),從服務(wù)需求的戰(zhàn)略高度考察“可以有什么信息資源”“需要什么信息資源”“還需要什么信息資源”“能否一直擁有這些信息資源”等問題,而不僅僅是“有什么”和“有多少”的問題。
物理分散的成員館的資源層、管理層和應(yīng)用層的數(shù)據(jù)被集成形成系統(tǒng)范圍下館藏全局視圖,資源的規(guī)模和范圍被清晰描繪出來。數(shù)據(jù)基礎(chǔ)越全面詳實,數(shù)據(jù)賦能下合作效益的顯性化越明顯,主要解決了以下3個問題:
(1)數(shù)字資源和印本資源的失衡
21世紀(jì)網(wǎng)絡(luò)環(huán)境中,信息時代激化了數(shù)字資源的高利用率以及低廉的管理成本同低利用率和高管理成本的印刷品之間的矛盾,圖書館館藏普遍面臨著超載狀態(tài),臨界范圍成為圖書館在進(jìn)行信息資源建設(shè)時不得不面臨的問題[26]。集體館藏平衡了印刷品和數(shù)字資源之間的關(guān)系,特定學(xué)科領(lǐng)域或單一館藏量化后在全局系統(tǒng)中呈現(xiàn),幫助圖書館衡量資源的利用價值和開發(fā)維護(hù)成本,將有限的經(jīng)費(fèi)和空間價值最大化。低利用率或稀有且易破壞的印刷資源被集中存儲于共享印本存儲庫,釋放了館藏空間壓力并節(jié)省管理成本,節(jié)省經(jīng)費(fèi)被投入更具價值潛力的資源建設(shè)中。與此同時,被集中存儲的資源以數(shù)字副本的形式維持其可用性,經(jīng)過數(shù)字化處理形成數(shù)字副本通過統(tǒng)一檢索平臺獲取,元數(shù)據(jù)上傳至worldcat等地方供資源查詢、統(tǒng)計與學(xué)術(shù)研究。
(2)館藏重復(fù)建設(shè)
沿著作者、主題等維度量化資源形成全局系統(tǒng)下的資源視圖,單位出版物的雙重格式數(shù)量以及存儲分布在全局視圖下呈現(xiàn),幫助判斷某一主題在全局系統(tǒng)下的冗余程度和區(qū)域覆蓋狀況,洞察各成員圖書館的集合優(yōu)勢和弱點。利用智能儀表盤基于館藏數(shù)據(jù)分析評估館藏價值和潛力,針對性地展開建設(shè)。如華盛頓大學(xué)將館藏狀況同谷歌圖書數(shù)字化項目進(jìn)行比較,發(fā)現(xiàn)近40萬份作品沒有包含在數(shù)字化項目內(nèi),基于worldcat的書目記錄進(jìn)行重疊性分析,剔除谷歌從其它館藏獲取的內(nèi)容以及系統(tǒng)內(nèi)部重疊性高的作品,約7000-30000冊書籍為華盛頓大學(xué)獨有,這些書籍將會成為下一步保存和數(shù)字化的目標(biāo)。
(3)低效率的“集成式”合作
目前國內(nèi)資源共建共享的合作本質(zhì)上是館際資源的“集成式”合作,即館藏資源的簡單總和,一站式檢索功能表面上是提高資源的可獲取性和可發(fā)現(xiàn)性,但是資源廣度和深度的雙擴(kuò)仍然取決于各館藏的資源擁有量,并未改變傳統(tǒng)的“大而全”的館藏理念,館際合作導(dǎo)致其合作內(nèi)容有限,多為館藏資源的合作,缺乏對技術(shù)、效率等其它優(yōu)勢之間的考量和互補(bǔ)。
集體館藏模式為機(jī)構(gòu)資源建設(shè)提供了一個新的合作方案,館藏資源的集成式合作向互補(bǔ)式合作轉(zhuǎn)換,圖書館以差異化館藏建設(shè)為核心,沿著自身優(yōu)勢縱向推動資源建設(shè),通過數(shù)字副本共享彌補(bǔ)館藏不足,這種互補(bǔ)式館藏實現(xiàn)了整個系統(tǒng)范圍下資源橫向和縱向的雙擴(kuò),實現(xiàn)有限的建設(shè)資源的最優(yōu)配置。
全系統(tǒng)下的館藏數(shù)據(jù)視圖依賴于對數(shù)據(jù)提出了更高的要求:①提高數(shù)據(jù)的完備程度,當(dāng)前館藏數(shù)據(jù)主要為描述文獻(xiàn)資料的內(nèi)容本身和內(nèi)容表現(xiàn)的館藏內(nèi)容信息,保護(hù)描述信息(確認(rèn)信息、起源信息、環(huán)境信息、固化信息)、封裝信息和內(nèi)容描述信息同樣需要進(jìn)行量化和上傳,完整揭示各層面的館藏數(shù)據(jù)才能保證館藏“全集”范圍和邊界的準(zhǔn)確性;②數(shù)據(jù)重組,提交數(shù)據(jù)通常以館藏為單位統(tǒng)計資源狀況,這些數(shù)據(jù)提交后需要經(jīng)過細(xì)化和重組深入到某一主題或者單位材料的詳細(xì)描述,揭示單位資源在館藏范圍或全局系統(tǒng)下的保障程度;③數(shù)據(jù)即時更新,館藏資源的動態(tài)更新需要及時跟蹤并在系統(tǒng)即時更新,盡管館藏數(shù)據(jù)的核查耗費(fèi)人力和物力,但這背后的效益是巨大的,例如suncat重新核查并整理了UKRR中標(biāo)題名稱改變的期刊,更新了期刊元數(shù)據(jù),Worldcat和suncat等在線聯(lián)合編目的元數(shù)據(jù)來源廣泛且權(quán)威,已經(jīng)成為圖書館機(jī)構(gòu)編目和學(xué)術(shù)研究中元數(shù)據(jù)分析的主要來源,反觀目前國內(nèi)仍然缺乏類似水平的在線聯(lián)合編目資源,CALIS等聯(lián)合目錄應(yīng)重新審查系統(tǒng)內(nèi)部各圖書館的數(shù)據(jù)來源和數(shù)據(jù)質(zhì)量,成為各館的數(shù)據(jù)內(nèi)容,提高數(shù)據(jù)質(zhì)量。
機(jī)器可讀編目采用以文獻(xiàn)為中心的扁平化結(jié)構(gòu),資源之間的關(guān)系無法凸顯,集體館藏模式下強(qiáng)調(diào)深度挖掘資源間的關(guān)系,這一關(guān)系不僅包括已顯示的關(guān)系如資源同機(jī)構(gòu)之間的關(guān)系,集體館藏通過關(guān)聯(lián)數(shù)據(jù)嘗試模擬人類借助現(xiàn)實世界的知識和經(jīng)驗建立事物之間的深度聯(lián)系。單位資源在數(shù)據(jù)視圖上顯示為多組概念標(biāo)簽組成的本體,這些概念標(biāo)簽不僅適用于LCSH等圖書館系統(tǒng)詞表,同時也適配于維基百科、谷歌等非圖書館系統(tǒng)的語義網(wǎng)絡(luò),不同本體間的部分概念標(biāo)簽匹配時,可判定二者存在隱含邏輯關(guān)系,這些關(guān)系連接不同本體形成數(shù)據(jù)軌跡,經(jīng)過技術(shù)整合繪制成資源的知識圖譜。以圖2為例,以哈姆雷特為檢索詞在谷歌上進(jìn)行檢索,左邊圖片的搜索結(jié)果包括哈姆雷特的簡介、圖片以及相關(guān)新聞,用戶需要借助已有的知識將檢索結(jié)果聯(lián)結(jié),而右邊的圖片將資源關(guān)系整合后提供給檢索者,概念標(biāo)簽通過點擊跳轉(zhuǎn)至相關(guān)網(wǎng)頁便于用戶詳細(xì)查閱。關(guān)聯(lián)數(shù)據(jù)下的知識地圖不僅能打破圖書館系統(tǒng)和非圖書館系統(tǒng)之間的資源界限,這種資源組織方式便于網(wǎng)絡(luò)信息服務(wù)公司升級圖書館的服務(wù)和功能,如XISBN Bookmarklet這種網(wǎng)絡(luò)瀏覽器插件,幫助讀者在書商網(wǎng)站上發(fā)現(xiàn)自己感興趣的書,并獲取附近收錄該書的圖書館和書店。
圖2 哈姆雷特在谷歌搜索引擎的檢索示例圖
共建共享已經(jīng)成為圖書館信息資源建設(shè)下尋求合作的主要手段,但是目前國內(nèi)資源共建共享的合作效益低下,圖書館作為信息資源建設(shè)的領(lǐng)導(dǎo)者必須要尋求高效益的合作形式。集體館藏提供了借鑒。存儲設(shè)施中的館藏內(nèi)容與不斷增長的數(shù)字語料庫聯(lián)系起來。它們受益于保留和為同一標(biāo)題提供兩種互補(bǔ)的格式,同時這些館藏數(shù)據(jù)也與其他機(jī)構(gòu)的資源建設(shè)能力指標(biāo)相連形成全系統(tǒng)下的館藏視圖。館藏視圖下,圖書館將作為共享存儲和獲取印刷和數(shù)字內(nèi)容責(zé)任的網(wǎng)絡(luò)節(jié)點,而不是收藏的獨立豎井。地方和集體的資源建設(shè)在這些要素中交叉處進(jìn)行,使用一套不斷演變的、錯綜復(fù)雜的相互關(guān)聯(lián)的規(guī)則、指導(dǎo)方針、伙伴關(guān)系和協(xié)議。如今信息資源的戰(zhàn)略性意義日益凸顯,在信息資源建設(shè)中,圖書館作為信息資源的主要支撐,應(yīng)強(qiáng)化信息資源戰(zhàn)略支撐價值、重視館藏數(shù)據(jù)的賦能潛力、深度挖掘館藏資源關(guān)系從而提升整個文獻(xiàn)體系層次的信息資源建設(shè)水平。