吳群
(南京工程學(xué)院 圖書館,江蘇 南京 211167)
高校機(jī)構(gòu)知識(shí)庫(kù)構(gòu)架探究
吳群
(南京工程學(xué)院 圖書館,江蘇 南京 211167)
機(jī)構(gòu)知識(shí)庫(kù)是學(xué)術(shù)研究機(jī)構(gòu)依托互聯(lián)網(wǎng)而建成的一種學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫(kù),文章分析了高校建立機(jī)構(gòu)知識(shí)庫(kù)的意義及優(yōu)勢(shì),并就如何構(gòu)建高校機(jī)構(gòu)知識(shí)庫(kù)進(jìn)行探討。
機(jī)構(gòu)知識(shí)庫(kù);開放存取
1.機(jī)構(gòu)知識(shí)庫(kù)的概念
機(jī)構(gòu)知識(shí)庫(kù)(IR,Institutional Repository)是基于開放存?。∣A,Open Access)的理念,學(xué)術(shù)研究機(jī)構(gòu)依托互聯(lián)網(wǎng)將本機(jī)構(gòu)成員所產(chǎn)生的各種數(shù)字化內(nèi)容進(jìn)行收集、整理、組織、標(biāo)識(shí)、索引,以開放性和互操作性為原則,實(shí)現(xiàn)對(duì)數(shù)字學(xué)術(shù)資源的永久保存和廣泛傳播而運(yùn)行的一種信息資源管理和服務(wù)系統(tǒng)。美國(guó)SPARC資深顧問(wèn)Raym Crow則認(rèn)為機(jī)構(gòu)知識(shí)庫(kù)是收集并保存單個(gè)或數(shù)個(gè)大學(xué)、科研機(jī)構(gòu)知識(shí)資源的數(shù)字化資源集合。[1]筆者認(rèn)為,機(jī)構(gòu)知識(shí)庫(kù)是以網(wǎng)絡(luò)為依托,以收集、整理、保存、檢索和提供利用為目的,以本機(jī)構(gòu)成員在工作過(guò)程中所創(chuàng)造的各種數(shù)字化產(chǎn)品為內(nèi)容的學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫(kù)。
2.機(jī)構(gòu)知識(shí)庫(kù)的特點(diǎn)
(1)機(jī)構(gòu)性。IR的建設(shè)主體和收藏的地域界限是特定的機(jī)構(gòu),即它的建立和運(yùn)行是以機(jī)構(gòu)為軸心和主線的,在這一點(diǎn)上區(qū)別于學(xué)科或?qū)n}的知識(shí)庫(kù)。這里的機(jī)構(gòu)既可以是實(shí)體的,如一個(gè)大學(xué)或研究機(jī)構(gòu),也可以是虛擬的,如虛擬聯(lián)合實(shí)驗(yàn)室等。
(2)多樣性。由于許多IR僅提供一個(gè)學(xué)術(shù)信息交流平臺(tái),對(duì)其中具體交流的信息只有內(nèi)容質(zhì)量或格式上的限制,而沒(méi)有形式方面的限制,所以IR收藏的資源類型多樣,有正式發(fā)表的學(xué)術(shù)著作,也有尚未發(fā)表的預(yù)印本;有人文社會(huì)科學(xué)的內(nèi)容,也有自然科學(xué)的內(nèi)容。[2]從出版的形式上看,IR主要包括機(jī)構(gòu)內(nèi)產(chǎn)生的科學(xué)成果如:學(xué)術(shù)報(bào)告、技術(shù)報(bào)告、工作報(bào)告、學(xué)術(shù)論文、會(huì)議論文、多媒體和視聽資料、課程資料、教學(xué)課件、實(shí)驗(yàn)數(shù)據(jù)等。
(3)互操作性和開放性。這也是機(jī)構(gòu)庫(kù)的優(yōu)越性,要保證與其他機(jī)構(gòu)知識(shí)庫(kù)之間的互操作,保證知識(shí)庫(kù)中的內(nèi)容能夠被機(jī)構(gòu)之外的用戶方便地訪問(wèn)和使用,并且能夠有效地存取其他機(jī)構(gòu)的知識(shí)庫(kù)的內(nèi)容。
(4)積累性和永久性。IR中所收錄的知識(shí)資源是長(zhǎng)期保存且不斷累積的,這就保障了IR資源的完整性與系統(tǒng)性,并可永久獲取,IR以此來(lái)實(shí)現(xiàn)知識(shí)的記憶與傳承。
除了以上四點(diǎn)之外,數(shù)字化與網(wǎng)絡(luò)化、內(nèi)容的學(xué)術(shù)性、綜合性與動(dòng)態(tài)性、社區(qū)驅(qū)動(dòng)與聚集等也是機(jī)構(gòu)庫(kù)的獨(dú)特表現(xiàn)。
1.有效捕獲并永久保存數(shù)字化學(xué)術(shù)資源
高校教師與科研人員普遍運(yùn)用計(jì)算機(jī)處理各種信息,從而產(chǎn)生了大量的原生數(shù)字化學(xué)術(shù)知識(shí)產(chǎn)品,它們是各高校和科研機(jī)構(gòu)重要的學(xué)術(shù)資源。而這些學(xué)術(shù)資源大都保存在個(gè)人或者院系的電腦上,個(gè)人電腦的存儲(chǔ)容量有限,這些原生數(shù)字信息資源就會(huì)隨著時(shí)間的流逝而丟失。隨著計(jì)算機(jī)存儲(chǔ)技術(shù)的發(fā)展,若干年后,可能不為新的軟件支持,因此,需要為這些原生數(shù)字信息資源提供一個(gè)永久保存的安全場(chǎng)所。另外,把分散的學(xué)術(shù)資源有效集中起來(lái),把不同格式的數(shù)據(jù)按照統(tǒng)一標(biāo)準(zhǔn)格式進(jìn)行加工整理、集中存儲(chǔ)、統(tǒng)一管理,為以后用戶方便快捷地利用奠定基礎(chǔ)。
2.實(shí)現(xiàn)學(xué)術(shù)資源的開放獲取
在校園聯(lián)網(wǎng)的環(huán)境下,利用高校IR中豐富的教學(xué)信息資源可以提升教學(xué)效果。學(xué)生可以利用IR中的課件進(jìn)行學(xué)習(xí),教師可以通過(guò)IR進(jìn)行交流,完善教學(xué)課件和教學(xué)方法。由于各高校之間、各院系之間、各教研室、實(shí)驗(yàn)室的物理位置和科研活動(dòng)的相互獨(dú)立,造成彼此對(duì)相互之間的研究情況和研究成果互不了解,在教學(xué)、科研的溝通與交流上存在障礙。構(gòu)建IR可將各高校、各院系、各教研室、實(shí)驗(yàn)室、個(gè)體研究者的相關(guān)資料和學(xué)術(shù)研究成果存儲(chǔ)下來(lái),在一個(gè)共用的網(wǎng)絡(luò)平臺(tái)上發(fā)布,同時(shí)提供無(wú)障礙瀏覽與檢索,這樣可以進(jìn)一步促進(jìn)相互間的學(xué)術(shù)交流,提高教學(xué)質(zhì)量和科研水平。
3.?dāng)U大機(jī)構(gòu)的影響力,提升知名度
IR不僅可促進(jìn)學(xué)術(shù)交流,促進(jìn)學(xué)術(shù)機(jī)構(gòu)教學(xué)、科研水平的提升,更為重要的是,它能展示學(xué)術(shù)機(jī)構(gòu)的綜合實(shí)力,集中反映學(xué)術(shù)機(jī)構(gòu)的科研水平,展示其在科學(xué)研究、技術(shù)應(yīng)用、教育教學(xué)、經(jīng)濟(jì)和社會(huì)發(fā)展等方面的成就,這些學(xué)術(shù)成果可以通過(guò)互聯(lián)網(wǎng)免費(fèi)下載,提高學(xué)術(shù)成果的被引用率,從而提升這個(gè)機(jī)構(gòu)的知名度。[3]對(duì)于想要提高影響力的高校來(lái)說(shuō),建立IR無(wú)疑是一個(gè)好辦法。
1.利用校內(nèi)的網(wǎng)絡(luò)資源
校園網(wǎng)是一個(gè)具有寬帶通路和交互功能的專業(yè)性局域網(wǎng),具有教學(xué)、科研、管理和通訊等功能,它使我國(guó)高等教育管理向智能化方向發(fā)展。目前我國(guó)的高校校園網(wǎng)已成為了國(guó)家信息網(wǎng)絡(luò)的重要組成部分,在學(xué)術(shù)信息資源、人力資源、研發(fā)能力等方面具有明顯的優(yōu)勢(shì)。[4]
高校的IR一般都設(shè)在校園的局域網(wǎng)內(nèi),便于高校的科研人員向本機(jī)構(gòu)提交學(xué)術(shù)研究成果以及在知識(shí)庫(kù)內(nèi)瀏覽、下載學(xué)術(shù)信息。
2.利用高校豐富的智力產(chǎn)品
高校不但是一個(gè)培養(yǎng)高級(jí)人才的機(jī)構(gòu),還是一個(gè)學(xué)術(shù)研發(fā)中心。高校內(nèi)產(chǎn)生的大量原生數(shù)字化學(xué)術(shù)知識(shí)產(chǎn)品,例如:已發(fā)表或未發(fā)表的期刊論文、學(xué)位論文、會(huì)議論文、科技報(bào)告、數(shù)據(jù)庫(kù)、重要學(xué)術(shù)會(huì)議的演示文稿、科研項(xiàng)目數(shù)據(jù)資料及具有學(xué)術(shù)價(jià)值的多媒體資料等,這些都是高校重要的學(xué)術(shù)資源。但是,這些學(xué)術(shù)資源還分散在廣大教學(xué)和科研人員手中,沒(méi)有得到系統(tǒng)、完整的保存,學(xué)術(shù)交流和應(yīng)用狀況也不盡如人意。通過(guò)建立高校IR,能為系統(tǒng)、完整地保存這些學(xué)術(shù)資源提供一個(gè)安全場(chǎng)所,完整展示其學(xué)術(shù)研究成果,并能給本校乃至全球的用戶提供一個(gè)交流與溝通的平臺(tái)。
3.利用高校圖書館豐富的數(shù)字化信息資源收集管理的經(jīng)驗(yàn)
高校圖書館員具有熟練的專業(yè)技術(shù)和獨(dú)特的專業(yè)服務(wù)意識(shí),特別是在高校數(shù)字圖書館的建設(shè)中積累了豐富的經(jīng)驗(yàn),最適合承擔(dān)IR的建設(shè)及對(duì)其內(nèi)容實(shí)施長(zhǎng)期保存的工作,能夠最有效地對(duì)知識(shí)信息進(jìn)行組織、加工、發(fā)布,其元數(shù)據(jù)標(biāo)引、各種資源的整合、各類型文獻(xiàn)信息的檢索和發(fā)布均已形成了規(guī)范。其與數(shù)據(jù)庫(kù)提供商形成的長(zhǎng)期的、全面的良性合作關(guān)系,有利于資源的整合和應(yīng)用。
1.前期準(zhǔn)備工作
首先,要考察已經(jīng)構(gòu)建IR的高校,學(xué)習(xí)他們成功的方法和經(jīng)驗(yàn),針對(duì)本機(jī)構(gòu)特點(diǎn)進(jìn)行需求分析,并調(diào)查所在高校當(dāng)前學(xué)術(shù)論著、作品的發(fā)表和存儲(chǔ)方式,計(jì)算機(jī)網(wǎng)絡(luò)及其IT設(shè)備資源狀況。其次,在全面掌握相關(guān)情況的前提下,要制定嚴(yán)密科學(xué)的IR建設(shè)規(guī)劃。在規(guī)劃中,要確立一支高水準(zhǔn)的建設(shè)管理團(tuán)隊(duì),主要包括:領(lǐng)導(dǎo)者、用戶服務(wù)人員、系統(tǒng)技術(shù)人員、法律咨詢?nèi)藛T。領(lǐng)導(dǎo)者主要負(fù)責(zé)項(xiàng)目的推進(jìn)以及任務(wù)的合理分配工作;用戶服務(wù)人員主要負(fù)責(zé)與用戶的溝通和技術(shù)支持,特別是對(duì)IR內(nèi)容提供者的技術(shù)支持,主要包括IR系統(tǒng)的用戶管理、用戶培訓(xùn)(包括圖書館員、IR內(nèi)容提供者和終端用戶的培訓(xùn))、協(xié)調(diào)管理IR內(nèi)容的提交等;系統(tǒng)技術(shù)人員主要負(fù)責(zé)IR系統(tǒng)的技術(shù)方面的工作,主要包括IR系統(tǒng)開發(fā)、各種技術(shù)問(wèn)題的管理、系統(tǒng)技術(shù)培訓(xùn)等;法律咨詢?nèi)藛T主要負(fù)責(zé)解決IR建設(shè)中的法律問(wèn)題。[5]最后,要根據(jù)IR的建設(shè)規(guī)劃明確資金的落實(shí),要取得學(xué)校領(lǐng)導(dǎo)和相關(guān)職能部門(教務(wù)處、科研處、研究生處等)的理解和支持,以保證IR建設(shè)的順利進(jìn)行。
2.內(nèi)容建設(shè)
建設(shè)IR的重點(diǎn)和難點(diǎn)就是內(nèi)容建設(shè),主要包括信息資源的收集,即內(nèi)容獲取將是困擾機(jī)構(gòu)庫(kù)發(fā)展的最大難題,科研人員與教師的參與是成功的關(guān)鍵。這就需要我們從以下幾個(gè)方面來(lái)著手,使IR的內(nèi)容建設(shè)及質(zhì)量控制有所保障。
(1)廣泛宣傳
目前國(guó)內(nèi)大部分用戶對(duì)IR還不甚了解,即使是對(duì)IR有所了解的人,同樣存在各種疑慮。因此,有必要積極宣傳,使教師與科研人員提高對(duì)IR的認(rèn)知度和認(rèn)可度。如荷蘭的“科學(xué)奶酪”項(xiàng)目,就是為了提升高校教職工對(duì)機(jī)構(gòu)知識(shí)庫(kù)的參與和認(rèn)同。我們的具體做法可如下:高??稍谛@網(wǎng)首頁(yè)設(shè)立專欄,使用戶在訪問(wèn)校園網(wǎng)站時(shí)即可了解到相關(guān)知識(shí),也可在日常的用戶培訓(xùn)、文獻(xiàn)檢索課中介紹有影響力的IR及其使用方法。
(2)內(nèi)容來(lái)源保障
加拿大的M.Kathleen Shearer指出:“資源提供者的輸入行為和機(jī)構(gòu)知識(shí)庫(kù)的利用率是決定機(jī)構(gòu)知識(shí)庫(kù)成功的兩個(gè)重要因素”,[6]可見內(nèi)容的來(lái)源是機(jī)構(gòu)知識(shí)庫(kù)內(nèi)容建設(shè)的重點(diǎn)之一,筆者認(rèn)為可通過(guò)以下三個(gè)政策措施使內(nèi)容的來(lái)源有所保障。
1)實(shí)施強(qiáng)制提交政策。通過(guò)科研處、研究生院等主要學(xué)術(shù)成果產(chǎn)出單位出臺(tái)相關(guān)強(qiáng)制提交政策:如研究生院可規(guī)定所有研究生必須向IR提交學(xué)位論文,科研處可規(guī)定所有科研人員及工作人員必須按時(shí)將科研成果及業(yè)務(wù)工作資料及時(shí)交到IR,所有科研項(xiàng)目結(jié)題必須向IR提交課題成果等。強(qiáng)制政策是在建設(shè)IR最初階段最為直接、有效的一種方式。比如,丹麥要求大學(xué)將其科學(xué)出版物都提交到丹麥的“國(guó)家科研數(shù)據(jù)庫(kù)”中;比利時(shí)的機(jī)構(gòu)倉(cāng)儲(chǔ)的倡導(dǎo)者向國(guó)會(huì)議員建議讓IR成為權(quán)威機(jī)構(gòu)決定給大學(xué)不同投資的唯一參考標(biāo)準(zhǔn)。
2)實(shí)施協(xié)助提交政策。主要應(yīng)用在學(xué)術(shù)機(jī)構(gòu)內(nèi)部,存儲(chǔ)管理機(jī)構(gòu)收集到作者的知識(shí)成果并跟作者直接聯(lián)系,獲得作者的許可,由機(jī)構(gòu)代為把作者的知識(shí)成果上傳到IR,包括知識(shí)成果的整理、格式的轉(zhuǎn)換、提交的程序完成等。
3)實(shí)施自愿提交政策。用戶通過(guò)“自存檔”形式將自己的研究成果通過(guò)IR提交平臺(tái),提交到本機(jī)構(gòu)知識(shí)庫(kù),并且對(duì)研究成果進(jìn)行元數(shù)據(jù)標(biāo)引??梢宰杂傻叵驇?kù)里提交自己有價(jià)值的學(xué)術(shù)成果,并可以免費(fèi)在庫(kù)中檢索和下載其他用戶的文章,也可以對(duì)文章發(fā)表自己的看法。
(3)內(nèi)容質(zhì)量保障
在構(gòu)建IR過(guò)程中為了避免毫無(wú)價(jià)值的信息混入機(jī)構(gòu)知識(shí)庫(kù)中,影響IR主體的參與,必須建立包括內(nèi)容質(zhì)量和元數(shù)據(jù)質(zhì)量在內(nèi)的IR質(zhì)量控制機(jī)制,并對(duì)不同類型的信息資源有不同的質(zhì)量評(píng)定方法。如在院系中選擇學(xué)科專家組成審查小組進(jìn)行實(shí)質(zhì)內(nèi)容審查。建立校內(nèi)成果專家評(píng)審或同行評(píng)議制度,確保IR的學(xué)術(shù)質(zhì)量。
(4)數(shù)據(jù)標(biāo)準(zhǔn)化保障
標(biāo)準(zhǔn)規(guī)范是IR建設(shè)的生命,IR建設(shè)者應(yīng)根據(jù)不同提交方式設(shè)專人(學(xué)科館員、院系聯(lián)絡(luò)人)審查元數(shù)據(jù),并完善提交表單設(shè)計(jì),如可增設(shè)分類表和主題詞表鏈接、實(shí)時(shí)給出反饋信息和修正建議等。
3.構(gòu)建工具及技術(shù)
根據(jù)國(guó)際組織OSI(Open Society Institute)提供的一份指南,目前比較成熟的IR軟件主要有DSpace、Eprints、Fedora等。這些軟件都可以免費(fèi)下載、升級(jí)和重新分發(fā),并且嚴(yán)格遵循OAI元數(shù)據(jù)收割協(xié)議OAI-PMH2.0版。[7]
DSpace是一個(gè)開放源碼的軟件平臺(tái),由麻省理工學(xué)院圖書館(MIT)和惠普實(shí)驗(yàn)室(HP)聯(lián)合開發(fā),最新版本為DSpace1.2。DSpace的代碼均用Java語(yǔ)言編寫,可以運(yùn)行于所有UNIX系統(tǒng),采用對(duì)象—關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)PostgreSOL管理相關(guān)數(shù)據(jù),使用DC元數(shù)據(jù)標(biāo)準(zhǔn),且具有完備的元數(shù)據(jù)體系,包括管理元數(shù)據(jù)、結(jié)構(gòu)元數(shù)據(jù)和描述元數(shù)據(jù)。DSpace有三個(gè)界面,分別服務(wù)于系統(tǒng)管理員、資源提交者和查找信息的終端用戶,具有很強(qiáng)的靈活性和可定制性。目前已有51個(gè)國(guó)家的307家機(jī)構(gòu)使用DSpace系統(tǒng)。我國(guó)廈門大學(xué)圖書館、浙江大學(xué)圖書館、香港大學(xué)等機(jī)構(gòu)正在使用該系統(tǒng)構(gòu)建自己的IR。
Eprints是最早的IR構(gòu)建工具,也是第一個(gè)遵循OAI協(xié)議的IR軟件,由英國(guó)南安普頓大學(xué)開發(fā),最新版本為Eprints2.3。Eprints代碼用Perl語(yǔ)言編寫,運(yùn)行于Linux、GNU或Solaris系統(tǒng),采用MySQL數(shù)據(jù)庫(kù)管理系統(tǒng),它的元數(shù)據(jù)格式也是DC。Eprints可自動(dòng)完成提交資源的完整性檢驗(yàn),并備有緩沖區(qū),使提交的資源在正式進(jìn)入知識(shí)庫(kù)前受到編輯的檢驗(yàn)。目前已有248個(gè)知識(shí)庫(kù)使用Eprints軟件,Eprints成為眾多IR軟件系統(tǒng)中使用最多、分布最廣的軟件。
Fedora系統(tǒng)由弗吉尼亞大學(xué)和康奈爾大學(xué)共同開發(fā)實(shí)施,當(dāng)前版本為Fedora TM2.0。Fedora代碼是用Java語(yǔ)言編寫, 運(yùn)行于 Windows2000、NT、XP、Solaris和 Linux系統(tǒng),也是采用MySQL數(shù)據(jù)庫(kù)管理系統(tǒng)。Fedora的內(nèi)容均是使用元數(shù)據(jù)編碼與傳輸標(biāo)準(zhǔn) (METS)的擴(kuò)展版本存儲(chǔ)的,每個(gè)對(duì)象都有一個(gè)DC記錄,可以供OAI收割器獲取元數(shù)據(jù)。
[1]李楓林,趙雪芹,胡吉明.機(jī)構(gòu)知識(shí)庫(kù):開放獲取的有效實(shí)現(xiàn)形式[J].情報(bào)雜志,2007(6).
[2]薛青林.國(guó)內(nèi)機(jī)構(gòu)知識(shí)庫(kù)建設(shè)的問(wèn)題和對(duì)策[J].圖書館建設(shè),2009(5).
[3]袁順波,董文鴛,李賓.西方機(jī)構(gòu)庫(kù)研究的現(xiàn)狀及啟示[J].圖書館雜志,2006(8).
[4]楊勇,張建中.機(jī)構(gòu)知識(shí)庫(kù)的構(gòu)建與高校圖書館的工作創(chuàng)新[J].圖書館理論與實(shí)踐,2009(1).
[5]連書勤,熊莉君.試論如何構(gòu)建高校機(jī)構(gòu)知識(shí)庫(kù)[J].科技廣場(chǎng),2009(6).
[6]宛玲,蘇娜,厲志紅.大學(xué)機(jī)構(gòu)知識(shí)庫(kù)組織管理問(wèn)題研究[J].圖書情報(bào)工作,2008(4).
[7]徐速.機(jī)構(gòu)知識(shí)庫(kù)[J].圖書館理論與實(shí)踐,2008(1).
(編輯:金冉)
G258.6
A
1673-8454(2011)05-0030-03