趙伶 郭曉?!」?/p>
[摘要]以“非金屬材料與化工專業(yè)特色數(shù)據(jù)庫”為例,從數(shù)據(jù)組織、數(shù)據(jù)采集和數(shù)據(jù)標(biāo)引幾個方面對數(shù)據(jù)庫建設(shè)中的數(shù)據(jù)質(zhì)量控制方法進行了探討。
[關(guān)鍵詞]特色數(shù)據(jù)庫;數(shù)據(jù)組織;質(zhì)量控制
1數(shù)據(jù)源采集過程的質(zhì)量控制
為保障數(shù)據(jù)庫中數(shù)據(jù)的質(zhì)量,在確定數(shù)據(jù)庫建設(shè)之前,首先需要對數(shù)據(jù)庫建設(shè)進行市場調(diào)查和分析,以保證該數(shù)據(jù)庫立項的合理性和實用性,避免造成資源與人力的浪費;而在數(shù)據(jù)采集時,則必須遵循準(zhǔn)確清晰的指導(dǎo)思想和采集原則,以形成能夠滿足數(shù)據(jù)庫用戶需求的數(shù)據(jù)資源。
1.1 數(shù)據(jù)庫建設(shè)需求分析
特色數(shù)據(jù)庫的數(shù)據(jù)資源需要體現(xiàn)特色,即專業(yè)特色、館藏特色或行業(yè)特色。作為高職院校圖書館,專業(yè)特色要體現(xiàn)本校的專業(yè)特長,有重點地選擇自己辦學(xué)歷史中專業(yè)特色突出、發(fā)展良好的建庫課題。在申請本課題前,我們通過對教育部相關(guān)信息網(wǎng)站[2]調(diào)查得知,目前開辦材料工程專業(yè)的本科院校有148所、開辦無機非金屬專業(yè)的本科院校有91所,高職院校開辦材料專業(yè)的院校有15所,中專、職高學(xué)校開辦硅酸鹽專業(yè)的有27所。各學(xué)校辦學(xué)層次和宗旨不同,擔(dān)負(fù)的教學(xué)任務(wù)不同,培養(yǎng)社會需要的人才不同,本科院校培養(yǎng)的是學(xué)術(shù)研究型、工程技術(shù)人才,高職院校培養(yǎng)的是高端技能型、應(yīng)用型人才,中職教育培養(yǎng)操作技能型人才,因此各學(xué)校對信息需要的層次、類型、專業(yè)側(cè)重點也有所不同。
高職院校的行業(yè)和職業(yè)特征非常明顯,在辦學(xué)水平不斷提高和發(fā)展的同時,逐漸形成了各個學(xué)校的特色資源。高職院校圖書館如果能對這些極具針對性、專業(yè)性的特色信息資源進行開發(fā),為用戶提供精、準(zhǔn)、新、快的信息服務(wù),滿足用戶的個性化需求,提供專業(yè)化的信息服務(wù),對學(xué)校的發(fā)展有很好的促進作用。同時,能提供專業(yè)化的特色服務(wù),也是衡量圖書館服務(wù)能力和服務(wù)水平的重要標(biāo)準(zhǔn)。
我院材料工程技術(shù)專業(yè)是學(xué)院特色專業(yè),也是四川省精品專業(yè)、國家示范高職院校重點建設(shè)專業(yè),多年來,對國家材料類專業(yè)技能型人才培養(yǎng)、行業(yè)企業(yè)技術(shù)服務(wù)、同類專業(yè)教學(xué)改革等多方面做出了積極貢獻。本課題的研究,將通過及時、準(zhǔn)確的信息提供,促進專業(yè)建設(shè)和發(fā)展。因此圖書館有必要建立這一特色數(shù)據(jù)庫。
1.2 數(shù)據(jù)庫建設(shè)市場調(diào)查
從2008年以來,我館一直關(guān)注CALIS中心特色資源的建設(shè)情況[3],并對材料類專業(yè)數(shù)據(jù)庫的建設(shè)情況進行調(diào)查[4],發(fā)現(xiàn)目前全國高校建立的特色數(shù)據(jù)庫基本是由高校圖書館開發(fā)建設(shè)的,主要有武漢理工大學(xué)“復(fù)合材料專題特色數(shù)據(jù)庫”、上海大學(xué)“納米材料數(shù)據(jù)庫”、西南科技大學(xué)“無機非金屬材料特色庫”,而化工建材研究院所和企業(yè)的網(wǎng)站平臺以服務(wù)企業(yè)為宗旨,主要提供高新技術(shù)項目信息和產(chǎn)品信息,沒有相關(guān)的專業(yè)數(shù)據(jù)庫。
在對化工行業(yè)和高職院校相關(guān)專業(yè)的數(shù)據(jù)庫開發(fā)進行調(diào)查時發(fā)現(xiàn),中小企業(yè)中幾乎沒有自己開發(fā)資源的,高職院校自建數(shù)據(jù)庫的,目前有124個,所涉及專業(yè)只有23個,其余大多是隨書光盤數(shù)據(jù)庫、教師自編教材庫等,而化工建材方面的專業(yè)資源庫一個也沒有。
從上述調(diào)查結(jié)果來看,目前已有數(shù)據(jù)庫的數(shù)據(jù)形式多以文本格式為主,內(nèi)容以研究型和高新技術(shù)研究成果的學(xué)術(shù)論文為主。結(jié)合我院的辦學(xué)發(fā)展過程進行分析,發(fā)現(xiàn)目前已有數(shù)據(jù)庫針對中、高職教育教學(xué)科研和企業(yè)人才培養(yǎng)方面的實用信息資源缺乏,與目前中高職職業(yè)教育人才培養(yǎng)的信息需求不適合,不利于中高職院校的專業(yè)建設(shè)與校企結(jié)合的發(fā)展建設(shè)。因此,我館于2012年向四川省教育廳申請了“非金屬材料與化工專業(yè)特色數(shù)據(jù)庫”的科研課題,并獲批準(zhǔn)。
2數(shù)據(jù)組織階段的質(zhì)量控制
2.1 數(shù)據(jù)組織的原則
良好的數(shù)據(jù)資源基礎(chǔ)是數(shù)據(jù)庫建設(shè)成敗的關(guān)鍵。設(shè)計開發(fā)再好的數(shù)據(jù)庫,如果沒有符合用戶需求的數(shù)據(jù),也無意義。數(shù)據(jù)采集作為數(shù)據(jù)庫建設(shè)的重中之重,需要準(zhǔn)確的指導(dǎo)思想和采集原則。非金屬材料與化工專業(yè)作為我院的國家示范職業(yè)教育專業(yè),圖書館在長期的資源組織上一直是重點保障專業(yè),我們確定的采集原則[5]主要是:1)完整性。盡可能全面、準(zhǔn)確、完整地搜集與我院非金屬材料專業(yè)相關(guān)的各類型學(xué)術(shù)進展和研究成果的文獻資源。2)實用性。根據(jù)本館的館藏特色和本校的特色專業(yè)及重點專業(yè),重點收錄與高職辦學(xué)相關(guān)的人才培養(yǎng)方案、課程標(biāo)準(zhǔn)、教學(xué)成果、精品課程、試題庫等資源;根據(jù)高職教師與學(xué)生的實際需求,收錄了實用的相關(guān)專業(yè)文獻、自編教材、講義及相關(guān)專業(yè)的技術(shù)標(biāo)準(zhǔn)、規(guī)范和專利文獻等。3)特色性。專業(yè)特色突出,在數(shù)據(jù)庫建設(shè)中選擇非金屬材料專業(yè)中對人才培養(yǎng)有益的資源和代表性的重要文章,掃描錄入全文數(shù)據(jù)庫。
2.2 數(shù)據(jù)組織中的質(zhì)量控制
數(shù)據(jù)搜集是數(shù)據(jù)庫建設(shè)的重要前提[6]。在明確了數(shù)據(jù)采集原則后,首先,就要嚴(yán)格控制數(shù)據(jù)組織中的數(shù)據(jù)質(zhì)量。對于本數(shù)據(jù)庫專業(yè)資源并不十分豐富的資源市場,盡可能搜集不同類型文獻。為此,我館在整理本館紙質(zhì)文獻的基礎(chǔ)上,加強了電子型、視聽型文獻資源搜集;同時,不局限于本館資源,也搜集其他合作單位的一些專業(yè)資源,以補充我們專業(yè)資源的不足。
其次,在數(shù)據(jù)組織時積極配合學(xué)院重點專業(yè)教學(xué)、培訓(xùn)的需要,除購置教學(xué)科研所需的相關(guān)資源外,還深入到院系搜集重要的教學(xué)成果、教師的專業(yè)著述、人才培養(yǎng)方案等特色資源。
再次,考慮到高職人才培養(yǎng)注重應(yīng)用技能的培養(yǎng)的特點,專利、標(biāo)準(zhǔn)、技能考核訓(xùn)練也是高職人才培養(yǎng)的重要教學(xué)參考資源,是我館搜集的重點。本著實用性原則,盡量搜集專業(yè)技術(shù)較新的、專業(yè)特色與本數(shù)據(jù)庫建庫宗旨一致的資源,如專利、標(biāo)準(zhǔn)電子資源的選取,以有效專利和現(xiàn)行標(biāo)準(zhǔn)為主要原則,圍繞本數(shù)據(jù)庫建設(shè)宗旨,在資料的選取上盡量保證專業(yè)特色顯著。
最后,在特色數(shù)據(jù)庫的框架范圍內(nèi),對搜集的資源按類型所屬模塊和子類目進行分類,形成具有本館特色的資源體系。
2.3 形成特色子庫
2.3.1 館藏圖書書目數(shù)據(jù)庫。建筑材料專業(yè)一直是我院創(chuàng)建以來圖書館資源收藏的重點專業(yè),該類文獻出版量不大、品種少,但我們在采購時仍然盡量將其收錄館藏。該庫共收錄此類文獻3 000多種,以及本院教師歷年來自編的教材、講義等,所占比率雖然不大,但已形成我館本專業(yè)收藏特色較為顯著的文獻體系。
2.3.2 電子資源庫。電子資源已成為當(dāng)今獲得文獻信息最主要的途徑,為滿足師生們在教學(xué)中對現(xiàn)代信息資源的需要,圖書館用于購置電子資源的經(jīng)費也在逐年增加,目前我館的電子資源除購買了CNKI、維普、超星等數(shù)字資源,還圍繞材料專業(yè)的學(xué)科建設(shè)購買了相應(yīng)領(lǐng)域(水泥、玻璃、陶瓷等)的專利光盤數(shù)據(jù)庫、中國標(biāo)準(zhǔn)數(shù)據(jù)庫等。
2.3.3 精品課程庫。本數(shù)據(jù)庫收錄了學(xué)院在重點專業(yè)建設(shè)時學(xué)院老教師開發(fā)的、高職教育所需的化工類非金屬材料國家精品課程、四川省精品課程、校精品課程等。
2.3.4 校內(nèi)資源庫。本數(shù)據(jù)庫搜集了學(xué)院教學(xué)形成的人才培養(yǎng)方案、課程標(biāo)準(zhǔn)、教學(xué)成果、試題庫等內(nèi)部資源。
3數(shù)據(jù)標(biāo)引的質(zhì)量控制
在數(shù)據(jù)庫建設(shè)中,信息描述是信息組織的重要環(huán)節(jié),好用的數(shù)據(jù)庫依賴于數(shù)據(jù)的準(zhǔn)確描述,提供給讀者較為準(zhǔn)確的檢索信息,使讀者通過檢索能準(zhǔn)確判斷信息是否為自己所需。因此,最艱難的是對已搜集的大量信息進行數(shù)據(jù)的分析加工描述,通過合理分配人員對數(shù)據(jù)加工過程進行質(zhì)量控制。
3.1 規(guī)范數(shù)據(jù)著錄標(biāo)引
在組織數(shù)據(jù)庫建設(shè)之初,我們將人員分為數(shù)據(jù)庫開發(fā)人員和數(shù)據(jù)整理標(biāo)引人員兩組,在數(shù)據(jù)標(biāo)引方面,我們按照中文文獻著錄規(guī)則、專利文獻分類法、標(biāo)準(zhǔn)文獻分類法,對不同類型的文獻資源制訂了嚴(yán)格的著錄標(biāo)引細(xì)則。
首先,由課題主研人員對已采集的數(shù)據(jù)進行篩選,按照不同類型的數(shù)據(jù)制訂詳細(xì)的著錄標(biāo)引細(xì)則。由于我們搜集的數(shù)據(jù)資源類型多樣化,分類標(biāo)引的字段、分類標(biāo)準(zhǔn)等都有所不同,因此對標(biāo)引的深度、分類的集中與分散、主題詞和關(guān)鍵詞的選用、著錄等均制訂了標(biāo)引細(xì)則,以提高標(biāo)引質(zhì)量,使信息分類更規(guī)范、更科學(xué)嚴(yán)謹(jǐn),使數(shù)據(jù)庫信息資源更能滿足各類用戶的需求。同時,為保障任何人都能夠利用終端檢索和利用特色數(shù)據(jù)庫,我們針對不同類型的資源提供盡可能多的檢索入口,比如題名、著者、分類號、專利號、標(biāo)準(zhǔn)號、主題詞、關(guān)鍵詞、年代、摘要等。系統(tǒng)的檢索入口越多,用戶選擇的余地越大,就越能滿足用戶多樣化的檢索要求。
其次,對數(shù)據(jù)標(biāo)引人員進行專業(yè)培訓(xùn)。通常圖書館專業(yè)人員只熟悉中圖法分類,對數(shù)據(jù)庫收集的專利、標(biāo)準(zhǔn)文獻的分類標(biāo)引基本不了解。為了對標(biāo)引詞的準(zhǔn)確性進行控制,我們的數(shù)據(jù)標(biāo)引人員進行了基本的專利、標(biāo)準(zhǔn)文獻分類法的學(xué)習(xí),力求分類著錄時能按照要求,對文獻進行標(biāo)準(zhǔn)化、規(guī)范化的分類、著錄和主題標(biāo)引等工作,這是保證數(shù)據(jù)庫質(zhì)量的關(guān)鍵。
再次,由于本數(shù)據(jù)庫信息資源種類繁多,既有普通的電子文本,也有圖像、視頻等各類特藏,為了有效地利用這些信息資源就必須根據(jù)一定的原則和方法對其進行組織,使其成為有序的信息資源。我們的數(shù)據(jù)經(jīng)過相關(guān)專業(yè)標(biāo)引后,再由數(shù)據(jù)庫開發(fā)人員進行結(jié)構(gòu)描述形成專業(yè)數(shù)據(jù)元數(shù)據(jù),然后導(dǎo)入數(shù)據(jù)庫中,這樣就能全面反映數(shù)據(jù)庫數(shù)據(jù)的準(zhǔn)確信息,為數(shù)據(jù)庫建設(shè)形成良好的數(shù)據(jù)基礎(chǔ)。
3.2 數(shù)據(jù)庫建設(shè)與標(biāo)引模式創(chuàng)新
3.2.1 數(shù)據(jù)庫建設(shè)模式。目前專業(yè)特色數(shù)據(jù)庫開發(fā)還沒有統(tǒng)一的共享平臺,我們綜合比較了目前其他數(shù)據(jù)庫選用的開發(fā)軟件[7—9],選用基于微軟Net2.0平臺采用C#語言,利用微軟配套的Visual Studio.NET、.NET Framework專業(yè)的開發(fā)軟件及應(yīng)用程序組成開發(fā)環(huán)境;在數(shù)據(jù)庫連接上,采用了Visual Studio.NET 中最新的ADO.NET技術(shù)連接遠程SQL Server2005 數(shù)據(jù)庫;采用微軟ASP.net的數(shù)據(jù)訪問層、業(yè)務(wù)邏輯層、表示層架構(gòu)設(shè)計,擁有良好的數(shù)據(jù)庫平臺框架結(jié)構(gòu)和符合資源共享的公共檢索平臺。
根據(jù)CALIS三期特色庫項目的設(shè)計思路[10],數(shù)據(jù)庫平臺采用Web2.0網(wǎng)站標(biāo)準(zhǔn)架構(gòu)體系,整合了Web2.0技術(shù)與應(yīng)用,網(wǎng)站界面友好、布局合理,資源分類合理,易于檢索與查找操作。數(shù)據(jù)庫平臺訪問采用基于B/S的結(jié)構(gòu),用戶無須安裝任何軟件,只需使用IE瀏覽器就可進行檢索與瀏覽,并預(yù)留了與外部數(shù)據(jù)中心并接的軟件接口。
3.2.2 數(shù)據(jù)標(biāo)引模式創(chuàng)新。為了方便在將來加入CALIS數(shù)據(jù)中心時數(shù)據(jù)庫平臺整合時能夠保證元數(shù)據(jù)被專題特色庫中心系統(tǒng)收割發(fā)布[11],避免造成元數(shù)據(jù)丟失或錯位,影響數(shù)據(jù)庫共享及升級,我們將數(shù)據(jù)庫源文獻資源存儲在SQL Server2005中。在數(shù)據(jù)錄入上,我們沒有采用傳統(tǒng)的方式在已建好的數(shù)據(jù)庫中直接錄入數(shù)據(jù),而是采取數(shù)據(jù)在庫外進行標(biāo)引,完成后由數(shù)據(jù)庫開發(fā)人員進行導(dǎo)入并校驗,不僅避免了過去先開發(fā)后標(biāo)引,在錄入數(shù)據(jù)時間上的浪費,還可以防止在錄入時因數(shù)據(jù)庫的修改調(diào)試造成數(shù)據(jù)丟失;同時,數(shù)據(jù)可以隨時從數(shù)據(jù)庫中調(diào)出,既方便對數(shù)據(jù)庫進行修改,又為今后的數(shù)據(jù)庫升級保存數(shù)據(jù),對數(shù)據(jù)庫建設(shè)和數(shù)據(jù)質(zhì)量提升都是一個較為理想的模式。
3.3 數(shù)據(jù)庫建庫后續(xù)工作
此外, 數(shù)據(jù)修正、維護、更新和系統(tǒng)維護等后續(xù)工作也是保證數(shù)據(jù)庫質(zhì)量的必要手段。數(shù)據(jù)庫建成后需要定期對數(shù)據(jù)內(nèi)容進行更新、追加、清理和修正, 并經(jīng)常對系統(tǒng)的運行狀況(如存儲空間狀況)和響應(yīng)時間進行分析, 結(jié)合用戶在使用過程中發(fā)現(xiàn)的問題確定改進措施, 使系統(tǒng)逐步完善。
4結(jié)語
在面向數(shù)據(jù)源的數(shù)據(jù)組織中,不僅需要保質(zhì)保量的數(shù)據(jù)采集,建庫前廣泛的調(diào)查分析也是必不可少;而在數(shù)據(jù)標(biāo)引過程中,通過人員的合理分工合作,采用新的庫外標(biāo)引與數(shù)據(jù)庫開發(fā)同步進行的模式,使兩部分工作能有序順利的推進,也方便了后續(xù)的維護更新。通過上述具體的方法,將數(shù)據(jù)質(zhì)量控制貫穿到整個數(shù)據(jù)庫建設(shè)的過程中。
[參考文獻]
[1] 楊瑩,羅宏.CALIS 高校學(xué)位論文數(shù)據(jù)庫數(shù)據(jù)質(zhì)量分析[J].四川圖書館學(xué)報,2012(3):36—39.
[2] 高考自愿填報參考系統(tǒng)[EB/OL].[2014-07-05].http://gkcx.eol.cn/soudaxue/querySchoolSpecialty.html?zycengci=.
[3] 中國高等教育文獻保障系統(tǒng)(CALIS)主頁[EB/OL].[2014-07-05].http://project.calis.edu.cn/calisnew/.
[4] 趙伶,郭曉保.高職院校圖書館特色資源開發(fā)現(xiàn)狀調(diào)查分析及對策[J].綿陽職業(yè)技術(shù)學(xué)院院報,2009(1):54—56.
[5] 邵銳,鐘世明.專題特色數(shù)據(jù)庫系統(tǒng)研究[J].圖書館學(xué)研究,2007(6):9—11.
[6] 李玲.高校圖書館專題特色數(shù)據(jù)庫建設(shè)的質(zhì)量控制研究[J].圖書館工作與研究,2012(7):119—122.
[7] 孫瑾.軍隊檔案專題數(shù)據(jù)庫建設(shè)現(xiàn)狀及存在問題——兼論數(shù)據(jù)組織階段質(zhì)量控制[J].檔案學(xué)研究,2013(3):41—45.
[8] Zhou Hui,Zeng Hong,Chen Jianli,Qin Shigang.A Research of Higher Vocational Colleges Teaching Resources Database Construction based on Web[C]. Proceedings of 2011 International Conference on Business Management and Electronic Information(BMEI 2011) VOL.01: 443—446.
[9]Helland Pat. If You Have Too Much Data, then 'Good Enough' Is Good Enough[J].Communications of the ACM, Jun2011, Vol.54 Issue 6: 40—47.
[10] 燕今偉.CALIS專題特色數(shù)據(jù)庫的建設(shè)[M/OL].[2014-07-05].http://lib.gznu.edu.cn/tgw/tongzhi/2011/0405/yjw.pdf.
[11] 趙增和.圖書館特色資源元數(shù)據(jù)API實現(xiàn)與比較研究[J].圖書館學(xué)刊,2014(8):49—53.
[收稿日期]2014-09-05
[作者簡介]趙伶(1962—),女,副研究館員,綿陽職業(yè)技術(shù)學(xué)院圖書館,已發(fā)表論文數(shù)篇;
郭曉保(1959—),男,綿陽職業(yè)技術(shù)學(xué)院副研究館員,已發(fā)表論文數(shù)篇; 郭妍捷(1990—),女,南京理工大學(xué)自動化學(xué)院在讀研究生。