張麗娟
(國(guó)家圖書(shū)館,北京 100081)
規(guī)范控制,又稱權(quán)威控制,是為確保文獻(xiàn)信息資源檢索點(diǎn)的唯一性和一致性,而建立、維護(hù)、使用和評(píng)估規(guī)范記錄(authority record)和規(guī)范文檔(authority file)的工作過(guò)程[1]。
規(guī)范控制是編目工作不可或缺的重要環(huán)節(jié),是書(shū)目系統(tǒng)先進(jìn)性和完整性的具體體現(xiàn),是實(shí)現(xiàn)目錄功能的主要途徑。規(guī)范控制的作用可歸納為:首先,規(guī)范控制能確定統(tǒng)一的檢索點(diǎn)形式,匯集質(zhì)同形異的檢索點(diǎn),從而提高檢索的查全率;其次,規(guī)范控制能確定唯一的檢索點(diǎn)形式,區(qū)別形同質(zhì)異的檢索點(diǎn),從而提高檢索的查準(zhǔn)率;最后,規(guī)范控制能在相關(guān)檢索點(diǎn)形式之間建立一種邏輯關(guān)系,通過(guò)參照系統(tǒng)予以揭示,從而將用戶從檢索點(diǎn)的非規(guī)范形式指引到規(guī)范形式或相關(guān)檢索點(diǎn),最終獲得理想的檢索結(jié)果,即提高檢索的便捷性,起到導(dǎo)航作用[2]。
規(guī)范控制工作的開(kāi)展既需要深厚的編目思想的指導(dǎo),又需要先進(jìn)的計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的支撐,內(nèi)涵豐富,環(huán)節(jié)復(fù)雜。1985年,美國(guó)伊利諾依州立大學(xué)的Burger[3]出版了有關(guān)規(guī)范控制工作的專著,他按照流程將規(guī)范工作的內(nèi)容歸納為規(guī)范記錄的創(chuàng)建、規(guī)范文檔的聚合、規(guī)范系統(tǒng)的建立、維護(hù)和評(píng)估五個(gè)環(huán)節(jié)。這些環(huán)節(jié)中的核心是規(guī)范文檔,規(guī)范控制工作都是圍繞規(guī)范文檔的建設(shè)和利用開(kāi)展的。規(guī)范文檔是指規(guī)范記錄的集合,是將受控檢索點(diǎn)的規(guī)范形式、變異形式及說(shuō)明信息按照一定的次序排列而成的統(tǒng)一管理和維護(hù)檢索點(diǎn)、對(duì)書(shū)目文檔實(shí)施規(guī)范控制的工具。隨著信息技術(shù)的飛速發(fā)展,規(guī)范文檔從傳統(tǒng)的縮微平片等載體形式轉(zhuǎn)變?yōu)殡娮踊臄?shù)據(jù)庫(kù)形式。
規(guī)范文檔是一個(gè)生長(zhǎng)的有機(jī)體,隨時(shí)保持更新的狀態(tài),包括新增記錄、修改記錄和刪除記錄3種更新類型。在新增記錄方面,如果館藏中出現(xiàn)新的實(shí)體,則需要為其創(chuàng)建新的規(guī)范記錄。如果以往規(guī)范記錄由于不能區(qū)分而共用一條規(guī)范記錄,則在獲得足夠區(qū)分信息時(shí)就可從共用記錄中分離出新規(guī)范記錄。在修改記錄方面,如果規(guī)范檢索點(diǎn)形式、變異形式或參照說(shuō)明等發(fā)生變化,則需要對(duì)規(guī)范記錄進(jìn)行修改。或者書(shū)目機(jī)構(gòu)獲得了更多的限定信息,則可對(duì)規(guī)范記錄進(jìn)行補(bǔ)充說(shuō)明。在刪除記錄方面,如果一條規(guī)范記錄的規(guī)范檢索點(diǎn)被廢止,則需要?jiǎng)h除相應(yīng)的規(guī)范記錄。或者由于規(guī)范數(shù)據(jù)庫(kù)是合作項(xiàng)目共建,如果發(fā)現(xiàn)重復(fù)記錄則予以刪除。上述更新類型都是針對(duì)規(guī)范文檔本身的。除此之外,更新還包括另一層含義,即將規(guī)范記錄的更新變化體現(xiàn)到書(shū)目記錄中與之相連的規(guī)范檢索點(diǎn)中去。本文主要涉及規(guī)范文檔自身的更新。
國(guó)家圖書(shū)館(以下簡(jiǎn)稱“國(guó)圖”)西文規(guī)范控制建設(shè)始于20世紀(jì)80年代,經(jīng)過(guò)30多年的努力,西文規(guī)范控制業(yè)已形成較完善的體系,不僅在系統(tǒng)內(nèi)實(shí)現(xiàn)了規(guī)范記錄對(duì)書(shū)目檢索點(diǎn)的有效控制,還自行研發(fā)了應(yīng)用程序,較好地解決了規(guī)范數(shù)據(jù)庫(kù)自身的更新問(wèn)題。但是,由于國(guó)圖西文規(guī)范控制屬于引用模式,通過(guò)直接購(gòu)買國(guó)外成熟的規(guī)范文檔和相應(yīng)更新文件用于本地規(guī)范控制,因此在規(guī)范控制過(guò)程中存在一些現(xiàn)實(shí)問(wèn)題。本文以介紹國(guó)圖西文規(guī)范控制更新工作的開(kāi)展為切入點(diǎn),總結(jié)數(shù)據(jù)庫(kù)更新的各類情況,進(jìn)而思考完全引進(jìn)模式所存在的問(wèn)題,提出新的工作思路。
國(guó)圖西文規(guī)范控制工作起步較早,但比較系統(tǒng)地開(kāi)展西文規(guī)范控制工作則歸功于2003年引進(jìn)的Aleph 500圖書(shū)館集成管理系統(tǒng)。規(guī)范控制的核心是規(guī)范數(shù)據(jù)庫(kù)的建設(shè),國(guó)圖西文規(guī)范控制采用直接引用模式,即引進(jìn)了美國(guó)國(guó)會(huì)圖書(shū)館(Library of Congress,LC)的名稱規(guī)范文檔(LC Name Authority File,LCNAF)和主題規(guī)范文檔(LC Subject Authority File,LCSAF),并將其裝載至Aleph 500系統(tǒng),通過(guò)系統(tǒng)功能與書(shū)目數(shù)據(jù)相連,實(shí)現(xiàn)對(duì)書(shū)目檢索點(diǎn)的有效控制。為保持規(guī)范數(shù)據(jù)庫(kù)的活力,國(guó)圖還配套引進(jìn)了LC規(guī)范數(shù)據(jù)庫(kù)的周更新文件,用于對(duì)規(guī)范數(shù)據(jù)的維護(hù)。
系統(tǒng)使用初期,為確保系統(tǒng)安全,周更新文件無(wú)法即時(shí)對(duì)規(guī)范數(shù)據(jù)庫(kù)進(jìn)行更新,國(guó)圖只能暫時(shí)采用集中更新的方式,將更新文件按照時(shí)間的先后順序合并,再用合并后的最終文件對(duì)規(guī)范數(shù)據(jù)庫(kù)進(jìn)行整體更新。LC的規(guī)范數(shù)據(jù)每年有二三十萬(wàn)的增長(zhǎng)量,而集中更新每三年才進(jìn)行一次,西文規(guī)范數(shù)據(jù)庫(kù)的時(shí)效性嚴(yán)重滯后。2010年,國(guó)圖信息技術(shù)部門研發(fā)了專門的更新文件裝載程序,可通過(guò)外部應(yīng)用軟件直接將更新文件中的規(guī)范記錄灌裝至Aleph 500系統(tǒng)[4],至此終于實(shí)現(xiàn)西文規(guī)范數(shù)據(jù)庫(kù)與LC規(guī)范數(shù)據(jù)庫(kù)的同步更新。
目前西文名稱規(guī)范數(shù)據(jù)已達(dá)10 610 526條,主題規(guī)范數(shù)據(jù)量已達(dá)433 018條。2010年1月—2018年12月,國(guó)圖共完成名稱和主題規(guī)范數(shù)據(jù)庫(kù)更新各469期,名稱規(guī)范數(shù)據(jù)庫(kù)更新記錄6 579 610條,主題規(guī)范數(shù)據(jù)庫(kù)更新記錄153 912條,兩個(gè)數(shù)據(jù)庫(kù)記錄新增、修改、刪除3種情況的數(shù)據(jù)更新量如圖1和圖2所示。
圖1 2010—2018年名稱規(guī)范數(shù)據(jù)庫(kù)各年更新量對(duì)比圖
圖2 2010—2018年主題規(guī)范數(shù)據(jù)庫(kù)各年更新量對(duì)比圖
由此可見(jiàn),名稱規(guī)范數(shù)據(jù)庫(kù)的數(shù)據(jù)總量和更新量都遠(yuǎn)遠(yuǎn)高于主題規(guī)范數(shù)據(jù)庫(kù)。原因在于,名稱規(guī)范數(shù)據(jù)庫(kù)主要由LC領(lǐng)銜的名稱規(guī)范合作項(xiàng)目(Name Authority Cooperative Program,NACO)成員館基于增加館藏的情況予以建設(shè),由于館藏?cái)?shù)量迅猛增長(zhǎng),所以名稱規(guī)范記錄的數(shù)量也隨之大幅增長(zhǎng)。而主題規(guī)范數(shù)據(jù)庫(kù)是基于美國(guó)國(guó)會(huì)圖書(shū)館標(biāo)題表(Library of Congress Subject Headings,LCSH)的內(nèi)容,通過(guò)主題規(guī)范合作項(xiàng)目(Subject Authority Cooperative Program,SACO)參與者以提議的方式并由LC政策專家審核批準(zhǔn)后才能用于更新記錄,所以主題規(guī)范記錄的增長(zhǎng)十分有限。在新增、修改、刪除3種更新類型中,兩個(gè)規(guī)范數(shù)據(jù)庫(kù)都是刪除記錄的情況最少,這主要得益于LC和相關(guān)參與者高質(zhì)量的工作及穩(wěn)定的規(guī)則體系。名稱規(guī)范記錄每年新增記錄的數(shù)量基本保持在30萬(wàn)條上下,比較平穩(wěn)。雖然LC在2013年3月31日開(kāi)始實(shí)行資源描述與檢索(Resource Description and Access,RDA)規(guī)則,但是LC的RDA化進(jìn)程不是一刀切的,而是從2008年完成RDA測(cè)試之后逐步開(kāi)始的,到“RDA切換日”這天,RDA數(shù)據(jù)的比例達(dá)到100%。LC實(shí)現(xiàn)RDA本地化之后,規(guī)范記錄也沒(méi)有迅猛增長(zhǎng),這是因?yàn)樾乱?guī)則的啟用引發(fā)了對(duì)歷史數(shù)據(jù)的修改,但并不會(huì)造成實(shí)體數(shù)量的增加,因此,在RDA全面實(shí)施的2012年和2013年,名稱規(guī)范記錄的修改量達(dá)到高峰,但是增長(zhǎng)量保持穩(wěn)定。
LCNAF和LCSAF周一至周六每天更新,內(nèi)容包括LC編目員在前一天創(chuàng)建和修改的記錄,以及由NACO參與者提供的記錄,而上一周的刪除記錄在每個(gè)周末統(tǒng)一刪除。LC政策專家進(jìn)行審核通過(guò)的需更新的主題記錄每周進(jìn)行更新。LC將這些更新文件按周制作成LC規(guī)范文檔的周更新文件,供其他機(jī)構(gòu)下載使用。2010年國(guó)圖在完成LC規(guī)范數(shù)據(jù)裝載軟件測(cè)試后,也制定了更新工作規(guī)范,并設(shè)計(jì)了更新工作流程。
首先由專人負(fù)責(zé)將這些周更新文件定期從LC提供的FTP地址上下載至本地,并上傳至指定的FTP進(jìn)行長(zhǎng)期保存。LC規(guī)范文檔的周更新文件為ISO 2709數(shù)據(jù)格式,以卷、期組合的方式命名,包括5種類型的文件,分別是XML文件、report文件、property list文件、records文件、UTF8文件。這些文件除可用于對(duì)本地規(guī)范記錄的更新外,還包含更新量匯總,每條被更新記錄的完整記錄信息等,對(duì)于了解每期更新動(dòng)態(tài),減少操作失誤,嚴(yán)格保證數(shù)據(jù)庫(kù)更新操作的安全,具有非常重要的意義。
隨后由專人通過(guò)專門研發(fā)的裝載軟件對(duì)Aleph 500系統(tǒng)中的本地規(guī)范數(shù)據(jù)庫(kù)進(jìn)行更新。裝載軟件基于Web的B/S模式,將功能實(shí)現(xiàn)的核心部分集中到服務(wù)器上,僅需在IE瀏覽器上輸入相應(yīng)的地址即可方便快捷地使用該軟件,更新只需五個(gè)步驟:確定要更新的目標(biāo)庫(kù),即是對(duì)名稱庫(kù)還是主題庫(kù)進(jìn)行更新;將LC原始規(guī)范數(shù)據(jù)文件上傳到Aleph 500服務(wù)器,并對(duì)該文件進(jìn)行第一步的轉(zhuǎn)換,即加回車換行符到文件中,使其分行;將上一步生成的已分行MARC21格式文件轉(zhuǎn)換為Sequence格式,輸入的文件為上一步輸出的文件;將生成的Sequence文件轉(zhuǎn)換字符集為UTF;將生成的UTF文件中的數(shù)據(jù)更新到相應(yīng)的西文規(guī)范數(shù)據(jù)庫(kù)。最后,將上述各步驟生成的文件下載保存,將第五步生成的文件中實(shí)際更新的記錄總量與LC更新文件中記錄更新量對(duì)比是否一致,數(shù)量相同,則從本期更新中隨機(jī)抽取有代表性的規(guī)范記錄,在本地規(guī)范數(shù)據(jù)庫(kù)中查看這些記錄的更新?tīng)顟B(tài)及更新時(shí)間,核對(duì)無(wú)誤后,更新人員認(rèn)真填寫更新日志。
規(guī)范數(shù)據(jù)庫(kù)更新是一項(xiàng)嚴(yán)謹(jǐn)?shù)墓ぷ?,一旦誤操作就可能造成規(guī)范數(shù)據(jù)庫(kù)的混亂,糾正這些錯(cuò)誤將會(huì)耗費(fèi)更新人員大量的時(shí)間和精力。因此,由專人對(duì)整個(gè)操作進(jìn)行監(jiān)督及文檔管理至關(guān)重要。
更新文件中的規(guī)范記錄如何與目標(biāo)庫(kù)進(jìn)行匹配是準(zhǔn)確完成更新的重要前提。在LC規(guī)范記錄中,為每條記錄都分配了唯一的記錄控制號(hào),同時(shí)記錄在001字段和010字段。兩個(gè)字段的區(qū)別在于,如果規(guī)范記錄進(jìn)行了本地化修改,則001字段所記錄的LC控制號(hào)(Library of Congress Control Number,LCCN)將被本地控制號(hào)所取代,但是010字段所記錄的LCCN在任何情況下都保持不變。此外,本地修改之后,規(guī)范記錄中還會(huì)增加一個(gè)表示操作員代碼的字段“OWN”。在開(kāi)展更新工作時(shí),主要依靠010字段LCCN來(lái)匹配數(shù)據(jù),同時(shí)兼顧本地修改的情況。具體更新規(guī)則如下。
對(duì)于LC更新文件中的新增記錄,直接裝入目標(biāo)數(shù)據(jù)庫(kù)。對(duì)于LC更新文件中的修改記錄,用目標(biāo)庫(kù)010字段LCCN進(jìn)行匹配,如果目標(biāo)庫(kù)中無(wú)同號(hào)記錄,則作為新增記錄直接裝入;如果數(shù)據(jù)庫(kù)中已有同號(hào)記錄,且未進(jìn)行過(guò)本地修改,則用更新文件中的修改記錄覆蓋庫(kù)中的同號(hào)記錄。對(duì)于更新文件中的刪除記錄,用目標(biāo)庫(kù)的010字段LCCN進(jìn)行匹配,如果數(shù)據(jù)庫(kù)中無(wú)同號(hào)記錄,則該記錄不必寫入;如果數(shù)據(jù)庫(kù)中已有同號(hào)記錄,且未進(jìn)行過(guò)本地修改,則用刪除記錄覆蓋數(shù)據(jù)庫(kù)中同號(hào)記錄。對(duì)于編目員已修改而無(wú)法進(jìn)行同號(hào)覆蓋的LC更新文件中的規(guī)范記錄,裝入臨時(shí)庫(kù)暫存,裝載時(shí)同樣先用010字段LCCN進(jìn)行匹配,如果臨時(shí)庫(kù)中無(wú)同號(hào)記錄,則直接寫入;如果臨時(shí)庫(kù)中已有同號(hào)記錄,則覆蓋。
規(guī)范數(shù)據(jù)庫(kù)發(fā)生日常更新的原因很多。資源種類的豐富、出版方式的變化、版本形式的多樣化等使館藏資源與日俱增。在這些增加的館藏中可能會(huì)出現(xiàn)新的責(zé)任者、新的作品或者原有作品的衍生品,這些都需要在編目時(shí)為其構(gòu)建新的規(guī)范檢索點(diǎn)。此外,編目員從這些新館藏資源中可能獲取到更多的有用信息用于優(yōu)化舊的規(guī)范記錄。再則,編目界日新月異,新規(guī)則層出不窮,規(guī)則變化會(huì)導(dǎo)致規(guī)范數(shù)據(jù)發(fā)生批量更新。如RDA取消了檢索點(diǎn)選取的“3原則”,書(shū)目記錄中檢索點(diǎn)的范圍大幅擴(kuò)展,促使大量新規(guī)范記錄產(chǎn)生;RDA規(guī)則鼓勵(lì)“如實(shí)轉(zhuǎn)錄”,因此規(guī)范檢索點(diǎn)取消了大量的人為縮寫,而以用戶容易理解的全拼形式記錄,增強(qiáng)表達(dá)性,從而引發(fā)大量規(guī)范檢索點(diǎn)的形式變化;RDA采用“首選名稱+附加成分”構(gòu)建規(guī)范檢索點(diǎn)的方法,對(duì)首選名稱和變異名稱的選擇,以及為區(qū)分同一名稱的不同實(shí)體添加附加成分的順序都與AACR2存在差異。格式上的變化也是造成規(guī)范數(shù)據(jù)庫(kù)更新的原因之一。MARC21規(guī)范數(shù)據(jù)格式為適應(yīng)RDA做了相應(yīng)修訂,增加字段近40個(gè)。
規(guī)范數(shù)據(jù)庫(kù)日常更新的3種類型一般通過(guò)MARC21規(guī)范數(shù)據(jù)格式的頭標(biāo)/05字符位代碼予以表示,即分別用“n”“c”“d”表示“新增”“修改”和“刪除”。
如果某實(shí)體在規(guī)范數(shù)據(jù)庫(kù)中找不到對(duì)應(yīng)的規(guī)范記錄,就需為其創(chuàng)建規(guī)范記錄,常見(jiàn)的是為新增的個(gè)人、團(tuán)體創(chuàng)建規(guī)范記錄,還可以為新增的作品或內(nèi)容表達(dá)建立新記錄。如2014年出版的《習(xí)近平談治國(guó)理政》英文版就是一個(gè)新的內(nèi)容表達(dá),可為其創(chuàng)建規(guī)范記錄如下。
LDR/05 n
100 1#$aXi, Jinping.$tXi Jinping tan zhi guo li zheng.$lEnglish
400 1#$a 習(xí)近平.$t 習(xí)近平談治國(guó)理政.$lEnglish
400 1#$aXi, Jinping.$tXi Jinping, the governance of China
430#0$a 習(xí)近平談治國(guó)理政
670##$aXi Jinping, The governance of China, 2014: $bcolophon(Xi Jinping tan zhi guo li zheng--English)
此外,在LC規(guī)范控制實(shí)踐中還存在一種需要新增規(guī)范記錄的情況,即分離未區(qū)分的規(guī)范記錄。當(dāng)多個(gè)實(shí)體擁有相同的名稱,但是用于區(qū)分它們的信息不足時(shí),這些實(shí)體可暫時(shí)共用一條規(guī)范記錄,待后續(xù)編目員獲得的信息足以將它們區(qū)分開(kāi)時(shí),再重新創(chuàng)建規(guī)范記錄。在LC規(guī)范數(shù)據(jù)庫(kù)中目前存在51 785條名稱未區(qū)分的規(guī)范記錄[5]。未區(qū)分的規(guī)范記錄用008字段32字符位代碼“b”表示。
例如,LC控制號(hào)為“nr2001024383”的規(guī)范記錄就是一條未區(qū)分的記錄,其規(guī)范檢索點(diǎn)形式為“Li, Qiang”?!秶?guó)家圖書(shū)館藏民國(guó)軍事檔案文獻(xiàn)初編》的責(zé)任者之一“李強(qiáng)”和《大型公共場(chǎng)所人員疏散策略模擬與應(yīng)用》的著者“李強(qiáng)”是兩個(gè)不同的實(shí)體,卻共用同一規(guī)范檢索點(diǎn)形式。
LDR/05 c
008/32 b
100 1# $aLi, Qiang
400 1# $a 李強(qiáng)
670##$aDa xing gong gong chang suo ren yuan shu san ce lüe mo ni yu ying yong, 2011: $bt.p.(李強(qiáng), Li Qiang)
670##$aGuo jia tu shu guan cang Minguo jun shi dang an wen xian chu bian, 2009: $bt.p.(李強(qiáng) = Li Qiang)
由于規(guī)范形式通過(guò)添加附加成分可區(qū)分,為后者“李強(qiáng)”創(chuàng)建規(guī)范記錄。RDA規(guī)定個(gè)人名稱附加成分的優(yōu)先順序?yàn)椋撼錾掌诤停ɑ颍┧劳鋈掌?、名稱的更完整形式、個(gè)人活躍期、職業(yè)或工作添加。由于無(wú)時(shí)間信息,名稱也完整,所以根據(jù)資源的題名推斷職業(yè)或工作信息作為附加成分。
LDR/05 n
008/32 a
100 1#$aLi, Qiang$c(Writer on evacuation of civilians)
400 1#$a李強(qiáng)$c(Writer on evacuation of civilians)
667##$aFormerly on undifferentiated name record:nr2001024383.
670##$aDa xing gong gong chang suo ren yuan shu san ce lüe mo ni yu ying yong, 2011: $bt.p.(李強(qiáng), Li Qiang)
規(guī)范記錄的數(shù)據(jù)內(nèi)容部分一般包括規(guī)范檢索點(diǎn)、單純參照、相關(guān)參照、參考數(shù)據(jù)源等信息,當(dāng)這些信息發(fā)生變化時(shí),就要對(duì)規(guī)范記錄進(jìn)行修改,使規(guī)范記錄的信息更完整,更方便識(shí)別和區(qū)分。
規(guī)范檢索點(diǎn)一般由“首選名稱+附加成分”組成,當(dāng)首選名稱或附加成分發(fā)生變化時(shí),即需對(duì)規(guī)范記錄進(jìn)行修改。例如,將LC控制號(hào)為“n 79133113”的規(guī)范記錄“Ba, Jin, 1904-”由于補(bǔ)充了卒年信息,規(guī)范檢索點(diǎn)形式修改為“Ba, Jin, 1904-2005”。規(guī)則變化也常常引發(fā)記錄的修改。例如,RDA規(guī)則要求不應(yīng)人為地進(jìn)行縮寫,如用“approximately”取代了拉丁文縮寫“ca”,個(gè)人活躍期用“active”,取代“fl.”,所以當(dāng)對(duì)原AACR2的規(guī)范檢索點(diǎn)進(jìn)行“RDA化”修改后,拉丁縮寫要轉(zhuǎn)化為完整英語(yǔ)形式。此外,參照或數(shù)據(jù)源信息的補(bǔ)充也會(huì)造成數(shù)據(jù)的修改。例如,為L(zhǎng)C控制號(hào)為“n 00011963”的規(guī)范記錄“Sargent, John F.”增加了670字段的來(lái)源信息“$aPhone call to author, Feb.10,2012 $b (prefers full name, John Francis Sargent, Jr.;b.1962)”。
LCCN是不可重復(fù)使用的,一旦為某實(shí)體創(chuàng)建規(guī)范記錄,并將LCCN分配給該記錄,則不能將該控制號(hào)用于其他實(shí)體。如果規(guī)范記錄本身發(fā)生變化,可將規(guī)范記錄連同LCCN一并刪除。MARC21規(guī)范數(shù)據(jù)格式頭標(biāo)/05字符位除了代表“d”表示刪除之外,還有兩個(gè)代碼“s”和“x”也表示刪除的情形?!皊”表示一個(gè)規(guī)范檢索點(diǎn)因被拆分成兩個(gè)或多個(gè)規(guī)范檢索點(diǎn)而刪除的記錄,該規(guī)范檢索點(diǎn)在被拆分后新增的規(guī)范記錄中以單純參照形式出現(xiàn)?!皒”表示由于一個(gè)規(guī)范檢索點(diǎn)被另一個(gè)規(guī)范檢索點(diǎn)取代而被刪除的記錄,該規(guī)范檢索點(diǎn)也會(huì)以單純參照形式出現(xiàn)在另一條規(guī)范記錄中。當(dāng)代碼“s”和“x”皆不適用或者編目機(jī)構(gòu)不需要細(xì)分刪除的情形,則用代碼“d”表示已刪除的記錄。LC規(guī)范記錄即是如此,僅用代碼“d”表示已刪除的記錄。對(duì)于未區(qū)分的規(guī)范記錄,如果獲得了可區(qū)分的信息實(shí)現(xiàn)了所有未區(qū)分記錄的分離,均新建了規(guī)范記錄,則原始的那條共用記錄則需要?jiǎng)h除。
國(guó)圖西文規(guī)范控制直接引用模式能充分共享國(guó)外的先進(jìn)經(jīng)驗(yàn)和成果,大大節(jié)省了建設(shè)規(guī)范數(shù)據(jù)庫(kù)的人力和物力,還通過(guò)摸索實(shí)現(xiàn)與引用規(guī)范數(shù)據(jù)庫(kù)的同步更新。盡管取得了一定的成績(jī),但是國(guó)圖西文規(guī)范數(shù)據(jù)庫(kù)的更新建設(shè)還存在一些有待解決的問(wèn)題。
首先,更新雖然及時(shí),但是缺乏自建的模式仍然不能完全滿足西文規(guī)范控制建設(shè)的需要。例如,館藏書(shū)目數(shù)據(jù)的檢索點(diǎn)不能實(shí)現(xiàn)與規(guī)范數(shù)據(jù)庫(kù)檢索點(diǎn)的完全匹配。由于LC規(guī)范數(shù)據(jù)庫(kù)是基于其多個(gè)成員館的館藏情況而共同建設(shè),館藏資源的獲取途徑、發(fā)行限制和受眾群體等不同,國(guó)圖編目員經(jīng)常遇到對(duì)書(shū)目數(shù)據(jù)的檢索點(diǎn)進(jìn)行規(guī)范控制時(shí),在西文規(guī)范數(shù)據(jù)庫(kù)中找不到匹配規(guī)范記錄的情況,編目員只能憑經(jīng)驗(yàn)使用資源上的檢索點(diǎn)形式,造成書(shū)目數(shù)據(jù)庫(kù)中非控檢索點(diǎn)的存在,尤其是在編目亞洲發(fā)行的資源時(shí)這種情況尤其突出。大量非控檢索點(diǎn)的存在無(wú)疑為今后數(shù)據(jù)庫(kù)維護(hù)增加了工作負(fù)擔(dān)。再如,對(duì)于中國(guó)名稱,LC規(guī)范檢索點(diǎn)采用了漢語(yǔ)拼音的拉丁化形式。近年來(lái),LC在建設(shè)名稱規(guī)范數(shù)據(jù)時(shí)加大了對(duì)中國(guó)實(shí)體信息的補(bǔ)充,為不少中國(guó)名稱增加了中文形式的單純參照,以便用戶更好地識(shí)別實(shí)體。但是,由于中國(guó)名稱的特殊性,僅靠拼音很難區(qū)分實(shí)體,而LC在中文信息方面不具備優(yōu)勢(shì),因此添加的單純參照十分有限。國(guó)圖編目員如果能利用自身信息優(yōu)勢(shì),在規(guī)范記錄更新時(shí)盡可能為中國(guó)名稱添加可靠的單純參照,將大大提升LC名稱規(guī)范數(shù)據(jù)庫(kù)的質(zhì)量。但是完全引進(jìn)的更新模式使編目員無(wú)法通過(guò)自建來(lái)完善規(guī)范記錄。
其次,大量的更新也造成問(wèn)題數(shù)據(jù)量的增長(zhǎng)。數(shù)量如此龐大的數(shù)據(jù)庫(kù)難免存在記錄質(zhì)量問(wèn)題。例如,LC一些規(guī)范記錄的008字段,代碼應(yīng)記錄為小寫字母,但是經(jīng)常會(huì)出現(xiàn)大寫字母,這樣的記錄無(wú)法實(shí)現(xiàn)對(duì)書(shū)目文檔相關(guān)檢索點(diǎn)的自動(dòng)更新。在這種情況下,編目員只能將大寫字母改為小寫,雖然只是簡(jiǎn)單修改,但是保存之后會(huì)形成本地控制號(hào)和操作員代碼。這樣的記錄更新時(shí)不能依靠控制號(hào)的匹配自動(dòng)覆蓋,只能暫時(shí)將它們放置在臨時(shí)數(shù)據(jù)庫(kù)中。隨著更新的進(jìn)行,這部分記錄的數(shù)量不斷增長(zhǎng),更新信息無(wú)法在規(guī)范數(shù)據(jù)庫(kù)中體現(xiàn),造成更新無(wú)效。
最后,更新的一個(gè)重要方面是為規(guī)范檢索點(diǎn)增加了諸多單純參照,但是國(guó)圖Aleph 500系統(tǒng)并未將這些增加參照信息即時(shí)抽取索引,造成更新內(nèi)容不能快速在檢索機(jī)制中體現(xiàn),而大大降低了更新的效果。
解決上述問(wèn)題的關(guān)鍵是逐步在引進(jìn)模式中增加自建環(huán)節(jié)。隨著對(duì)規(guī)范記錄創(chuàng)建內(nèi)容及格式標(biāo)準(zhǔn)認(rèn)識(shí)和理解的深入,國(guó)圖編目員已經(jīng)具備一定的規(guī)范自建能力,他們希望在共享國(guó)外規(guī)范成果的同時(shí),盡可能多地參與到項(xiàng)目建設(shè)的愿望愈發(fā)強(qiáng)烈。按照NACO對(duì)成員館的要求,加入項(xiàng)目的前提條件是參加一個(gè)聯(lián)機(jī)合作編目系統(tǒng),以便能夠提交聯(lián)機(jī)規(guī)范記錄。國(guó)圖2010年正式加入OCLC實(shí)現(xiàn)書(shū)目記錄的上傳,已具備提交規(guī)范記錄的基本條件。國(guó)圖應(yīng)積極申請(qǐng)加入NACO等國(guó)際規(guī)范控制合作項(xiàng)目,在引進(jìn)LC成熟規(guī)范數(shù)據(jù)庫(kù)的同時(shí),逐步增加自建環(huán)節(jié),這樣可以解決規(guī)范數(shù)據(jù)庫(kù)沒(méi)有相關(guān)檢索點(diǎn)的問(wèn)題,同時(shí)還可以在發(fā)揮中文信息優(yōu)勢(shì)以及完善中國(guó)有關(guān)實(shí)體規(guī)范記錄方面做出更多的貢獻(xiàn)。在參與國(guó)際規(guī)范控制共建過(guò)程中,國(guó)圖還能充分吸收各國(guó)規(guī)范控制建設(shè)經(jīng)驗(yàn),打造一支素質(zhì)優(yōu)良、具備參與國(guó)際項(xiàng)目建設(shè)能力的編目員隊(duì)伍。隨著規(guī)范控制工作的深入,國(guó)圖應(yīng)設(shè)置規(guī)范管理綜合崗,用于專門解決規(guī)范控制中的各類問(wèn)題。對(duì)于臨時(shí)數(shù)據(jù)庫(kù)中的更新記錄,應(yīng)由專人負(fù)責(zé)比對(duì),用人工或半人工的方式將更新的重要信息合并至規(guī)范數(shù)據(jù)庫(kù)中。國(guó)圖也應(yīng)加強(qiáng)對(duì)檢索點(diǎn)抽取工作的力度,即使不能實(shí)現(xiàn)時(shí)時(shí)抽取,也應(yīng)加大批量抽取的頻率,使規(guī)范記錄更新中的參照形式能盡快在索引中體現(xiàn),從而提升OPAC的檢索效果。
規(guī)范數(shù)據(jù)庫(kù)的更新是規(guī)范控制建設(shè)中的重要一環(huán)。除國(guó)圖之外,我國(guó)圖書(shū)館界在外文資源信息組織方面也多采用引進(jìn)國(guó)際上成熟規(guī)范數(shù)據(jù)庫(kù)的方式,因此,國(guó)圖在西文規(guī)范數(shù)據(jù)庫(kù)更新方面的經(jīng)驗(yàn)對(duì)于其他圖書(shū)館建設(shè)外文書(shū)目系統(tǒng)具有一定的參考借鑒意義。我國(guó)中文文獻(xiàn)信息編目中的規(guī)范控制環(huán)節(jié)雖完全采用自建模式,但也需要建立科學(xué)合理的更新維護(hù)機(jī)制,因此對(duì)于LC規(guī)范數(shù)據(jù)庫(kù)相關(guān)情況的研究在一定程度上也希望能給予中文規(guī)范控制系統(tǒng)建設(shè)以很好的啟發(fā)。