国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

NSTL科技文獻(xiàn)資源分類體系構(gòu)建研究

2024-10-09 00:00:00鄧盼盼李軍蓮冀玉靜任慧玲葛紅梅
數(shù)字圖書館論壇 2024年8期
關(guān)鍵詞:交叉學(xué)科

摘要:相對(duì)科學(xué)的分類體系是實(shí)現(xiàn)科技文獻(xiàn)資源學(xué)科特征有效揭示的重要依據(jù)。面向國家科技圖書文獻(xiàn)中心(National Science and Technology Library,NSTL)資源集成與知識(shí)服務(wù)的總體需求,通過主體及重點(diǎn)學(xué)科揭示、多體系融合、多維同位類設(shè)置、多學(xué)科列類、新興學(xué)科類目擴(kuò)展、綜合性類目設(shè)置、雙重語義編碼等方法,編制可基本覆蓋NSTL主體資源的NSTL科技文獻(xiàn)分類體系,共包含61個(gè)基本大類,類目深度為4~5級(jí),類目數(shù)達(dá)5 350個(gè)。同時(shí)建立與現(xiàn)用核心分類體系的映射關(guān)系,支撐資源分類數(shù)據(jù)規(guī)范處理、館藏目錄系統(tǒng)服務(wù)等方面的應(yīng)用。該分類體系可支撐國家重點(diǎn)扶持產(chǎn)業(yè)資源保障分析與學(xué)科布局評(píng)估。

關(guān)鍵詞:分類體系;科技文獻(xiàn);數(shù)據(jù)規(guī)范;資源保障;交叉學(xué)科

中圖分類號(hào):G25;TP391 DOI:10.3772/j.issn.1673-2286.2024.08.001

引文格式:鄧盼盼,李軍蓮,冀玉靜,等. NSTL科技文獻(xiàn)資源分類體系構(gòu)建研究[J]. 數(shù)字圖書館論壇,2024,20(8):1-8.

*本研究得到國家科技圖書文獻(xiàn)中心專項(xiàng)任務(wù)“NSTL統(tǒng)一資源分類表數(shù)據(jù)更新與維護(hù)”(編號(hào):2022XM20)、中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)與健康科技創(chuàng)新工程重大協(xié)同創(chuàng)新項(xiàng)目“生物醫(yī)學(xué)文獻(xiàn)信息保障與集成服務(wù)平臺(tái)”(編號(hào):2021-I2M-1-033)資助。

國家科技圖書文獻(xiàn)中心(National Science and Technology Library,NSTL),由中國科學(xué)院文獻(xiàn)情報(bào)中心、中國科學(xué)技術(shù)信息研究所、機(jī)械工業(yè)信息研究院、冶金工業(yè)信息標(biāo)準(zhǔn)研究院、中國化工信息中心、中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所、中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所、中國標(biāo)準(zhǔn)化研究院國家標(biāo)準(zhǔn)館和中國計(jì)量科學(xué)研究院文獻(xiàn)館9個(gè)文獻(xiàn)信息機(jī)構(gòu)組成,是基于網(wǎng)絡(luò)環(huán)境的科技文獻(xiàn)信息資源服務(wù)體系,采集、收藏和開發(fā)理、工、農(nóng)、醫(yī)各學(xué)科領(lǐng)域的科技文獻(xiàn)資源[1]。學(xué)科是信息資源重要的特征之一,相對(duì)科學(xué)的分類體系是實(shí)現(xiàn)資源學(xué)科特征有效揭示與服務(wù)的重要依據(jù),可廣泛用于分類組織、學(xué)科導(dǎo)航、篩選過濾、分面檢索、科技分析與評(píng)價(jià)等諸多領(lǐng)域。目前,NSTL尚未建立統(tǒng)一的資源分類體系,成員單位編目采用不同的分類體系或采用同一分類體系的不同版本,造成分類數(shù)據(jù)分類體系多樣化、多版本共存、未作統(tǒng)一規(guī)范,不利于整體資源的快速導(dǎo)航瀏覽和檢索,使得資源分類揭示和發(fā)現(xiàn)服務(wù)受限。新技術(shù)條件下科研工作者對(duì)文獻(xiàn)信息和知識(shí)的需求發(fā)生改變,相關(guān)領(lǐng)域文獻(xiàn)缺乏、獲取困難轉(zhuǎn)變?yōu)槲墨I(xiàn)過多、難以選擇有用文獻(xiàn)的難題,在海量資源中快速、高效、準(zhǔn)確地定位有價(jià)值的科技文獻(xiàn)成為關(guān)鍵。網(wǎng)絡(luò)信息環(huán)境下,分類是科技文獻(xiàn)的指向標(biāo),分類法不再局限于傳統(tǒng)分類法理論,用戶對(duì)象、體系結(jié)構(gòu)、編制方式更趨靈活,向分類主題一體化、人機(jī)協(xié)同化、兼容與互操作的趨勢(shì)發(fā)展[2]。鑒于此,面向NSTL科技文獻(xiàn)資源構(gòu)建一個(gè)相對(duì)科學(xué)、規(guī)范、實(shí)用的分類體系,有利于對(duì)多分類體系共存的資源分類數(shù)據(jù)進(jìn)行規(guī)范、揭示和組織,具有重要的意義。

1 資源分類問題分析

1.1 資源分類體系多樣化

資源數(shù)據(jù)采集、編目、存儲(chǔ)、組織、服務(wù)等各個(gè)環(huán)節(jié)存在分類體系多樣化現(xiàn)象。成員單位在不同歷史階段結(jié)合自身學(xué)科定位與收藏特點(diǎn),采用不同的分類體系或采用同一分類體系的不同版本,如《中國圖書館分類法》(以下簡(jiǎn)稱《中圖法》)第二版、第三版、第四版、第五版及《中國科學(xué)院圖書館圖書分類法》第三版等。各單位數(shù)據(jù)提交至聯(lián)合目錄系統(tǒng)[3]后,編目數(shù)據(jù)中也存在多個(gè)版本的分類號(hào)。NSTL網(wǎng)絡(luò)服務(wù)系統(tǒng)最終僅采用前幾級(jí)的部分類目進(jìn)行資源導(dǎo)航,現(xiàn)用分類體系(《中圖法》第四版、第五版)中醫(yī)學(xué)科學(xué)和農(nóng)業(yè)科學(xué)領(lǐng)域分別有大類“R 醫(yī)藥、衛(wèi)生”“S 農(nóng)業(yè)科學(xué)”,因此導(dǎo)航時(shí)僅分別設(shè)置了大類“醫(yī)學(xué)、藥學(xué)、衛(wèi)生”和“農(nóng)林牧漁”,顆粒度較粗、揭示不充分、發(fā)現(xiàn)服務(wù)受限。

1.2 資源揭示不充分

通過分析現(xiàn)用分類體系下各類目的資源規(guī)模可知,各領(lǐng)域資源規(guī)模存在差異。部分過時(shí)、冷門或非主體學(xué)科無資源或有較少資源,如“K851 考古學(xué)”。部分重點(diǎn)發(fā)展的學(xué)科雖然資源規(guī)模大,但類目隱藏在較深層級(jí),無法快速聚焦,如人工智能領(lǐng)域資源規(guī)模正隨著學(xué)科的快速發(fā)展而迅速增長(zhǎng),但在現(xiàn)用分類體系中相關(guān)資源隱藏在類目的第四級(jí)[TP18 人工智能理論subClassOf(父類)TP1 自動(dòng)化基礎(chǔ)理論subClassOf TP 自動(dòng)化技術(shù)、計(jì)算機(jī)技術(shù)subClassOf T 工業(yè)技術(shù)],細(xì)分子類也只有3個(gè),即“TP181 自動(dòng)推理、機(jī)器學(xué)習(xí)”“TP182 專家系統(tǒng)、知識(shí)工程”“TP183 人工神經(jīng)網(wǎng)絡(luò)與計(jì)算”,不易揭示和利用。

1.3 交叉學(xué)科資源分散

傳統(tǒng)分類體系中交替類目主要存在以下幾種情況:①兩個(gè)類目名稱和含義均相同,如“[P351.1]大氣結(jié)構(gòu)”與“P421.3 大氣結(jié)構(gòu)”、“[P351.3]大氣輻射”與“P422 大氣輻射”;②兩個(gè)類目名稱存在差異,內(nèi)涵相近、相關(guān)或更加寬泛,如“P351 高層大氣物理”與“P401 大氣物理學(xué)”、“[P351.2]大氣熱狀態(tài)和能源”與“P431+.2 靜力和準(zhǔn)靜力的熱力狀態(tài)和過程、熱平衡”、“[P351.4]大氣光化反應(yīng)”與“P402 大氣化學(xué)”、“[P351.5]大氣振蕩”與“P433 大氣動(dòng)力學(xué)”,這就造成高層大氣物理及其子領(lǐng)域的資源分散在多處、無法匯聚;③存在交替類目對(duì)應(yīng)多個(gè)宜入類目的情況,如“[X949]航空、航天安全”宜入V268.6、V328、V468、V528等有關(guān)各類。由于宜入類目和交替類目?jī)?nèi)涵并不完全相同或存在一對(duì)多情況,交替類目指示的重點(diǎn)學(xué)科資源只能分散在這些相近、相關(guān)或?qū)挿旱囊巳腩惸抠Y源中,無法單獨(dú)聚焦揭示。另外,由于各單位編目規(guī)則等差異,部分交叉學(xué)科資源歸入宜入類目,部分資源歸入交替類目,這也造成了交叉學(xué)科資源分散、無法集中。

1.4 難以揭示新學(xué)科資源

學(xué)科知識(shí)體系及結(jié)構(gòu)有相對(duì)穩(wěn)定的部分,也有不斷變化的內(nèi)容,現(xiàn)用分類體系久未更新,不能體現(xiàn)學(xué)科的發(fā)展變革、揭示新學(xué)科資源。由于在現(xiàn)有分類體系中新興學(xué)科或熱門主題沒有對(duì)應(yīng)的類目,新學(xué)科資源只能歸入寬泛的大類或相近的類目,無法充分揭示和快速定位,如物聯(lián)網(wǎng)相關(guān)期刊《IEEE Internet of Things Journal》《Journal on Internet of Things》在現(xiàn)有分類體系中沒有對(duì)應(yīng)的類目,只能歸至“TM 電工技術(shù)”或“TP 自動(dòng)化技術(shù)、計(jì)算機(jī)技術(shù)”這些比較寬泛的類目。

2 科技文獻(xiàn)分類體系構(gòu)建思路

分類體系總體構(gòu)建思路是從現(xiàn)用資源分類體系現(xiàn)狀、資源學(xué)科分布與揭示、學(xué)科發(fā)展演變與需求等方面進(jìn)行分析,明確分類表編制目標(biāo)與定位。類目提取與融合有兩條路徑:①根據(jù)資源種類和學(xué)科分布,遴選分類體系構(gòu)建所需的核心素材,如學(xué)科分類與代碼[4]、《中圖法》分類[5]、期刊分類[6]、杜威十進(jìn)制分類[7]、醫(yī)學(xué)專業(yè)分類[8]、美國國立醫(yī)學(xué)圖書館分類[9]、國家自然科學(xué)基金申請(qǐng)代碼[10]、國家社科基金項(xiàng)目申報(bào)數(shù)據(jù)代碼[11]、科技知識(shí)組織體系范疇[12]等;②明確提煉主體學(xué)科及相對(duì)穩(wěn)定的知識(shí)內(nèi)容,從國家戰(zhàn)略規(guī)劃[13-14]、領(lǐng)域科技發(fā)展報(bào)告[15]、高校學(xué)科專業(yè)建設(shè)及人才培養(yǎng)布局[16-18]等多個(gè)層面凝練重點(diǎn)、新興、交叉和前沿方向,基于多體系融合確定一級(jí)類目。在此基礎(chǔ)上,分領(lǐng)域形成分類頂層框架,主要包括基礎(chǔ)科學(xué)、工程技術(shù)科學(xué)、農(nóng)業(yè)科學(xué)、醫(yī)學(xué)科學(xué)、人文社會(huì)科學(xué)5類。根據(jù)分類體系素材遴選原則、綜合編制原則、類目設(shè)置原則等,先通過揭示重點(diǎn)學(xué)科、多體系融合、多維設(shè)置同位類、多學(xué)科列類、擴(kuò)展新學(xué)科類目、設(shè)置綜合性類目等進(jìn)行類目層級(jí)關(guān)系的重構(gòu),再通過領(lǐng)域?qū)<覅f(xié)助進(jìn)行基本大類、類目結(jié)構(gòu)、關(guān)系、注釋、編碼系統(tǒng)、映射關(guān)系等模型設(shè)計(jì)與內(nèi)容建設(shè),著力解決重點(diǎn)學(xué)科、交叉學(xué)科、新興學(xué)科的資源揭示問題,建設(shè)可基本覆蓋NSTL主體資源的科技文獻(xiàn)分類體系。分類體系構(gòu)建思路見圖1。

3 科技文獻(xiàn)分類體系編制規(guī)則

3.1 綜合編制原則

(1)文獻(xiàn)保障原則。類目設(shè)置和編碼以滿足資源組織和服務(wù)的保障需求為基本目標(biāo),列入分類體系的類目應(yīng)具有一定規(guī)模的資源。分類體系應(yīng)覆蓋NSTL主體資源所屬學(xué)科或主題領(lǐng)域,考慮特色、交叉學(xué)科。

(2)科學(xué)性原則。以學(xué)科分類為基礎(chǔ),從總到分、從一般到具體編制分類體系。基本大類是對(duì)知識(shí)范疇所作的最概括、最本質(zhì)的劃分。根據(jù)學(xué)科本質(zhì)特征及其相互聯(lián)系,設(shè)置相應(yīng)類目并建立關(guān)系,組成一個(gè)井然有序的分類體系。

(3)系統(tǒng)完整性原則。分類體系應(yīng)保證完整性和系統(tǒng)性,類目間關(guān)系合理、正確。

(4)可擴(kuò)展性原則。應(yīng)考慮動(dòng)態(tài)的學(xué)科發(fā)展及資源變化,充分揭示新興學(xué)科、事物。

(5)易用性原則。為了便于應(yīng)用,考慮目前編目人員與檢索用戶的使用習(xí)慣,借鑒現(xiàn)用的多樣化分類體系,繼承和延續(xù)學(xué)科體系中穩(wěn)定的知識(shí)內(nèi)容,如同位類邏輯排列順序。

(6)合理深度原則。借鑒典型分類體系、主流數(shù)據(jù)庫導(dǎo)航深度,結(jié)合NSTL資源品種編目深度及深層級(jí)的資源規(guī)模比例,制定合理的層級(jí)深度?;诮y(tǒng)計(jì)發(fā)現(xiàn),71.84%的科技期刊、文集匯編、科技報(bào)告、會(huì)議文獻(xiàn)等資源品種編目深度集中在前4級(jí),28.16%的資源品種編目深度為5~7級(jí)。因此,無論是面向資源組織,還是為了更高效地進(jìn)行導(dǎo)航定位、檢索聚類,分類體系編制的層級(jí)深度都應(yīng)盡量控制在4級(jí)左右。一級(jí)大類實(shí)現(xiàn)學(xué)科全覆蓋,其余層級(jí)納入重點(diǎn)學(xué)科、突出新興和交叉學(xué)科,各類細(xì)分深度可結(jié)合各領(lǐng)域資源的分布情況進(jìn)行適當(dāng)調(diào)整。

3.2 類目設(shè)置原則

(1)類目相對(duì)獨(dú)立。從學(xué)科角度進(jìn)行類目設(shè)置時(shí),所設(shè)相應(yīng)類目應(yīng)相對(duì)獨(dú)立,具有獨(dú)特的研究對(duì)象、研究?jī)?nèi)容、研究方法及規(guī)律等學(xué)科基礎(chǔ);類目可以是成熟穩(wěn)定的學(xué)科,也可以是有潛力分化為子學(xué)科、新學(xué)科的重點(diǎn)主題。對(duì)于資源量極少或?qū)W科關(guān)聯(lián)性較強(qiáng)的特殊情況,為了保障資源完整性、避免類目冗余,可將相應(yīng)學(xué)科合并,進(jìn)行類目設(shè)置。

(2)類目名稱規(guī)范。類目名稱應(yīng)當(dāng)嚴(yán)格準(zhǔn)確地表達(dá)單個(gè)類目的科學(xué)內(nèi)涵和本質(zhì)屬性,應(yīng)簡(jiǎn)明、規(guī)范、無歧義,具有權(quán)威性,兼顧時(shí)效性。考慮我國文化特色和漢語語言習(xí)慣,盡量復(fù)用我國或領(lǐng)域內(nèi)熟知、當(dāng)前最新適用的學(xué)科或主題名稱作為類目名稱。

(3)類目結(jié)構(gòu)一致。同一學(xué)科分類體系的類目應(yīng)體現(xiàn)系統(tǒng)完整性、邏輯相關(guān)性及名稱一致性,上位類目名稱所表達(dá)的內(nèi)涵應(yīng)基本覆蓋下位類目名稱的含義,同類型的類目基本保持整體類目名稱的一致性。

4 科技文獻(xiàn)類目構(gòu)建特點(diǎn)和方法

4.1 遵循文獻(xiàn)保障原則揭示主體及重點(diǎn)學(xué)科

遵循文獻(xiàn)保障原則,分類體系應(yīng)覆蓋NSTL實(shí)際館藏文獻(xiàn)的學(xué)科范圍,根據(jù)文獻(xiàn)主題和規(guī)模進(jìn)行類目設(shè)置。首先,分析現(xiàn)用分類體系各類目下的資源規(guī)模,提取出資源(包括科技期刊、會(huì)議文獻(xiàn)、科技報(bào)告、文集匯編等)品種總量為5個(gè)以上的類目3 000余個(gè),這些類目涉及的學(xué)科領(lǐng)域能基本覆蓋NSTL主體資源學(xué)科。然后,從資源規(guī)模和學(xué)科分類角度重新梳理分類體系層級(jí)結(jié)構(gòu),將資源較多、隱藏較深的重點(diǎn)學(xué)科或熱門主題調(diào)整至比較靠前的層級(jí),突出重點(diǎn)學(xué)科,如:將“TP24機(jī)器人技術(shù)”從第四級(jí)調(diào)至目前分類體系的第二級(jí)“33.06 機(jī)器人科學(xué)與工程”,并擴(kuò)充類目名稱內(nèi)涵;將冷門或非主體資源學(xué)科適當(dāng)調(diào)整至深層級(jí),進(jìn)行類目合并或保障其有可入的上位類,以保障學(xué)科覆蓋完整性,如簡(jiǎn)化人文社會(huì)科學(xué)類目及下位類,“90.45 文學(xué)與歷史”合并了語言、文學(xué)、藝術(shù)、歷史等學(xué)科。

4.2 基于多體系融合搭建分類頂層框架

在遴選的分類素材中,《中圖法》分類[5]、期刊分類[6]、杜威十進(jìn)制分類[7]等綜合性圖書分類法覆蓋范圍較廣泛,雖未能展現(xiàn)新興學(xué)科,但可用于獲取學(xué)科體系及知識(shí)內(nèi)容中相對(duì)穩(wěn)定成熟的部分;醫(yī)學(xué)專業(yè)分類[8]、美國國立醫(yī)學(xué)圖書館分類[9]、科技知識(shí)組織體系范疇[12]等特定對(duì)象或技術(shù)領(lǐng)域的分類法顆粒度較細(xì);國家自然科學(xué)基金申請(qǐng)代碼[10]、國家社科基金項(xiàng)目申報(bào)數(shù)據(jù)代碼[11]等科研項(xiàng)目代碼則更新較快,能夠體現(xiàn)科學(xué)技術(shù)領(lǐng)域的研究熱點(diǎn);學(xué)位授予和人才培養(yǎng)一級(jí)學(xué)科[16]、研究生教育學(xué)科專業(yè)[17]、高等學(xué)校本科專業(yè)[18]等學(xué)科分類則對(duì)已經(jīng)發(fā)展為學(xué)科的主題進(jìn)行了名稱規(guī)范,類目名稱多以“學(xué)”結(jié)尾,更符合學(xué)科的名稱要求,可成為最后的類目名稱參考。多個(gè)分類體系的類目及關(guān)系融合,有利于保障學(xué)科領(lǐng)域的覆蓋完整性,除了主體學(xué)科外,也能兼顧部分新興、熱門學(xué)科。

由于現(xiàn)用分類體系層級(jí)深度達(dá)10級(jí),為了縮短資源揭示路徑,基于合理深度原則,將層級(jí)體系控制在4級(jí)左右?;谫Y源分布提取覆蓋主體資源的3 000余個(gè)類目及其上層類目作為基礎(chǔ)類目框架;將其與深度為3級(jí)的學(xué)科分類與代碼、國家自然科學(xué)基金申請(qǐng)代碼等進(jìn)行全量融合,基于類目名稱、詞典等進(jìn)行類目匹配,識(shí)別可以合并歸一的類目,如“P941.6 極地”“D0615 極地科學(xué)”“D010105 冰凍圈地理學(xué)”“1706080 極地科學(xué)”,融合為一個(gè)類目后,分別繼承來源類目的下位類目如“北極”“南極”。由于多個(gè)分類體系的層級(jí)深度不同,當(dāng)融合后存在關(guān)系冗余沖突時(shí),則保留比較扁平化的層級(jí)關(guān)系,如“14035 電磁學(xué)subClassOf(父類)140物理學(xué)”與“O441 電磁學(xué)subClassOf O44 電磁學(xué)、電動(dòng)力學(xué)subClassOf O4 物理學(xué)”,融合后的層級(jí)關(guān)系為“電磁學(xué)subClassOf物理學(xué)”“電磁學(xué)subClassOf電磁學(xué)、電動(dòng)力學(xué)subClassOf物理學(xué)”,“電磁學(xué)”與“電磁學(xué)、電動(dòng)力學(xué)”既存在上下位關(guān)系又存在兄弟關(guān)系,為了扁平化重構(gòu)層級(jí)結(jié)構(gòu),僅保留“電磁學(xué)subClassOf物理學(xué)”,這樣融合形成的層級(jí)關(guān)系有可靠的來源作為重要依據(jù)。通過計(jì)算機(jī)輔助進(jìn)行分類體系自動(dòng)融合后,由各領(lǐng)域?qū)<医Y(jié)合各類目下的資源分布情況進(jìn)行分類體系融合結(jié)果確認(rèn)和層級(jí)結(jié)構(gòu)重構(gòu),在保證系統(tǒng)完整性的前提下進(jìn)行冷門學(xué)科類目的刪減或合并。

4.3 多維設(shè)置同位類構(gòu)建扁平化層級(jí)結(jié)構(gòu)

類目層級(jí)關(guān)系以資源匯聚為目的,并非嚴(yán)格意義上的隸屬關(guān)系。一方面,結(jié)合資源及學(xué)科發(fā)展等重構(gòu)類目層級(jí)結(jié)構(gòu),如將深層級(jí)的“工程材料”升為一級(jí)類目“21 材料科學(xué)與工程”;另一方面,在符合科學(xué)邏輯的前提下,為了分類體系扁平化并更充分地進(jìn)行資源揭示,允許從多個(gè)角度進(jìn)行同位類設(shè)置,并服從同一個(gè)上位類,由上位類直接劃分出來的下位類可以是子學(xué)科或該學(xué)科的研究方面。理論上,劃分出的各子類應(yīng)相互排斥,但考慮到體系深度和學(xué)科間的交叉或相關(guān)性,同位類間也允許存在部分重疊或交叉現(xiàn)象,如“土木建筑材料”分別基于材料類型和材料功能進(jìn)行了子類劃分(見圖2)。考慮到用戶習(xí)慣和易用性,采用慣用次序與邏輯次序相結(jié)合的同位類排序方法,以求類目簡(jiǎn)潔、實(shí)用。

4.4 多學(xué)科列類匯聚交叉學(xué)科資源

為了解決由交替類目或編目規(guī)則造成的資源分散問題,采用多學(xué)科列類設(shè)置亦入類目,匯聚交叉學(xué)科資源。交叉學(xué)科或主題從不同角度劃分可以服從多個(gè)學(xué)科體系,可以在多個(gè)學(xué)科體系下設(shè)置內(nèi)涵相同的類目,這些類目稱為亦入類目,具有相同的ID和類目名稱,具有多個(gè)上位類、類號(hào),在不同的學(xué)科體系下能夠?qū)崿F(xiàn)資源互通,增加資源揭示路徑。亦入類目示例見表1,其中“制藥化學(xué)”是“第二部分 工程技術(shù)科學(xué)”領(lǐng)域中“30化學(xué)工程與技術(shù)”學(xué)科與“第四部分 醫(yī)學(xué)科學(xué)”領(lǐng)域中“78 藥學(xué)”學(xué)科的遠(yuǎn)距離交叉。

4.5 基于學(xué)科發(fā)展擴(kuò)展新興學(xué)科類目

已有學(xué)科的深耕細(xì)作促使學(xué)科分工不斷細(xì)化、深化,形成更為精細(xì)化、差異化的學(xué)科類別;新的理論、技術(shù)、方法與社會(huì)需求緊密結(jié)合,相互作用,推動(dòng)著學(xué)科的分化、新生與交叉融合。隨著學(xué)科的新生、交叉與發(fā)展演變,用戶關(guān)注度及資源保障規(guī)模也發(fā)生著相應(yīng)的變化。為了更好地進(jìn)行資源揭示,學(xué)科資源保障與分類體系也應(yīng)遵循學(xué)科發(fā)展規(guī)律及應(yīng)用需要不斷革新,從國家頂層發(fā)展戰(zhàn)略規(guī)劃、領(lǐng)域科技發(fā)展、高校學(xué)科建設(shè)、專業(yè)設(shè)置與人才培養(yǎng)、資源專家推薦等各個(gè)層面,凝練新興、交叉和前沿方向,挖掘和細(xì)化有潛力的熱門學(xué)科或主題,突出重點(diǎn)學(xué)科重點(diǎn)領(lǐng)域前瞻布局,擴(kuò)展新類目,使得分類體系跟上學(xué)科發(fā)展。同時(shí),標(biāo)識(shí)表示新興學(xué)科或主題的類目,可以為新學(xué)科資源的匯聚和保障分析奠定基礎(chǔ)。新類目示例見表2。

4.6 綜合性類目收錄組合多學(xué)科資源

領(lǐng)域通用性類目或者多個(gè)學(xué)科組合的類目(如“自然科學(xué)總論”“數(shù)理科學(xué)和化學(xué)”“天文學(xué)、地球科學(xué)”“醫(yī)藥、衛(wèi)生”)下存在一定規(guī)模的綜合性資源,也確實(shí)存在一些收錄文獻(xiàn)范圍較廣泛的資源,涉及多個(gè)相關(guān)學(xué)科,如《Science》涉及生物學(xué)、化學(xué)、物理學(xué)、地球科學(xué)、計(jì)算機(jī)科學(xué)等領(lǐng)域,《Nature》涵蓋生命科學(xué)、自然科學(xué)、臨床醫(yī)學(xué)等領(lǐng)域。當(dāng)前分類體系中的一級(jí)大類基本相對(duì)獨(dú)立,考慮到應(yīng)用的需求和綜合性資源的歸屬,分別為5個(gè)部分分別設(shè)置綜合性類目,即“基礎(chǔ)科學(xué)綜合”“工程技術(shù)綜合”“農(nóng)業(yè)科學(xué)綜合”“醫(yī)學(xué)科學(xué)綜合”“人文社會(huì)科學(xué)綜合”。

4.7 雙重編碼揭示領(lǐng)域和語義信息

編碼即標(biāo)記符號(hào),可以用數(shù)字、字母、特殊的符號(hào)或它們之間的組合來表示,常用編碼形式為純數(shù)字或數(shù)字、符號(hào)、字母混合構(gòu)成順序碼、隨機(jī)碼。為了揭示更加豐富的語義信息、面向不同的應(yīng)用場(chǎng)景,該分類體系采用類號(hào)和類目唯一標(biāo)識(shí)符雙重編碼機(jī)制。①采用數(shù)字加符號(hào)、層累標(biāo)記制的類號(hào)編碼機(jī)制,每?jī)晌粩?shù)字表示一個(gè)層級(jí),級(jí)別之間采用“.”分隔。這種編碼機(jī)制便于顯示類目之間的隸屬、并列關(guān)系,可以明確類目在層級(jí)結(jié)構(gòu)中的位置和先后次序,有利于應(yīng)用前端類目編排和展示。編碼時(shí)采取空號(hào)法間隔編號(hào),依次為01、03、06、09、12等,未來可根據(jù)學(xué)科發(fā)展進(jìn)行類目細(xì)分和新類目增補(bǔ),類目體系結(jié)構(gòu)具有可擴(kuò)充性和靈活性。②由于亦入類目會(huì)存在兩個(gè)或多個(gè)類號(hào),在類目關(guān)系存儲(chǔ)及集成應(yīng)用時(shí)會(huì)造成一定的數(shù)據(jù)冗余。為了便于分類數(shù)據(jù)存儲(chǔ)、支撐資源組織和保障布局分析等應(yīng)用,同時(shí)采用類目唯一標(biāo)識(shí)符,由揭示領(lǐng)域信息的1個(gè)字母和5位數(shù)字順序碼組成:基礎(chǔ)科學(xué)(01~19)采用字母Z,從Z00001開始順序編碼;工程技術(shù)科學(xué)(20~49)采用字母G,從G00001開始順序編碼;農(nóng)業(yè)科學(xué)(50~69)采用字母N,從N00001開始順序編碼;醫(yī)學(xué)科學(xué)(70~89)采用字母Y,從Y00001開始順序編碼;人文社會(huì)科學(xué)(90~99)采用字母S,從S00001開始順序編碼。這種面向計(jì)算機(jī)的編碼模式中,每個(gè)類目,包括亦入類目,有且僅有一個(gè)唯一標(biāo)識(shí)符,有利于對(duì)類目進(jìn)行技術(shù)標(biāo)識(shí)和區(qū)分,減少數(shù)據(jù)存儲(chǔ)的冗余度,在資源編目、存儲(chǔ)和服務(wù)過程中可以快速準(zhǔn)確定位資源領(lǐng)域及歸屬機(jī)構(gòu)。

4.8 分類表類目結(jié)構(gòu)

類目結(jié)構(gòu)由類目、關(guān)系、屬性構(gòu)成。類目包括類目唯一標(biāo)識(shí)符、類目名稱、類號(hào);關(guān)系包括等級(jí)關(guān)系、并列關(guān)系、相關(guān)關(guān)系、亦入類目及與其他分類體系間的映射關(guān)系;屬性主要包括注釋和來源信息,其中規(guī)則注釋標(biāo)明了類目的內(nèi)涵及使用方法。分類表類目結(jié)構(gòu)示例見表3,其中:“11 地質(zhì)學(xué)”具有類號(hào)11和唯一標(biāo)識(shí)符Z00923;“11 地質(zhì)學(xué)”與“11.24 礦物學(xué)”為等級(jí)關(guān)系,互為上下位類;“11.24 礦物學(xué)”與“11.27 巖石學(xué)”為并列關(guān)系,互為同位類;“11.36 水文地質(zhì)學(xué)”亦入類目為“12.33 水文地質(zhì)學(xué)”;“11.45 地震地質(zhì)學(xué)”有相關(guān)類目“10.01.09.12 地震與地球構(gòu)造”;“11.39 工程地質(zhì)學(xué)”具有規(guī)則注釋“動(dòng)力地質(zhì)及工程地質(zhì)作用(風(fēng)化、地面沉降)、區(qū)域工程地質(zhì)等入此”。

5 科技文獻(xiàn)分類體系構(gòu)建結(jié)果與應(yīng)用

5.1 分類體系構(gòu)建結(jié)果

目前已建成的NSTL科技文獻(xiàn)分類體系(見表4)共分為5個(gè)領(lǐng)域、61個(gè)基本大類,深度為4~5級(jí),類目數(shù)達(dá)5 350個(gè)。其中:基礎(chǔ)科學(xué)一級(jí)類包含13個(gè)基本大類,類目數(shù)為1 317個(gè);工程技術(shù)科學(xué)一級(jí)類包含21個(gè)基本大類,類目數(shù)為2 008個(gè);農(nóng)業(yè)科學(xué)一級(jí)類包含11個(gè)基本大類,類目數(shù)為667個(gè);醫(yī)學(xué)科學(xué)一級(jí)類包含11個(gè)基本大類,類目數(shù)為1 089個(gè);人文社會(huì)科學(xué)一級(jí)類包含5個(gè)基本大類,類目數(shù)為269個(gè)。為了簡(jiǎn)化應(yīng)用,本分類體系在使用時(shí)不再進(jìn)行復(fù)分、仿分。

5.2 分類體系映射與應(yīng)用

為了實(shí)現(xiàn)資源分類數(shù)據(jù)的規(guī)范化、標(biāo)準(zhǔn)化,依托現(xiàn)有術(shù)語平臺(tái)和工具,基于復(fù)用類目來源、關(guān)系繼承、詞形特征及相似度等方法,建立與《中圖法》第四版、第五版等現(xiàn)用核心分類體系的映射關(guān)系。為避免數(shù)據(jù)冗余,每個(gè)類目?jī)H建立最有效的映射關(guān)系,推薦順序依次為精確匹配、近似匹配、上位匹配。理想情況下,源類目均建立與目標(biāo)類目的映射關(guān)系,從而有助于歷史數(shù)據(jù)的規(guī)范;針對(duì)其他未映射源類目,基于詞形特征或相似度進(jìn)行映射關(guān)系推薦[19]。分類體系映射示例見圖3,其中:設(shè)置“26.24 機(jī)械與裝備制造”類目時(shí),參考了源類目“TH16 機(jī)械制造工藝”,二者名稱和內(nèi)涵有差異,因此基于類目參考源建立映射關(guān)系“TH16 機(jī)械制造工藝SM(近似匹配)26.24 機(jī)械與裝備制造”;基于關(guān)系繼承規(guī)則,二者可以繼承彼此的下位概念,建立上位匹配“TH166 計(jì)算機(jī)集成制造BM(上位匹配)26.24 機(jī)械與裝備制造”或“TH16 機(jī)械制造工藝NM(下位匹配)26.24.15 機(jī)械與裝備增材制造”。目前分類體系電子版[20]通過服務(wù)系統(tǒng)面向NSTL及各成員單位提供服務(wù),支持類目多維檢索、樹結(jié)構(gòu)導(dǎo)航、類目使用反饋、新類目推薦等。

NSTL聯(lián)合目錄系統(tǒng)匯聚了NSTL及其9個(gè)成員單位采集的理、工、農(nóng)、醫(yī)各領(lǐng)域印本、電子和開放獲取資源的書目信息。對(duì)于歷史數(shù)據(jù),遵循盡量全量自動(dòng)轉(zhuǎn)換、減少人工干預(yù)原則,基于分類體系及與《中圖法》第四版、第五版的映射關(guān)系,將資源原始編目類號(hào)與《中圖法》第五版類號(hào)進(jìn)行匹配:如完全相同,則基于與《中圖法》第五版的映射關(guān)系,直接賦予資源NSTL類號(hào);如果出于復(fù)分等原因沒有完全相同的類號(hào),則將資源原始編目類號(hào)從右往左依次去掉1個(gè)字符進(jìn)行匹配,直至可以精確匹配到《中圖法》第五版類號(hào),然后基于映射關(guān)系賦予對(duì)應(yīng)的NSTL類號(hào);如果取至最后1位仍沒有對(duì)應(yīng)類號(hào),則標(biāo)識(shí)為“類號(hào)可能有誤”。對(duì)于增量數(shù)據(jù),在進(jìn)入系統(tǒng)時(shí),基于各單位使用分類版本(《中圖法》第四版、第五版),針對(duì)停用類目、引導(dǎo)性類目等進(jìn)行提示,并進(jìn)行分類自動(dòng)轉(zhuǎn)換賦類。這樣,歷史數(shù)據(jù)和增量數(shù)據(jù)中的每個(gè)資源均擁有NSTL類號(hào),后續(xù)將隨著業(yè)務(wù)流進(jìn)入集成與服務(wù)等環(huán)節(jié)。此外,NSTL科技文獻(xiàn)分類體系也支撐了NSTL館藏目錄服務(wù)系統(tǒng)[21]的資源導(dǎo)航、資源檢索、結(jié)果聚類與學(xué)科資源保障分析等服務(wù)。

6 結(jié)語

為更好滿足資源集成與知識(shí)服務(wù)的總體需求,本研究借鑒國內(nèi)外資源分類的先進(jìn)成果及技術(shù),以學(xué)科分類為基礎(chǔ)、資源保障為重點(diǎn),遵循科學(xué)性、可擴(kuò)展性、易用性等原則,編制了可基本覆蓋NSTL主體資源的NSTL科技文獻(xiàn)分類體系,建立了與現(xiàn)用核心分類體系間的映射關(guān)系,著力解決了重點(diǎn)學(xué)科、交叉學(xué)科、新興學(xué)科的資源揭示問題,以促進(jìn)資源數(shù)據(jù)的標(biāo)準(zhǔn)化、規(guī)范化,支撐資源組織與服務(wù)。未來將探索新興學(xué)科資源發(fā)現(xiàn)、國家重點(diǎn)扶持學(xué)科與技術(shù)攻關(guān)方向的資源保障評(píng)估等應(yīng)用。該分類體系的構(gòu)建規(guī)則與方法同樣適用于其他同類型分類體系的編制,其中重點(diǎn)學(xué)科、交叉學(xué)科、新興學(xué)科相關(guān)類目可為其他分類體系更新提供參考。

參考文獻(xiàn)

[1] 曾建勛. 基于發(fā)現(xiàn)系統(tǒng)的NSTL用戶服務(wù)體系思考[J]. 情報(bào)雜志,2020,39(11):134-138.

[2] 趙建國,韓麗影. 分類表與主題表一體化集成研究:《軍用分類主題映射表》集成構(gòu)建[J]. 情報(bào)理論與實(shí)踐,2016,39(5):86-89,73.

[3] 葛紅梅,丁遒勁,徐晶晶,等. NSTL聯(lián)合目錄資源描述發(fā)展與思考[J]. 數(shù)字圖書館論壇,2020(8):22-28.

[4] 國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局,中國國家標(biāo)準(zhǔn)化管理委員會(huì).《學(xué)科分類與代碼》國家標(biāo)準(zhǔn)第2號(hào)修改單:GB/T 13745—2009/XG2—2016[S]. 北京:中國標(biāo)準(zhǔn)出版社,2016.

[5] 國家圖書館《中國圖書館分類法》編輯委員會(huì). 中國圖書館分類法[M]. 5版. 北京:國家圖書館出版社,2010.

[6] 國家圖書館《中國圖書館分類法》編輯委員會(huì). 中國圖書館分類法期刊分類表[M]. 3版. 北京:國家圖書館出版社,2012.

[7] Dewey decimal classification[EB/OL]. [2023-02-02]. https:// www.dewey.org/webdewey/login/login.html.

[8] 中國圖書館分類法編輯委員會(huì),中國醫(yī)學(xué)科學(xué)院信息所圖書館. 中國圖書館分類法·醫(yī)學(xué)專業(yè)分類表[EB/OL]. [2023-02-02]. http://cmesh.imicams.ac.cn/index.action?action=index.

[9] National Library of Medicine. National Library of Medicine classification[EB/OL]. [2023-02-02]. https://classification.nlm. nih.gov/.

[10] 國家自然科學(xué)基金委員會(huì). 國家自然科學(xué)基金申請(qǐng)代碼[EB/ OL]. [2023-02-02]. https://www.nsfc.gov.cn/publish/portal0/ tab1440/.

[11] 全國哲學(xué)社會(huì)科學(xué)工作辦公室. 國家社科基金項(xiàng)目申報(bào)數(shù)據(jù)代碼表[EB/OL]. [2023-02-02]. http://www.nopss.gov.cn/ n1/2023/0525/c219561-32694765.html.

[12] 鮮國建,孫巍,趙瑞雪,等. 科技知識(shí)組織體系范疇協(xié)同構(gòu)建系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 數(shù)字圖書館論壇,2014(11):26-31.

[13] “中國工程科技2035發(fā)展戰(zhàn)略研究”項(xiàng)目組. 中國工程科技2035發(fā)展戰(zhàn)略·綜合報(bào)告[R]. 北京:科學(xué)出版社,2019.

[14] 中華人民共和國中央人民政府. 國務(wù)院關(guān)于印發(fā)《中國制造 2025》的通知[EB/OL]. [2023-02-02]. https://www.gov.cn/ zhengce/content/2015-05/19/content_9784.htm.

[15] 中國醫(yī)學(xué)科學(xué)院. 中國醫(yī)學(xué)科技發(fā)展報(bào)告(2021)[R]. 北京:科學(xué)出版社,2022.

[16] 國務(wù)院學(xué)位委員會(huì)第六屆學(xué)科評(píng)議組. 學(xué)位授予和人才培養(yǎng)一級(jí)學(xué)科簡(jiǎn)介[M]. 北京:高等教育出版社,2013.

[17] 中華人民共和國中央人民政府. 國務(wù)院學(xué)位委員會(huì) 教育部關(guān)于印發(fā)《研究生教育學(xué)科專業(yè)目錄(2022年)》《研究生教育學(xué)科專業(yè)目錄管理辦法》的通知[EB/OL]. [2023-02-02]. https:// www.gov.cn/zhengce/zhengceku/2022-09/14/content_5709785. htm.

[18] 中華人民共和國教育部. 教育部關(guān)于公布2022年度普通高等學(xué)校本科專業(yè)備案和審批結(jié)果的通知[EB/OL]. [2023-04-04]. http://www.moe.gov.cn/srcsite/A08/moe_1034/s4930/202304/ t20230419_1056224.html.

[19] 賈君枝,崔西燕. 人物本體詞表之間的互操作及分類體系構(gòu)建[J]. 情報(bào)學(xué)報(bào),2019,38(7):731-741.

[20] NSTL科技文獻(xiàn)學(xué)科分類表[EB/OL]. [2024-02-23]. http://cmts. imicams.ac.cn/nstl/.

[21] 國家科技圖書文獻(xiàn)中心館藏目錄服務(wù)系統(tǒng)[EB/OL]. [2024-02-23]. https://catalogue.nstl.gov.cn/#/home.

作者簡(jiǎn)介

鄧盼盼,女,碩士,助理研究員,研究方向:知識(shí)組織與服務(wù)。

李軍蓮,女,博士,研究館員,通信作者,研究方向:醫(yī)學(xué)信息資源組織與利用、醫(yī)學(xué)知識(shí)組織系統(tǒng)建設(shè)與應(yīng)用,E-mail:li.junlian@imicams.ac.cn。

冀玉靜,女,學(xué)士,副研究館員,研究方向:醫(yī)學(xué)知識(shí)標(biāo)注、醫(yī)學(xué)術(shù)語學(xué)。

任慧玲,女,碩士,研究館員,研究方向:醫(yī)學(xué)知識(shí)組織、醫(yī)學(xué)資源建設(shè)。

葛紅梅,女,碩士,副研究館員,研究方向:圖書館信息組織、圖書館元數(shù)據(jù)建設(shè)。

Construction of NSTL Scientific and Technological Literature Resource Classification System

DENG PanPan LI JunLian JI YuJing REN HuiLing GE HongMei

(Institute of Medical Information, Chinese Academy of Medical Sciences, Beijing 100020, P. R. China)

Abstract: A relatively scientific classification system is an important basis for effectively revealing the disciplinary characteristics of scientific and technological literature resources. In response to the overall demand for resource integration and knowledge services of the National Science and Technology Library (NSTL), this article develops the NSTL scientific and technological literature classification system that basically covers the main resources of NSTL and consists of 61 basic categories with a depth of 4–5 levels and a total of 5 350 categories. The construction methods include main and key discipline disclosure, multi-system fusion, multidimensional homologous classes setting, multidisciplinary classes setting, emerging discipline categories expansion, comprehensive classes setting, and dual semantic encoding, etc. The classification system establishes a mapping relationship with the current core classification system, supporting the application of standardized processing of cataloging classification data and collection system services. It supports the analysis of resource security and disciplinary layout in national key areas.

Keywords: Classification System; Scientific and Technological Literature; Data Specification; Resource Guarantee; Interdiscipline

(責(zé)任編輯:王瑋)

猜你喜歡
交叉學(xué)科
交叉學(xué)科的概念、發(fā)展機(jī)制及未來展望
我國交叉學(xué)科發(fā)展的趨勢(shì)特征及多維測(cè)度研究
自設(shè)交叉學(xué)科的分布及其支撐學(xué)科的關(guān)聯(lián)性
——基于高校自設(shè)交叉學(xué)科的數(shù)據(jù)分析
從學(xué)科交叉到交叉學(xué)科:“四新”建設(shè)的知識(shí)邏輯與實(shí)踐路徑
交叉學(xué)科人才培養(yǎng)模式探究
《中醫(yī)文學(xué)雜志》交叉學(xué)科征稿函
作為交叉學(xué)科的法治文化專業(yè)教學(xué)改革初探
《中醫(yī)文獻(xiàn)雜志》交叉學(xué)科征稿函
音樂學(xué)副修專業(yè),培養(yǎng)交叉學(xué)科人才——「普通高校音樂教育高層論壇」評(píng)述
哈佛大學(xué)《Harvard gazette》
大學(xué)生(2017年3期)2017-03-21 15:16:26
桐乡市| 乌鲁木齐市| 广饶县| 商丘市| 长岭县| 收藏| 桐梓县| 福泉市| 陆丰市| 正镶白旗| 彭山县| 乌兰察布市| 玉屏| 敖汉旗| 新巴尔虎右旗| 平江县| 禄丰县| 彩票| 台北市| 阿拉善盟| 德清县| 启东市| 青冈县| 龙游县| 乡宁县| 区。| 鄢陵县| 安泽县| 四川省| 冕宁县| 象山县| 新竹县| 长汀县| 锦屏县| 抚宁县| 新建县| 榕江县| 保定市| 扎赉特旗| 大同县| 阜康市|