摘? 要:近幾年來,數(shù)字圖書館資源的聚合逐漸成為國內(nèi)外學(xué)者研究的重點(diǎn)內(nèi)容,國外主要對語義互聯(lián)和框架構(gòu)建方面進(jìn)行集中研究,而我國主要是對理論探討方面進(jìn)行深入研究?;诖耍疚耐ㄟ^對館藏資源聚合質(zhì)量的影響因素進(jìn)行分析,從運(yùn)用關(guān)聯(lián)數(shù)據(jù)聚合數(shù)字資源、運(yùn)用語義網(wǎng)環(huán)境聚合數(shù)字資源、運(yùn)用大數(shù)據(jù)技術(shù)聚合數(shù)字資源論述了數(shù)字圖書館資源聚合質(zhì)量的控制策略。
關(guān)鍵詞:數(shù)字圖書館;資源聚合質(zhì)量;關(guān)聯(lián)數(shù)據(jù)
中圖分類號:G250.76? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號:2096-4706(2019)23-0134-02
Analysis of Influencing Factors on the Quality
of Resource Aggregation in Digital Library
NIE Mengdi
(Anhui Provincial Library,Hefei? 230001,China)
Abstract:In recent years,the aggregation of digital library resources has gradually become the focus of domestic and foreign scholars’research. Foreign countries mainly focus on semantic interconnection and framework construction,while China mainly focuses on theoretical research. Based on this,this paper analyses the influencing factors of the aggregation quality of Library resources,and discusses the control strategies of the aggregation quality of digital library resources from the aspects of using related data to aggregate digital resources,using semantic web environment to aggregate digital resources,and using big data technology to aggregate digital resources.
Keywords:digital library;quality of resource aggregation;associated data
0? 引? 言
隨著社會(huì)經(jīng)濟(jì)的不斷發(fā)展,我國數(shù)字圖書館也得以飛速發(fā)展,使得館藏資源數(shù)量日益龐大且復(fù)雜,如何對這些資源進(jìn)行高效的利用成為學(xué)者們面臨的主要問題。為了更好地解決館藏資源聚合質(zhì)量所受的影響,我國很多學(xué)者深入地探索館藏資源聚合模式,并應(yīng)用到實(shí)際工作中,在深度聚合之后,數(shù)字圖書館中的各類資源可實(shí)現(xiàn)更好的服務(wù),同時(shí)也提高了數(shù)字圖書館的資源利用率。
1? 數(shù)字圖書館資源聚合質(zhì)量的影響因素
1.1? 資源聚合度和共享的影響
現(xiàn)階段,隨著信息技術(shù)發(fā)展得越來越快,網(wǎng)絡(luò)教育資源得到了豐富,這種情況促使著數(shù)字圖書館知識(shí)服務(wù)和資源聚合向著更好的方向發(fā)展,為建設(shè)數(shù)字圖書館提供了有力保障。然而,當(dāng)前館藏資源共享有著很大的問題,致使數(shù)字圖書館中的資源聚合和共享達(dá)不到預(yù)想的效果。具體表現(xiàn)在如下方面。
(1)圖書館中資源分布式管理機(jī)制對館中的知識(shí)、信息、數(shù)據(jù)的相互關(guān)聯(lián)產(chǎn)生了嚴(yán)重的影響,阻礙了館內(nèi)資源更深層次、更廣范圍的聚合。
(2)分類管理的單一形式和部門明確的分工雖然提高了服務(wù)質(zhì)量和工作效率,但是卻嚴(yán)重忽視了各個(gè)部門之間相互合作、交流與溝通的重要性,對形成知識(shí)整體服務(wù)體系造成了巨大的影響,致使資源深度聚合效率降低。
除此之外,各部門之間不能有效溝通,使得信息傳遞效率降低的同時(shí),也影響著數(shù)據(jù)資源的共享。另外在現(xiàn)有資源分布式管理機(jī)制的作用下,用戶在對信息進(jìn)行檢索時(shí),不能夠完整、全面地獲取數(shù)字資源。
1.2? 資源應(yīng)用與建設(shè)的影響
網(wǎng)絡(luò)資源應(yīng)用和建設(shè)是數(shù)字圖書館進(jìn)行資源聚合過程時(shí)最為重要的內(nèi)容,必須有較高的資源利用率和完善的建設(shè)體系才能使資源聚合質(zhì)量得到保障?,F(xiàn)階段,數(shù)字圖書館在進(jìn)行資源建設(shè)過程中,只是將館內(nèi)開放網(wǎng)絡(luò)資源與自身擁有的資源進(jìn)行簡單的聚合,嚴(yán)重忽視了數(shù)據(jù)集間深層次與館內(nèi)部門交流合作對資源聚合的相關(guān)影響。主要體現(xiàn)在如下方面。
(1)在資源聚合過程中,只是將知識(shí)、信息、數(shù)據(jù)之間的表層進(jìn)行鏈接,而沒有深入挖掘數(shù)據(jù)集間的關(guān)系互聯(lián)。這種情況下,不僅對資源聚合質(zhì)量產(chǎn)生了影響,同時(shí)還對知識(shí)服務(wù)效果產(chǎn)生了影響。
(2)在資源聚合過程中,知識(shí)集成主要是指對信息資源相關(guān)內(nèi)容進(jìn)行語義聚合。但是就目前工作的實(shí)際情況來看,數(shù)字圖書館中對關(guān)聯(lián)知識(shí)挖掘力度不夠,同時(shí)也不能挖掘出其中所蘊(yùn)含的隱性知識(shí)。
除此之外,數(shù)字圖書館在運(yùn)行過程中,異構(gòu)分布式知識(shí)庫不能得到有效的應(yīng)用,導(dǎo)致無法實(shí)現(xiàn)可視化管理,對資源聚合質(zhì)量產(chǎn)生了一定影響。
1.3? 交互機(jī)制的影響
現(xiàn)階段,數(shù)字圖書館中的交互機(jī)制比較單一,這種影響因素對資源聚合質(zhì)量最為直接的影響便是難以實(shí)現(xiàn)個(gè)性化服務(wù)和資源共享。目前,在數(shù)字圖書館中,交互機(jī)制的交互形式主要是用戶與系統(tǒng)、用戶與資源之間的交互,但是沒有考慮用戶與用戶之間的交互,而用戶在與系統(tǒng)進(jìn)行交互時(shí),只限于用戶檢索信息對資源進(jìn)行分析和統(tǒng)計(jì)。資源聚合的個(gè)性化服務(wù)主要體現(xiàn)在分析與統(tǒng)計(jì)用戶信息之后,可以對用戶比較感興趣的知識(shí)、信息以及數(shù)據(jù)進(jìn)行推送,同時(shí)根據(jù)不同類型的用戶提供不同的服務(wù),在此過程中,不僅可以將有潛力的數(shù)字資源推薦給用戶,同時(shí)也可以為有共同需求的用戶提供相互溝通的平臺(tái),從而滿足其個(gè)性化需求。
2? 數(shù)字圖書館資源聚合質(zhì)量控制策略
2.1? 運(yùn)用關(guān)聯(lián)數(shù)據(jù)聚合數(shù)字資源
針對資源聚合度和共享影響因素,數(shù)字圖書館要運(yùn)用關(guān)聯(lián)數(shù)據(jù)方法來控制資源聚合的質(zhì)量。運(yùn)用關(guān)聯(lián)數(shù)據(jù)聚合數(shù)字資源的步驟如下。
(1)創(chuàng)建關(guān)聯(lián)數(shù)據(jù)。創(chuàng)建關(guān)聯(lián)數(shù)據(jù)是數(shù)據(jù)關(guān)聯(lián)實(shí)現(xiàn)的第一步,首先利用RDF來表述知識(shí)、信息、數(shù)據(jù)的語義和內(nèi)部結(jié)構(gòu)。這種表述是利用數(shù)據(jù)轉(zhuǎn)換和元數(shù)據(jù)實(shí)現(xiàn)的。其次,利用系統(tǒng)機(jī)制儲(chǔ)存RDF表述信息,并且支持用戶使用公共方法對存儲(chǔ)信息進(jìn)行檢索。最后,利用RDF對館藏?cái)?shù)據(jù)資源進(jìn)行存儲(chǔ)。前端利用Puppy作為數(shù)據(jù)關(guān)聯(lián)服務(wù)的服務(wù)器,以此來實(shí)時(shí)更新館藏的數(shù)據(jù)資源。同時(shí),利用映射關(guān)聯(lián)和非映射關(guān)聯(lián)兩種方法對數(shù)據(jù)進(jìn)行關(guān)聯(lián)。
(2)發(fā)布關(guān)聯(lián)數(shù)據(jù)。將新生成的或者是現(xiàn)有的數(shù)據(jù)以RDF三元組的方式進(jìn)行發(fā)布,使發(fā)布對象形成統(tǒng)一的URI。具體發(fā)布方法有兩種,其一是利用描述框架將數(shù)據(jù)結(jié)構(gòu)化進(jìn)行發(fā)布;其二是利用RDF連接統(tǒng)一發(fā)布不同數(shù)據(jù)集。
(3)瀏覽關(guān)聯(lián)數(shù)據(jù)。在進(jìn)行數(shù)據(jù)關(guān)聯(lián)的過程中,主要目的是為用戶提供分布式和多樣化的網(wǎng)絡(luò)資源,對不同數(shù)據(jù)源的資源聚合。瀏覽關(guān)聯(lián)數(shù)據(jù)需要利用專門的插件或者是瀏覽器。如Disco Low-level Data Browser、Tabulator Browser、Marbles等瀏覽器。這類瀏覽器在服務(wù)器端運(yùn)行,為用戶提供檢索接口和瀏覽界面,其中只有為數(shù)不多的服務(wù)是利用插件進(jìn)行的。
2.2? 運(yùn)用語義網(wǎng)環(huán)境聚合數(shù)字資源
針對資源應(yīng)用與建設(shè)的影響,可以運(yùn)用語義網(wǎng)環(huán)境對資源聚合質(zhì)量進(jìn)行控制。在運(yùn)用語義網(wǎng)環(huán)境進(jìn)行資源聚合時(shí),需要從以下幾方面進(jìn)行。
(1)主題模型的應(yīng)用。在語義網(wǎng)環(huán)境中,主題模型的應(yīng)用主要體現(xiàn)在兩方面,一方面是圖形圖像;另一方面是處理文本知識(shí)。生成文獻(xiàn)的模擬過程需要主題模型的支持,詞項(xiàng)中很多主題集合存于共現(xiàn)信息中,需要從共現(xiàn)信息中抽取與語義匹配的主題集合,并估計(jì)參數(shù),同時(shí)挖掘其中的文本。隨后利用主題模型使其形成一個(gè)新的主題。
(2)信息整合。在異質(zhì)和異構(gòu)資源中利用相關(guān)技術(shù)或者是標(biāo)準(zhǔn)進(jìn)行邏輯和物理上的互通互聯(lián),實(shí)現(xiàn)多種資源的一站式搜索便是信息整合?;谛畔⒄戏椒▽?shù)字資源進(jìn)行深度聚合,可以有效地組織和揭示各種數(shù)據(jù)之間存在的關(guān)系。同時(shí)用戶關(guān)聯(lián)資源獲取時(shí),能夠一步到位,實(shí)現(xiàn)資源的一站式搜索。信息整合共分為四層,其一數(shù)據(jù)源層要制定元數(shù)據(jù)標(biāo)準(zhǔn);其二信息組織和描述層使用關(guān)鍵技術(shù)為RDF技術(shù);其三語義整合層在檢測本體一致性和實(shí)現(xiàn)語義推理時(shí),運(yùn)用的規(guī)則是語義規(guī)則;其四用戶交換層的主要作用是接收整合的信息,以此為用戶提供相應(yīng)的服務(wù)。
2.3? 運(yùn)用大數(shù)據(jù)技術(shù)聚合數(shù)字資源
隨著新時(shí)代的來臨,大數(shù)據(jù)技術(shù)的應(yīng)用趨勢勢不可擋。數(shù)字圖書館中的各類資源數(shù)量非常龐大,在聚合數(shù)字資源過程中,如果不應(yīng)用現(xiàn)代科技技術(shù),是無法對數(shù)據(jù)背后的隱性知識(shí)進(jìn)行充分挖掘的,這種情況導(dǎo)致難以實(shí)現(xiàn)個(gè)性化服務(wù)和資源共享。運(yùn)用大數(shù)據(jù)對資源聚合質(zhì)量進(jìn)行控制時(shí),可以利用大數(shù)據(jù)中的計(jì)量分析技術(shù)對館藏?cái)?shù)據(jù)資源之間的語義聯(lián)系進(jìn)行構(gòu)建,結(jié)合信息資源轉(zhuǎn)換和語義知識(shí)替換現(xiàn)有數(shù)字資源關(guān)系,使圖書館中數(shù)據(jù)資源的表達(dá)形成一個(gè)與元數(shù)據(jù)相關(guān)聯(lián)的網(wǎng)絡(luò)。在此過程中,對資源所處的中間環(huán)境進(jìn)行構(gòu)建,可以使信息體在與環(huán)境相適應(yīng)的同時(shí),還能夠?qū)崿F(xiàn)語義互相操作的功能。大數(shù)據(jù)技術(shù)挖掘出的資源聚合語義關(guān)系非常深,而且計(jì)算機(jī)處理的數(shù)據(jù)量也非常大。同時(shí)利用大數(shù)據(jù)在分析數(shù)字資源語義化時(shí),舍棄了部分領(lǐng)域關(guān)系,計(jì)算機(jī)處理效率在一定程度上得以提高。這樣可以有效地實(shí)現(xiàn)資源的深度聚合,并為用戶提供良好的個(gè)性化服務(wù)。
3? 結(jié)? 論
綜上所述,數(shù)字圖書館資源聚合質(zhì)量受到多方面的影響。經(jīng)過上文分析可得,實(shí)現(xiàn)數(shù)據(jù)關(guān)聯(lián),對更好地利用知識(shí)體的聯(lián)系有非常大的幫助,同時(shí)還可實(shí)時(shí)更新館藏的數(shù)據(jù)資源。而在語義網(wǎng)環(huán)境下,運(yùn)用相關(guān)技術(shù)對資源聚合進(jìn)行分層次處理,可以有效解決其應(yīng)用和建設(shè)問題。大數(shù)據(jù)技術(shù)的應(yīng)用,可以對資源數(shù)據(jù)進(jìn)行深層次挖掘,實(shí)現(xiàn)個(gè)性化服務(wù),從而提高資源聚合的質(zhì)量。
參考文獻(xiàn):
[1] 畢強(qiáng),閆晶,李潔,等.基于扎根理論的數(shù)字圖書館資源聚合質(zhì)量影響因素研究 [J].情報(bào)理論與實(shí)踐,2018,41(5):61-66+38.
[2] 趙穎星.數(shù)字圖書館信息資源質(zhì)量的影響因素分析 [J].中國管理信息化,2018,21(6):166-167.
[3] 王福.數(shù)字圖書館資源聚合質(zhì)量影響因素研究 [J].情報(bào)理論與實(shí)踐,2016,39(12):86-90+113.
作者簡介:聶夢迪(1985.02-),女,漢族,安徽合肥人,中級職稱,館員,碩士研究生,研究方向:圖書館管理。