国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

圖書館學(xué)科文獻(xiàn)推薦服務(wù)模型探討

2022-02-14 02:48潘雪峰
關(guān)鍵詞:館員神經(jīng)網(wǎng)絡(luò)人工智能

潘雪峰

圖書館學(xué)科文獻(xiàn)推薦服務(wù)模型探討

潘雪峰

(遼寧工業(yè)大學(xué) 圖書館,遼寧 錦州 121001)

便捷高效的文獻(xiàn)檢索為科學(xué)研究提供有力支持。本文以圖書館為背景,結(jié)合人工智能方法提出學(xué)科文獻(xiàn)推薦服務(wù)模型,為圖書館的學(xué)科建設(shè)提供參考。首先,簡(jiǎn)述了學(xué)科館員在深入服務(wù)學(xué)科科研工作基礎(chǔ)上給出的專業(yè)的文獻(xiàn)推薦意見。其次,介紹了基于深度神經(jīng)網(wǎng)絡(luò)構(gòu)建的人工智能文獻(xiàn)推薦模型。兩種模式都從各自的原理、意義及存在問題進(jìn)行闡述。最后,將兩種模式進(jìn)行整合。本文提出了學(xué)科文獻(xiàn)推薦服務(wù)模型并介紹其原理和意義,以期為圖書館學(xué)科文獻(xiàn)推薦服務(wù)提供一種新的方法。

深度神經(jīng)網(wǎng)絡(luò);專業(yè)文獻(xiàn)推薦;學(xué)科文獻(xiàn)推薦服務(wù)

一、引言

《全民科學(xué)素質(zhì)行動(dòng)規(guī)劃綱要(2021—2035年)》一文中,特別強(qiáng)調(diào)了科技創(chuàng)新的重要性,科學(xué)普及的必要性。作為知識(shí)寶庫的圖書館必將成為高校發(fā)展的重點(diǎn)。2017年我國(guó)實(shí)行“雙一流”高校圖書館學(xué)科建設(shè),從不同學(xué)科對(duì)科研文獻(xiàn)的需求出發(fā),以學(xué)科服務(wù)為指南,采用先進(jìn)的技術(shù)設(shè)備,結(jié)合館員自身素養(yǎng)的提升,為廣大讀者提供優(yōu)質(zhì)的文獻(xiàn)推薦服務(wù)。然而,由于種種原因,相關(guān)問題不斷顯現(xiàn)。進(jìn)入21世紀(jì)后,人工智能得到迅猛發(fā)展,各種人工智能推薦算法層出不窮,在文獻(xiàn)推薦方面,由于個(gè)性化數(shù)據(jù)較少,文獻(xiàn)推薦缺乏針對(duì)性。因此,將二者相結(jié)合,規(guī)避各自的問題,凸顯各自的優(yōu)勢(shì),學(xué)科文獻(xiàn)推薦模型就顯得尤為重要。

二、專業(yè)文獻(xiàn)推薦

(一)專業(yè)文獻(xiàn)推薦原理

自2010年起,我國(guó)高校圖書館學(xué)科服務(wù)平臺(tái)建設(shè)取得了顯著的成效[1]。學(xué)科服務(wù)以學(xué)科館員工作為核心。各高校建立學(xué)科館員團(tuán)隊(duì),通過學(xué)科館員深入了解不同學(xué)科的文獻(xiàn)需求,提供專業(yè)的文獻(xiàn)推薦服務(wù),如圖1所示。本文總結(jié)了學(xué)科館員在學(xué)科服務(wù)工作中應(yīng)完成的8項(xiàng)基本工作。

(二)專業(yè)文獻(xiàn)推薦意義

高校圖書館作為支持高??蒲泄ぷ鞯闹袌?jiān)力量,在加強(qiáng)圖書管理的同時(shí),更應(yīng)為高校各學(xué)科科研提供專業(yè)文獻(xiàn)推薦服務(wù)。在《為圖書館行業(yè)提供思想》[2]一文中,范并思教授指出,由于圖書館服務(wù)需求不足,高校圖書館最重要的紙質(zhì)圖書資源淪為裝飾閱讀空間的“壁紙”。專業(yè)文獻(xiàn)推薦有助于提升圖書館的服務(wù)質(zhì)量,為科研工作的順利進(jìn)行提供幫助,節(jié)省大量的文獻(xiàn)搜索時(shí)間,尤其對(duì)科研工作剛剛起步的教師和學(xué)生有很大的引導(dǎo)作用。同時(shí),向取得一定科研成果的教師和學(xué)生搜集文獻(xiàn)推薦意見也可以起到事半功倍的作用。專業(yè)文獻(xiàn)推薦為高校科研事業(yè)的發(fā)展提供便利條件。

(三)專業(yè)文獻(xiàn)推薦存在問題

目前,由于學(xué)科服務(wù)實(shí)施過程中存在漏洞,專業(yè)文獻(xiàn)推薦出現(xiàn)了一些問題。首先,從學(xué)科服務(wù)專業(yè)理論的角度來看,學(xué)科服務(wù)還屬于探索的初期階段。學(xué)科館員多數(shù)都是半路出家,對(duì)不同專業(yè)的文獻(xiàn)推薦也處于摸索階段,推薦結(jié)果有一定的偏差。其次,學(xué)科服務(wù)沒有達(dá)到前瞻性。目前大多數(shù)高校學(xué)科館員都兼職其他工作,沒有時(shí)間和精力去對(duì)比篩選所搜索的文獻(xiàn),都是簡(jiǎn)單的文獻(xiàn)推送和傳遞,導(dǎo)致讀者收到大量相似文獻(xiàn),服務(wù)滿意度不高。最后,從咨詢專家、專業(yè)教師推薦的文獻(xiàn)來看,由于專家、專業(yè)教師自身學(xué)術(shù)研究功底較好,經(jīng)常關(guān)注本專業(yè)發(fā)展較快的期刊,脫離了本校學(xué)生的基礎(chǔ),常常導(dǎo)致推薦的文獻(xiàn)對(duì)于本專業(yè)學(xué)生來說顯得過難,無法體現(xiàn)推薦價(jià)值。

圖1 學(xué)科館員8項(xiàng)基本工作

三、人工智能文獻(xiàn)推薦模型

(一)人工智能文獻(xiàn)推薦模型原理

1997年RESNICK和VARIAN提出推薦系統(tǒng)[3],淘寶、京東等都屬于電子商務(wù)推薦系統(tǒng)。然而推薦方法多出現(xiàn)數(shù)據(jù)稀疏和冷啟動(dòng)問題[4]。為了避免這兩個(gè)問題,文獻(xiàn)推薦在推薦系統(tǒng)模式的基礎(chǔ)上,以大數(shù)據(jù)為背景,應(yīng)用深度學(xué)習(xí)的方式構(gòu)建人工智能文獻(xiàn)推薦模型。2021年《中國(guó)互聯(lián)網(wǎng)發(fā)展報(bào)告》顯示,我國(guó)大數(shù)據(jù)產(chǎn)業(yè)規(guī)模不斷擴(kuò)大,主要由于互聯(lián)網(wǎng)移動(dòng)端發(fā)展顯著。各行各業(yè)匯集著大量數(shù)據(jù),圖書館也不例外。應(yīng)用人工智能研究大數(shù)據(jù)背后的聯(lián)系成為很多學(xué)者研究的方向。徐磊等[5]依據(jù)大數(shù)據(jù)對(duì)讀者個(gè)人信息保護(hù)進(jìn)行了研究。本文對(duì)深度學(xué)習(xí)模型進(jìn)行了總結(jié),此模型一般包括數(shù)據(jù)收集、模型構(gòu)建、模型優(yōu)化、評(píng)價(jià)標(biāo)準(zhǔn)四個(gè)部分,如圖2所示。

圖2 深度學(xué)習(xí)模型

1. 數(shù)據(jù)收集

圖書館的數(shù)據(jù)多來自于數(shù)據(jù)庫的積累。除圖書館自身管理的數(shù)據(jù)庫以外,電子資源數(shù)據(jù)庫也是圖書館強(qiáng)大的數(shù)據(jù)支持,如超星數(shù)據(jù)庫、中國(guó)知網(wǎng)CNKI數(shù)據(jù)庫等。各種數(shù)據(jù)庫收集的數(shù)據(jù)量越來越多。從大數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)內(nèi)部的奧秘成為各行各業(yè)追趕的方向。為了使模型推薦的文獻(xiàn)更具專業(yè)性,在圖書館已有數(shù)據(jù)庫的基礎(chǔ)上,還要收集應(yīng)用OPAC(Open Public Access Catalogue)檢索機(jī)檢索文獻(xiàn)的個(gè)性化數(shù)據(jù),如讀者所在學(xué)科、喜歡書目偏好以及檢索后的滿意度評(píng)分等。通過這些數(shù)據(jù)構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型,發(fā)現(xiàn)大數(shù)據(jù)背后的秘密。

2. 模型構(gòu)建

自2006年HINTON提出了深度置信網(wǎng)絡(luò)(DBN)后,深度學(xué)習(xí)進(jìn)入了發(fā)展的提速期。深度學(xué)習(xí)本質(zhì)是復(fù)雜的人工神經(jīng)網(wǎng)絡(luò),又名深度神經(jīng)網(wǎng)絡(luò),是模式識(shí)別的一種模型構(gòu)建方法。采用多隱層、多層感知器的結(jié)構(gòu)。深度學(xué)習(xí)具有學(xué)習(xí)能力強(qiáng)、覆蓋范圍廣、適應(yīng)性好的特點(diǎn)。

模型構(gòu)建方法的選擇需要依據(jù)數(shù)據(jù)的特點(diǎn)而定。從其發(fā)展順序來看,深度神經(jīng)網(wǎng)絡(luò)最早使用自編碼機(jī)[6]、玻爾茲曼機(jī)[7]、深度信念網(wǎng)絡(luò)等方法構(gòu)建模型。近些年卷積神經(jīng)網(wǎng)絡(luò)[8]和循環(huán)神經(jīng)網(wǎng)絡(luò)[9]應(yīng)用較多,其主要原因是卷積神經(jīng)網(wǎng)絡(luò)可通過卷積算法抓住局部特征,通過參數(shù)共享,加快算法速度,降低網(wǎng)絡(luò)模型的復(fù)雜度,對(duì)于圖像處理優(yōu)勢(shì)明顯。循環(huán)神經(jīng)網(wǎng)絡(luò)改變了一般神經(jīng)網(wǎng)絡(luò)同層間神經(jīng)元相互獨(dú)立的特點(diǎn),使得同層神經(jīng)元互相連接,對(duì)過去信息進(jìn)行記憶。隨著科技的發(fā)展,更多的模型構(gòu)建方法會(huì)大量出現(xiàn),這也是科技創(chuàng)新的熱點(diǎn)方向。對(duì)于構(gòu)建圖書館人工智能文獻(xiàn)推薦模型選擇哪種方法要根據(jù)圖書館的具體情況而定,如高校學(xué)科設(shè)置偏向、學(xué)術(shù)研究?jī)A向等,并經(jīng)過大量的試驗(yàn)綜合給出推薦結(jié)果。

值得注意的是,在模型構(gòu)建前,數(shù)據(jù)的粗糙性經(jīng)常需要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,如由于數(shù)據(jù)部分缺失導(dǎo)致大量數(shù)據(jù)不可用,應(yīng)用一些方法將缺失值補(bǔ)齊;由于量綱不同導(dǎo)致數(shù)據(jù)沒有可比性,經(jīng)常要對(duì)數(shù)據(jù)進(jìn)行換算處理,使數(shù)據(jù)不至于極端化。

3. 模型優(yōu)化

模型構(gòu)建后還需要進(jìn)行優(yōu)化。優(yōu)化方式如下:

(1)模型相應(yīng)參數(shù)的優(yōu)化,如梯度下降算法;(2)激活函數(shù)的選擇,如ReLU[10]、Sigmoid[11]等;(3)模型構(gòu)建時(shí)應(yīng)盡量簡(jiǎn)化,防止過擬合現(xiàn)象出現(xiàn)。過擬合通常由于數(shù)據(jù)太少,無法反映真實(shí)分布、數(shù)據(jù)含有噪聲,模型覆蓋噪音點(diǎn)、模型訓(xùn)練過度等原因產(chǎn)生,因此可以采用Dro-pout、DropConnect等方法防止過擬合。

本文提到的優(yōu)化方法只是模型優(yōu)化方法的一小部分,更多的優(yōu)化方法值得進(jìn)一步研究。

4. 評(píng)價(jià)標(biāo)準(zhǔn)

模型構(gòu)建的好壞可以通過一些評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行衡量。深度學(xué)習(xí)模型常采用準(zhǔn)確率、混淆矩陣等進(jìn)行評(píng)價(jià)。標(biāo)準(zhǔn)的選擇也要根據(jù)數(shù)據(jù)的特點(diǎn),有的模型只選擇其中一種評(píng)價(jià)標(biāo)準(zhǔn),有的模型選擇其中幾種輔以相應(yīng)的參數(shù)協(xié)同評(píng)價(jià)。

(二)人工智能文獻(xiàn)推薦模型意義

2017年,隨著大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算的迅速發(fā)展,智慧圖書館成為我國(guó)具有代表性的圖書館形態(tài)。智慧圖書館呈現(xiàn)出服務(wù)理念和人性化服務(wù),因此,各種推薦系統(tǒng)層出不窮。人工智能文獻(xiàn)推薦模型對(duì)于圖書館員來說可以節(jié)省大量的數(shù)據(jù)統(tǒng)計(jì)時(shí)間。通過模型發(fā)現(xiàn)大數(shù)據(jù)的潛在價(jià)值,使推薦結(jié)果更加智能化、專業(yè)化、人性化。同時(shí),推薦服務(wù)對(duì)象覆蓋面廣,可以節(jié)約讀者很多閱讀時(shí)間,用最快的速度提供最優(yōu)質(zhì)的服務(wù)。

四、學(xué)科文獻(xiàn)推薦服務(wù)模型

(一)學(xué)科文獻(xiàn)推薦服務(wù)模型構(gòu)建原理

本文提出學(xué)科文獻(xiàn)推薦服務(wù)模型,如圖3所示。模型包括兩部分,分別為專業(yè)文獻(xiàn)推薦和人工智能文獻(xiàn)推薦兩個(gè)方面。

圖3 學(xué)科文獻(xiàn)推薦服務(wù)模型

在專業(yè)文獻(xiàn)推薦部分,根據(jù)學(xué)科館員對(duì)服務(wù)學(xué)科的教師和學(xué)生進(jìn)行詢問溝通發(fā)現(xiàn)其文獻(xiàn)需求,通過專家、教師的推薦以及學(xué)科館員自身科研素質(zhì)的提高,最終為讀者提供專業(yè)的文獻(xiàn)推薦服務(wù);人工智能文獻(xiàn)推薦部分,通過圖書館數(shù)據(jù)庫的積累和OPAC檢索機(jī)個(gè)性化數(shù)據(jù)的收集,應(yīng)用深度學(xué)習(xí)方法進(jìn)行模型構(gòu)建,通過優(yōu)化方法結(jié)合評(píng)價(jià)標(biāo)準(zhǔn)完善模型構(gòu)建,最終給出人工智能文獻(xiàn)推薦結(jié)果。計(jì)算人工智能文獻(xiàn)推薦結(jié)果與專業(yè)文獻(xiàn)推薦意見的相似度,如歐氏距離方法。

其中x表示專業(yè)文獻(xiàn)推薦的結(jié)果,y表示人工智能文獻(xiàn)推薦結(jié)果。當(dāng)用歐幾里得距離表示相似度,一般采用以下公式進(jìn)行轉(zhuǎn)換規(guī)約到(0, 1]之間,轉(zhuǎn)換公式為:

為了更加直觀,本文的相似度采用百分制,即:

相似度在s>90%以上直接將人工智能文獻(xiàn)推薦結(jié)果推送給讀者,相似度s≤90%及以下將專業(yè)文獻(xiàn)推薦結(jié)果推送給讀者,并將每次推薦結(jié)果乘以50%反饋給人工智能文獻(xiàn)推薦模型,起到反饋調(diào)整的作用。

需要強(qiáng)調(diào)的是,這里的90%和50%僅作為一個(gè)案例參考,具體數(shù)值要根據(jù)不同圖書館的具體數(shù)據(jù)而定,需要不斷地調(diào)整這些參數(shù)達(dá)到模型的最優(yōu)化,并非參數(shù)越大越好。

(二)學(xué)科文獻(xiàn)推薦服務(wù)模型舉例

專業(yè)文獻(xiàn)推薦多以教師自身的學(xué)科素養(yǎng)和教學(xué)實(shí)踐為主,如推薦一本關(guān)于Python的書籍,教師根據(jù)自身接觸的Python相關(guān)資料會(huì)推薦其教學(xué)中常見的書籍《Python基礎(chǔ)教程》。以人工智能文獻(xiàn)推薦的方式,應(yīng)用深度學(xué)習(xí)方法,將與Python相關(guān)的書籍信息輸入模型中,經(jīng)過分析計(jì)算,推薦書籍為《Python基礎(chǔ)教程第三版》。應(yīng)用歐氏距離方法計(jì)算出兩種推薦結(jié)果相似度在90%以上,因此最終推薦結(jié)果為《Python基礎(chǔ)教程第三版》。若專業(yè)文獻(xiàn)推薦書籍為《Python學(xué)習(xí)手冊(cè)》,人工智能文獻(xiàn)推薦為《Python基礎(chǔ)教程第三版》,應(yīng)用歐氏距離方法計(jì)算出兩種推薦結(jié)果相似度在90%以下,則推薦結(jié)果為《Python學(xué)習(xí)手冊(cè)》更具說服力。同時(shí),將每次的結(jié)果都乘以50%的系數(shù)放到下次人工智能文獻(xiàn)推薦模型相關(guān)預(yù)測(cè)的基礎(chǔ)數(shù)據(jù)中,便于模型的自我矯正。經(jīng)過測(cè)試,應(yīng)用學(xué)科文獻(xiàn)推薦服務(wù)模型推薦的結(jié)果很大程度上能夠滿足讀者的需求。

(三)學(xué)科文獻(xiàn)推薦服務(wù)模型意義

本模型既考慮了專業(yè)文獻(xiàn)推薦的學(xué)術(shù)性又利用大數(shù)據(jù)的潛在價(jià)值構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型,二者相結(jié)合,既解決了專業(yè)文獻(xiàn)推薦由于學(xué)科館員自身專業(yè)素養(yǎng)不夠、推薦文獻(xiàn)量大、不精準(zhǔn)的問題,又解決了人工智能文獻(xiàn)推薦模型由于數(shù)據(jù)量不夠、模型優(yōu)化不完善、推薦沒有專業(yè)化的問題。為高校師生科研文獻(xiàn)需求提供專業(yè)化服務(wù),對(duì)高校的學(xué)科發(fā)展起到推進(jìn)作用,是圖書館科技創(chuàng)新和專業(yè)服務(wù)的具體體現(xiàn)。

五、結(jié)論

學(xué)科服務(wù)已經(jīng)成為很多高校圖書館的發(fā)展趨勢(shì),但隨之而來的問題也不斷涌現(xiàn),如何找到更加智能化、更加人性化的服務(wù)方式成為很多圖書館的研究方向。人工智能的出現(xiàn),尤其是深度神經(jīng)網(wǎng)絡(luò)的研究在很多領(lǐng)域都取得了顯著成效。目前,圖書館應(yīng)用人工智能設(shè)備已經(jīng)取得了一定成果,如人臉識(shí)別、自助借還機(jī)等都是圖像識(shí)別的具體體現(xiàn)。因此,本文結(jié)合專業(yè)文獻(xiàn)推薦和人工智能文獻(xiàn)推薦兩種模式,綜合衡量推薦結(jié)果,希望能夠?yàn)樽x者提供更加專業(yè)的文獻(xiàn)推薦服務(wù),為高校學(xué)科服務(wù)的發(fā)展提供有力的支持。

[1] 婁冰. “雙一流”高校圖書館學(xué)科服務(wù)現(xiàn)狀分析及對(duì)策研究[J]. 圖書館工作與研究, 2021(2): 106-112.

[2] 范并思. 為圖書館行業(yè)提供思想[J]. 圖書館建設(shè), 2021(1): 4-5.

[3] RESNICK P, VARIAN H R. Recommender systems[J]. Commu-nications of the ACM, 1997, 40(3): 56-58.

[4] 黃立威, 江碧濤, 呂守業(yè), 等. 基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 計(jì)算機(jī)學(xué)報(bào), 2018, 41(7): 1619-1647.

[5] 徐磊, 郭旭. 大數(shù)據(jù)時(shí)代讀者個(gè)人信息保護(hù)的實(shí)踐邏輯與規(guī)范路徑——以圖書類APP隱私政策文本為視角[J]. 圖書館建設(shè), 2021(1): 74-83+92.

[6] 趙陽, 朱全銀, 胡榮林, 等. 基于自編碼機(jī)和聚類的混合推薦算法[J]. 微電子學(xué)與計(jì)算機(jī), 2018, 35(11): 52-56.

[7] 沈筱譞. 深度學(xué)習(xí)推薦方法及應(yīng)用研究[D]. 武漢: 華中師范大學(xué), 2020.

[8] 林景棟, 吳欣怡, 柴毅, 等. 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化綜述[J]. 自動(dòng)化學(xué)報(bào), 2020, 46(1): 24-37.

[9] 王菲. LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的研究進(jìn)展與應(yīng)用[D]. 哈爾濱: 黑龍江大學(xué), 2021.

[10] 蔣昂波, 王維維. ReLU激活函數(shù)優(yōu)化研究[J]. 傳感器與微系統(tǒng), 2018, 37(2): 50-52.

[11] NGUYEN VAN-TRUONG, 蔡覺平, 魏琳育, 等. Sigmoid函數(shù)的低復(fù)雜度概率分段線性擬合法[J]. 西安電子科技大學(xué)學(xué)報(bào), 2020, 47(3): 58-65.

10.15916/j.issn1674-327x.2022.06.011

TP391.3;G258.6

A

1674-327X (2022)06-0041-04

2022-02-24

潘雪峰(1990-),女,黑龍江齊齊哈爾人,館員,碩士。

(責(zé)任編輯:許偉麗)

猜你喜歡
館員神經(jīng)網(wǎng)絡(luò)人工智能
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
基于神經(jīng)網(wǎng)絡(luò)的中小學(xué)生情感分析
2019:人工智能
人工智能與就業(yè)
青海省人民政府關(guān)于轉(zhuǎn)聘謝承華、斗尕館員為榮譽(yù)館員的決定
勘誤
青海省人民政府關(guān)于轉(zhuǎn)聘謝佐等3位館員為榮譽(yù)館員的決定 青政〔2017〕32號(hào)
數(shù)讀人工智能
下一幕,人工智能!
基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
于都县| 横山县| 平泉县| 高清| 永兴县| 正蓝旗| 宣武区| 江西省| 双鸭山市| 防城港市| 宝山区| 石渠县| 龙井市| 南江县| 那曲县| 汉中市| 大荔县| 班玛县| 泾阳县| 卓尼县| 南澳县| 邹平县| 望奎县| 海淀区| 宾川县| 大冶市| 西乌珠穆沁旗| 四平市| 白朗县| 宜黄县| 玛曲县| 连城县| 桐梓县| 延边| 兖州市| 山阳县| 手游| 原平市| 榆社县| 鄂尔多斯市| 萝北县|