国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘在高校圖書館個性化推薦服務(wù)中的應(yīng)用

2020-04-14 04:54赴興華
電腦知識與技術(shù) 2020年4期

赴興華

摘要:文章以數(shù)據(jù)挖掘在高校圖書館個性化推薦服務(wù)中的應(yīng)用為研究對象,首先對據(jù)挖掘應(yīng)用于高校圖書館個性化推薦服務(wù)中的必要性進(jìn)行了探討分析,隨后討論了數(shù)據(jù)挖掘技術(shù)在高校圖書館個性化服務(wù)推薦中的應(yīng)用,最后提出了數(shù)據(jù)挖 掘技術(shù)在高校圖書館個性化服務(wù)推薦中的應(yīng)用實現(xiàn)方案,以供參考。

關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);高校圖書館;性化推薦服務(wù);應(yīng)用

中圖分類號:TP311

文獻(xiàn)標(biāo)識碼:A

文章編號:1009-3044(2020)04-0005-02

收稿日期:2019-11-25

在信息化環(huán)境下,人們獲取信息的方式與途徑越來越多,對于高校圖書館運(yùn)營帶來了一定的沖擊與影響,需要高校圖書館提供個性化閱推薦服務(wù),不斷提升自身的服務(wù)水平。在這一過程中,數(shù)據(jù)挖掘技術(shù)發(fā)揮著重要作用。因此需要加強(qiáng)對數(shù)據(jù)挖掘在高校圖書館個性化推薦服務(wù)中的應(yīng)用分析,對于推動高校圖書館實現(xiàn)可持續(xù)發(fā)展具有重要的意義。

1?數(shù)據(jù)挖掘應(yīng)用于高校圖書館個性化推薦服務(wù)中的必要性

首先,數(shù)據(jù)挖掘能夠有效提升高校圖書館藏書資源的利用率。隨著信息技術(shù)廣泛應(yīng)用于圖書館數(shù)字化建設(shè),使得圖書館藏書資源由紙質(zhì)化逐漸向數(shù)字化方向轉(zhuǎn)變。一方面這種轉(zhuǎn)變?yōu)閿?shù)據(jù)挖掘技術(shù)在圖書館個性化推薦服務(wù)中提供了良好的應(yīng)用條件,另一方面也極大提升了人們利用圖書館藏書資源的效率,以往學(xué)生或教師到圖書館查閱書籍資料,需要人工查找、翻閱,費(fèi)時費(fèi)力,如今能夠直接在線搜索圖書館數(shù)字化資源,使得圖書館藏書資源得到了更好的應(yīng)用,有效提升了圖書館資源的利用率。

另一方面,面對高校圖書館用戶信息需求日益多樣化現(xiàn)狀,必然需要應(yīng)用數(shù)據(jù)挖掘技術(shù)才能更好地實現(xiàn)高校圖書館個性化推薦服務(wù)。如今隨著高校數(shù)字化圖書館逐漸建設(shè)完善,在圖書館服務(wù)需求方面,主要呈現(xiàn)岀以下變化:一是用戶主體變得多樣化,信息化環(huán)境下,高校圖書館服務(wù)用戶主體范圍進(jìn)一步擴(kuò)大,不僅包括本校教師學(xué)生,還包括一些校外的用戶;二是隨著用戶主體增加,相應(yīng)信息服務(wù)需求也日益豐富;三是在上述情況之下,需要高校圖書館為用戶群體提供多樣化的服務(wù)形式與方式,因此為實現(xiàn)上述目標(biāo),必然需要應(yīng)用大數(shù)據(jù)挖掘技術(shù)。

2?數(shù)據(jù)挖掘技術(shù)在高校圖書館個性化服務(wù)推薦中的應(yīng)用

2.1?以關(guān)聯(lián)規(guī)則為基礎(chǔ)的推薦算法

在數(shù)據(jù)挖掘技術(shù)之中,關(guān)聯(lián)推薦算法是其中重要的組成部分,該算法在各個領(lǐng)域之中均有著廣泛的應(yīng)用,其中最經(jīng)典的是在零售領(lǐng)域中,對用戶購物車分析應(yīng)用。在高校圖書館個性化推薦服務(wù)中,通過應(yīng)用關(guān)聯(lián)規(guī)則推薦算法,能夠根據(jù)用戶查詢文獻(xiàn)的頻率、數(shù)量、文獻(xiàn)類別等數(shù)據(jù)信息,從中推算出用戶查閱文獻(xiàn)的規(guī)律,并在用戶進(jìn)行文獻(xiàn)瀏覽、下載時,由系統(tǒng)自動向用戶推薦類似的文獻(xiàn),更好地滿足用戶查閱需求。

2.2?以查詢內(nèi)容為基礎(chǔ)的推薦算法

以查詢內(nèi)容為基礎(chǔ)的推薦算法,即是結(jié)合用戶查詢的文獻(xiàn)內(nèi)容,尋找用戶所查詢的文獻(xiàn)之間的相似性,并尋找用戶已經(jīng)評分文獻(xiàn)內(nèi)容,以此為依據(jù),建立用戶檔案模型,然后從諸多文獻(xiàn)之中,選擇與用戶檔案模型比較類似的文獻(xiàn),將其中一些評分較高的優(yōu)質(zhì)文獻(xiàn)推薦給用戶。

2.3?協(xié)同過濾推薦算法

一是圍繞用戶的協(xié)同過濾推薦。在實際應(yīng)用時,首先以用戶對文獻(xiàn)的評價日志為依據(jù),完成用戶間相似度計算,并根據(jù)計算結(jié)果,選擇出與目標(biāo)用戶最相似的幾鄰居用戶,然后參照鄰居用戶搜索內(nèi)容喜好,完成向目標(biāo)用戶的推薦。

二是圍繞物品的協(xié)同過濾推薦。該算法主要以用戶使用過的不同物品間相似度為依據(jù),來完成推薦預(yù)測。應(yīng)用到圖書館個性化推薦中,便是圍繞用戶已評價的文獻(xiàn)和待評價文獻(xiàn),查找兩者之間具有哪些相似之處,并以此為依據(jù),完成文獻(xiàn)可聚類,可有效提升文獻(xiàn)推薦的準(zhǔn)確度,更加符合用戶心意。

三是圍繞模型的協(xié)同過濾推薦。這種推薦應(yīng)用模式主要是對用戶以往的文獻(xiàn)查詢數(shù)據(jù)進(jìn)行學(xué)習(xí),并建立一個用戶模型,從中分析用戶搜索規(guī)律與個人喜好,具體可借助概率模型、貝葉斯網(wǎng)絡(luò)等數(shù)據(jù)挖掘技術(shù),來完成用戶文獻(xiàn)推薦。

3?數(shù)據(jù)挖掘技術(shù)在高校圖書館個性化服務(wù)推薦中的應(yīng)用實現(xiàn)方案

3.1?搭建云計算環(huán)境

由于高校圖書館大數(shù)據(jù)具有4V特征,即容量大(Volume)、速度快(Velocity)、多樣化(Variety);四是真實性高(Veracity)。因此在進(jìn)行云環(huán)境搭建時,可選擇“成衫。叩”云環(huán)境平臺。該平臺釆用的系統(tǒng)為“HDFS”分布式文件系統(tǒng),能夠?qū)崿F(xiàn)穩(wěn)定可靠的數(shù)據(jù)云存儲,并且平臺之中融入了既a以內(nèi)存計算技術(shù)與MapReduce映射制約技術(shù),因此有著非常高的數(shù)據(jù)處性能。并且該軟件是開源軟件,不需要花費(fèi)資金購買,能夠有效實現(xiàn)成本節(jié)約。

3.2?具體實現(xiàn)方案設(shè)計

首先是線上部分。在數(shù)據(jù)收集上,利用“HDFS”分布式文件系統(tǒng)完成高校圖書館大數(shù)據(jù)存儲。利用HBase數(shù)據(jù)庫管理系統(tǒng),能夠?qū)Σ煌愋偷膱D書館大數(shù)據(jù)進(jìn)行讀寫和隨機(jī)訪問。個性化服務(wù)算法應(yīng)用,離不開用戶行為數(shù)據(jù)支持,因此需要收集用戶訪問日志。在前端應(yīng)用方面,前端主要負(fù)責(zé)各種網(wǎng)頁或推薦請求接受,在經(jīng)過初步處理后,會傳遞給后端引擎進(jìn)行處理,在受到處理結(jié)果后,及時返回給用戶。在云平臺關(guān)聯(lián)數(shù)據(jù)技術(shù)的幫助下,通過利用海量語義網(wǎng)知識庫檢索,從而能夠為用戶提供實時性、交互性個性化服務(wù)。

然后是線下部分:一是角色建模,這種建模具體分為兩部分,一是用戶建模,通過收集用戶行為信息,完成用戶模型的建立,并根據(jù)用戶模型,來分析用戶喜好;二是文獻(xiàn)建模,主要是以文獻(xiàn)領(lǐng)域?qū)傩浴⒂脩粼L問文獻(xiàn)數(shù)據(jù)信息為依據(jù),完成文獻(xiàn)模型建立。在上述兩種模型建立中,都能夠依托于“MapReduce”計算框架來實現(xiàn)。并且在HBase數(shù)據(jù)庫管理系統(tǒng)的幫助下,能夠?qū)崿F(xiàn)對模型的分布式存儲和檢索。在上述模型構(gòu)建的基礎(chǔ)之上,通過利用各種推薦算法,能夠有效幫助用戶找到自身需要的文獻(xiàn),提升個性化服務(wù)土建質(zhì)量?!癕ahout”是Hadoop與MapReduce計算框架的可擴(kuò)展軟件包,它在高校圖書館大數(shù)據(jù)處理上,有著卓越的能力。通過利用該擴(kuò)展軟件,能夠促使高校圖書館個性化服務(wù)特點得以有效凸顯。

最后是選擇個性化推薦服務(wù)算法。在選擇個性化推薦服務(wù)算法前,應(yīng)注意做好用戶常見內(nèi)容特征與常見行為特征的分析。然后以此為依據(jù),完成相應(yīng)性化推薦服務(wù)算法選擇。例如在選擇協(xié)同過濾推薦算法時,需要結(jié)合實際,從準(zhǔn)確性、高效性、穩(wěn)定性三個角度,分析用戶過濾推薦與物品過濾推薦在高校圖書館個性化服務(wù)中的適用性。一是在準(zhǔn)確性上,相對于購物網(wǎng)站用戶,高校校圖書館用戶整體來說更加易區(qū)分,因此釆用基于用戶的協(xié)同過濾算法,可有效提升高校圖書館個性化推薦的準(zhǔn)確性。二是在高效性方面,高效性主要體現(xiàn)在物品相似度計算與用戶相似度計算效率方面,當(dāng)用戶數(shù)量遠(yuǎn)遠(yuǎn)大于物品數(shù)量時,與用戶相似度計算相比,物品的相似度計算消耗資源更小,因此基于物品的協(xié)同過濾效率更高效果更好;若物品數(shù)量遠(yuǎn)遠(yuǎn)大于用戶數(shù)量,那么基于用戶的協(xié)同過濾計算效率更高,效果更好。而在高校圖書館中,物品指的是文獻(xiàn),顯然文獻(xiàn)數(shù)量要遠(yuǎn)遠(yuǎn)比用戶數(shù)量高,因此釆用基于用戶協(xié)同過濾算法取得的效果更佳。三是在穩(wěn)定性方面,主要取決于用戶集合與物品集合哪一個更穩(wěn)定,若用戶集合穩(wěn)定,則選擇基于用戶的過濾推薦算法,反之,選擇基于物品的過濾算法,而在高校圖書館中,用戶與物品每到新的學(xué)年便會更新,因此上述兩種算法各有優(yōu)勢。

4?總結(jié)

綜上所述,在信息時代下,高校圖書館在為用戶提供個性化推薦服務(wù)過程中,應(yīng)充分認(rèn)識到大數(shù)據(jù)挖掘技術(shù)在其中運(yùn)用的必要性,并立足于大數(shù)據(jù)各個環(huán)節(jié),做好挖掘技術(shù)分析,通過建立一個完整的、數(shù)據(jù)挖掘技術(shù)在高校圖書館個性化服務(wù)推薦中的應(yīng)用實現(xiàn)方案,促使大數(shù)據(jù)技術(shù)作用價值得以充分發(fā)揮,推動高校圖書館建設(shè)實現(xiàn)更好的發(fā)展。

參考文獻(xiàn):

[1] 郭淑紅,徐玉梅,劉釗.基于數(shù)據(jù)挖掘的高校圖書館個性化圖書推薦服務(wù)研究[J].電子世界,2017(4):44-45.

[2] 柳益君,何勝,馮新翎,等.大數(shù)據(jù)挖掘在高校圖書館個性化服務(wù)中應(yīng)用研究[J].圖書館工作與研究,2017,1(5):23-29.

[3] 周婕,章增安,劉海濤.基于大數(shù)據(jù)的高校圖書館個性化推薦書目生成研究[J].晉圖學(xué)刊,2017(5):29-33.

[通聯(lián)編輯:章雅琪]

商丘市| 宾川县| 沧州市| 安远县| 林西县| 清涧县| 南昌县| 岫岩| 偃师市| 南和县| 庆云县| 张掖市| 于都县| 西华县| 竹北市| 迁西县| 长子县| 车险| 仲巴县| 永福县| 南召县| 尤溪县| 屏南县| 宝应县| 同心县| 自贡市| 阿拉善左旗| 徐州市| 拉孜县| 舒城县| 永仁县| 多伦县| 济南市| 乌拉特后旗| 共和县| 东宁县| 成都市| 宜川县| 武川县| 山西省| 天水市|