国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)在高校圖書館個(gè)性化服務(wù)中的應(yīng)用研究

2021-01-03 18:19吳文光
科教導(dǎo)刊·電子版 2021年17期
關(guān)鍵詞:數(shù)據(jù)挖掘個(gè)性化數(shù)據(jù)庫

吳文光

(湖南文理學(xué)院 湖南·常德 41500)

縱觀圖書館的發(fā)展,其經(jīng)歷了印刷紙張、自動化集成與數(shù)字化等三個(gè)階段。圖書館作為信息存儲與信息服務(wù)的中心,隨著現(xiàn)代信息技術(shù)的飛速發(fā)展而積累了海量的數(shù)據(jù)資源。為滿足讀者的信息需求,高校圖書館應(yīng)創(chuàng)新自身的服務(wù)模式、拓展服務(wù)空間及服務(wù)層面。數(shù)據(jù)挖掘技術(shù)的出現(xiàn)有效改變了圖書館的服務(wù)功能,其可從數(shù)據(jù)庫中發(fā)掘未知的有用的信息,為讀者提供個(gè)性化信息服務(wù),使得讀者結(jié)合自身需求便捷高效地獲取信息資源,也促進(jìn)了高校圖書館資源的有效利用。

1 數(shù)據(jù)挖掘技術(shù)概述

數(shù)據(jù)挖掘是指從模糊、不完全、隨機(jī)、大量的數(shù)據(jù)中挖掘并提取中先前未知的、潛在而有用的知識信息。簡單來說,數(shù)據(jù)挖掘過程就是一個(gè)發(fā)現(xiàn)知識信息的過程。數(shù)據(jù)挖掘技術(shù)主要涉及如下五個(gè)方面。(1)關(guān)聯(lián)分析。即從兩個(gè)或兩個(gè)以上變量中找出其共存的因果結(jié)構(gòu)或規(guī)律,也就是從數(shù)據(jù)庫中找到潛在的關(guān)聯(lián)規(guī)則。圖書館可從數(shù)據(jù)庫中找到隱藏的關(guān)聯(lián)規(guī)則,準(zhǔn)確預(yù)測讀者的信息需求,有針對性地、有效地將文獻(xiàn)資料推送給讀者,這便于讀者高效地查閱與獲取所需資料信息。(2)聚類。也就是將數(shù)據(jù)庫中的一組個(gè)體根據(jù)相似性歸納總結(jié)為若干類型。圖書館可將相似的文獻(xiàn)資料進(jìn)行集中,使得讀者在搜索資料時(shí)還可查閱到很多相關(guān)內(nèi)容,方便讀者進(jìn)一步歸納;也可對讀者所需特定信息進(jìn)行匯總,并將相關(guān)信息提供給讀者。(3)分類。即根據(jù)分析對象的屬性對類組進(jìn)行建立。由于讀者搜索查閱資料時(shí)對知識信息的需求程度不同,故可將讀者的知識信息需求按照高度、中度、低度等三個(gè)層級進(jìn)行劃分。(4)預(yù)測。圖書館可對讀者使用文獻(xiàn)資料的規(guī)律進(jìn)行預(yù)測,也就是結(jié)合用戶的歷史查閱記錄預(yù)測讀者所需文獻(xiàn)資料的特征及類型,在此基礎(chǔ)上及時(shí)更新這些資料信息,確保讀者便捷高效地查閱到這些資料。(5)時(shí)序模式。圖書館可將讀者的檢索訪問記錄用時(shí)間段進(jìn)行標(biāo)記,然后通過時(shí)間序列對重復(fù)率高的內(nèi)容信息進(jìn)行挖掘,并對讀者接下來的信息需求進(jìn)行預(yù)測,了解讀者感興趣的信息內(nèi)容,這便于讀者查閱資料。

2 高校圖書館個(gè)性化服務(wù)的體現(xiàn)

處于信息繁雜的時(shí)代,為讀者提供個(gè)性化的信息服務(wù)是高校圖書館的重要工作。高校圖書館個(gè)性化服務(wù)是指結(jié)合讀者的專業(yè)、研究方向、興趣愛好、行為習(xí)慣等,為讀者及時(shí)、主動、準(zhǔn)確地提供針對性的信息服務(wù),便于讀者搜索、查閱與獲取更為完整的信息資料,并展開進(jìn)一步的學(xué)習(xí)與研究。具體表現(xiàn)為以下幾點(diǎn)。(1)信息分類定制服務(wù)。分類定制指的是讀者可結(jié)合自己的需求對信息資源的類型及表現(xiàn)形式進(jìn)行設(shè)定,對系統(tǒng)服務(wù)功能進(jìn)行選擇,確保在圖書館中搜索查詢到相關(guān)資料信息。(2)信息推送服務(wù)。高校圖書館通過識別讀者頻繁訪問的網(wǎng)址路徑及頁面來掌握讀者所關(guān)注的信息內(nèi)容,結(jié)合讀者瀏覽信息資源的時(shí)間長短來發(fā)掘讀者的興趣愛好,并且對相關(guān)信息資料進(jìn)行及時(shí)的更新,主動推送給讀者所需要的信息資源,從而提升圖書館信息資源的利用率。(3)導(dǎo)航鏈接服務(wù)。高校圖書館可通過挖掘讀者的Web log來探尋讀者所訪問網(wǎng)頁的關(guān)聯(lián)性,從網(wǎng)頁關(guān)聯(lián)性中發(fā)現(xiàn)其期望位置。倘若讀者對期望位置的訪問頻率比實(shí)際位置高,則可建立并優(yōu)化導(dǎo)航鏈接結(jié)構(gòu),從而方便讀者應(yīng)用鏈接。

3 數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校圖書館中的必要性、可行性

(1)必要性分析。處于信息化時(shí)代環(huán)境下,高校圖書館中的信息數(shù)據(jù)日益增加,讀者對信息資源類型的需求愈來愈多樣化,對信息內(nèi)容的要求也愈來愈高。將數(shù)據(jù)挖掘技術(shù)運(yùn)用于高校圖書館中符合時(shí)代發(fā)展趨勢。一是符合高校圖書館發(fā)展需求。傳統(tǒng)圖書館來僅為讀者提供簡單的一鍵檢索功能,讀者進(jìn)入圖書館主頁檢索,只能從繁多雜亂的檢索結(jié)果中尋找所需資料信息,這無法滿足讀者個(gè)性化需求。數(shù)據(jù)挖掘技術(shù)為圖書館信息化建設(shè)提供了強(qiáng)大動力。其不僅能將高校圖書館數(shù)據(jù)庫中讀者的檢索、訪問、借閱記錄進(jìn)行挖掘,還能將讀者查閱數(shù)據(jù)中隱藏的關(guān)聯(lián)性進(jìn)行挖掘,并且從中提取出有用的、有價(jià)值的信息和知識,從而提升圖書館信息資源利用率。而且,圖書館員可通過數(shù)據(jù)挖掘技術(shù)對借閱情況、學(xué)科設(shè)置情況等進(jìn)行分析,并結(jié)合數(shù)據(jù)分析結(jié)果實(shí)現(xiàn)對各類資源的合理采購、分配與剔除,進(jìn)一步完善館藏的布局。二是符合讀者服務(wù)需求。高校圖書館的服務(wù)水平直接影響著讀者的評價(jià)及滿意度。以前讀者要想查閱圖書館內(nèi)的某些資料,需要提供檢索號。對于如何根據(jù)讀者偏好及讀者興趣轉(zhuǎn)移情況,為其提供個(gè)性化的信息資源服務(wù),僅依賴傳統(tǒng)的高校圖書管理系統(tǒng)的查詢統(tǒng)計(jì)功能是不行的。數(shù)據(jù)挖掘技術(shù)能對讀者查閱訪問資料記錄進(jìn)行深入挖掘、分析與處理,掌握讀者查閱行為模式及興趣愛好,并且主動將信息資源提供給讀者,從而大大提升了圖書館服務(wù)質(zhì)量水平。(2)可行性分析。一是大部分高校圖書館已經(jīng)具備了一定的物質(zhì)條件,也配備了圖書館信息技術(shù)人才、管理人才,這些為數(shù)據(jù)挖掘技術(shù)在高校圖書館中的運(yùn)用創(chuàng)造了條件。二是政府為數(shù)據(jù)挖掘技術(shù)應(yīng)用制定了相關(guān)政策,并且提供了相應(yīng)的經(jīng)費(fèi)投入,以確保該技術(shù)應(yīng)用的推行。三是近些年數(shù)據(jù)挖掘技術(shù)飛速發(fā)展,能為高校圖書館開展個(gè)性化服務(wù)提供技術(shù)支撐。

4 高校圖書館個(gè)性化服務(wù)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用

高校圖書館要想開展個(gè)性化服務(wù),應(yīng)根據(jù)讀者的信息需求將相關(guān)信息內(nèi)容進(jìn)行動態(tài)化的呈現(xiàn)。下面將結(jié)合數(shù)據(jù)挖掘的流程來探討高校圖書館個(gè)性化服務(wù)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用。

4.1 明晰數(shù)據(jù)挖掘目標(biāo)并建立數(shù)據(jù)倉庫

確定數(shù)據(jù)挖掘目標(biāo)是展開數(shù)據(jù)挖掘的第一步。通過研究讀者的信息需求,制定出有效而合理的數(shù)據(jù)挖掘目標(biāo)。待數(shù)據(jù)挖掘目標(biāo)確定之后,就進(jìn)入數(shù)據(jù)準(zhǔn)備工作,也就是從海量數(shù)據(jù)中選取一個(gè)跟數(shù)據(jù)挖掘目標(biāo)有關(guān)的樣板數(shù)據(jù)子集,并且建立一個(gè)保存所有數(shù)據(jù)挖掘所需數(shù)據(jù)的數(shù)據(jù)倉庫。倘若數(shù)據(jù)倉庫未被建立而直接展開數(shù)據(jù)挖掘,則易導(dǎo)致挖掘中斷甚至失敗,所以很有必要建立一個(gè)數(shù)據(jù)倉庫。而且,數(shù)據(jù)挖掘前期工作的關(guān)鍵內(nèi)容就是數(shù)據(jù)準(zhǔn)備。將數(shù)據(jù)挖掘技術(shù)運(yùn)用于高校圖書館個(gè)性化服務(wù)中,首要步驟是建立起兩個(gè)數(shù)據(jù)庫,一是讀者數(shù)據(jù)庫,二是圖書館特色資源數(shù)據(jù)庫。讀者在使用高校圖書館過程中會產(chǎn)生網(wǎng)站訪問痕跡、借閱記錄等,這些潛藏著很多有價(jià)值的信息。

4.2 分析與調(diào)整數(shù)據(jù)庫中的數(shù)據(jù)

待建好兩個(gè)數(shù)據(jù)庫之后,需分析與調(diào)整兩個(gè)數(shù)據(jù)庫中的數(shù)據(jù),確保最初數(shù)據(jù)的質(zhì)量。倘若原始數(shù)據(jù)的質(zhì)量不好,那么即使建立的數(shù)據(jù)模型很好,也會影響預(yù)測結(jié)果的質(zhì)量。所以有必要分析調(diào)整數(shù)據(jù)庫中的數(shù)據(jù),即對數(shù)據(jù)進(jìn)行抽取、清洗與轉(zhuǎn)換。其中數(shù)據(jù)抽取指的是搜索出與數(shù)據(jù)挖掘目標(biāo)相關(guān)的所有數(shù)據(jù)信息,數(shù)據(jù)清洗指的是對數(shù)據(jù)的噪聲、重復(fù)記錄進(jìn)行消除,以及對計(jì)算缺值數(shù)據(jù)進(jìn)行推導(dǎo)。高校圖書館每天會產(chǎn)生讀者訪問借閱的大量數(shù)據(jù),但并非所有數(shù)據(jù)都適用于數(shù)據(jù)挖掘處理,所以應(yīng)清理、剔除出那些無用數(shù)據(jù)。數(shù)據(jù)轉(zhuǎn)換指的是對數(shù)據(jù)維數(shù)進(jìn)行精減,從數(shù)據(jù)初始特征中找到有用的那部分特征,目的是縮減在數(shù)據(jù)挖掘過程中需考慮的變量數(shù)。

4.3 選擇合適的算法并建立相應(yīng)的數(shù)據(jù)挖掘模型

對于數(shù)據(jù)挖掘過程中的一個(gè)任務(wù),可能有不同的算法。對于算法的選擇,需考慮兩方面因素。一是結(jié)合數(shù)據(jù)特點(diǎn)來選擇相應(yīng)的算法;二是結(jié)合實(shí)際運(yùn)行系統(tǒng)要求或者讀者要求來選擇算法,因?yàn)橛械淖x者想要獲得易于理解的知識或描述型的知識,有的讀者想要獲得預(yù)測型知識。接著就是建立相應(yīng)的數(shù)據(jù)挖掘模型,即經(jīng)過聚類、分類且采用時(shí)序模式,抽象出讀者的普遍性、個(gè)性化的需求,然后對關(guān)聯(lián)規(guī)則模型進(jìn)行構(gòu)建。對于建立的一系列模型,還要進(jìn)行反復(fù)驗(yàn)證與試用。倘若建立的模型能解決目標(biāo)問題,則說明該模型是有效的。倘若建立的模型尚有不足之處或存在缺陷,則須結(jié)合反饋對模型進(jìn)行調(diào)整修改,也可對算法進(jìn)行重新選擇,再建立新的數(shù)據(jù)挖掘模型。通過對不同模型進(jìn)行仔細(xì)的考察與判斷,最終選用有效解決目標(biāo)問題的最佳模型。

4.4 解釋數(shù)據(jù)挖掘結(jié)果

在運(yùn)用算法規(guī)則建立數(shù)據(jù)挖掘模型之后,還需運(yùn)用該算法再進(jìn)行運(yùn)算,從而得出數(shù)據(jù)挖掘結(jié)果。高校圖書館要將結(jié)果進(jìn)行可視化處理,將抽象的數(shù)據(jù)結(jié)果解釋得易讀、易于理解,從而幫助圖書館管理做出相應(yīng)的決策,并為讀者提供有效的服務(wù)。比如對于圖書館引進(jìn)的一批某專業(yè)的學(xué)術(shù)論文,經(jīng)過數(shù)據(jù)挖掘分析得知查閱者絕大部分來自該專業(yè)的師生,其他專業(yè)的師生查閱率很低,故而應(yīng)向該專業(yè)的讀者推送這批論文的信息。

4.5 進(jìn)一步驗(yàn)證數(shù)據(jù)挖掘結(jié)果并對模型進(jìn)行評價(jià)

待數(shù)據(jù)挖掘結(jié)果產(chǎn)生之后,還要對其可用性與有效性進(jìn)行驗(yàn)證,并評價(jià)模型的實(shí)用性。也就是說,對數(shù)據(jù)挖掘結(jié)果進(jìn)行解釋后,還要跟蹤了解數(shù)據(jù)挖掘結(jié)果實(shí)踐應(yīng)用情況,從讀者的反饋信息中驗(yàn)證數(shù)據(jù)挖掘結(jié)果的實(shí)用性。對于一個(gè)數(shù)據(jù)挖掘模型來說,其很難實(shí)現(xiàn)與已有數(shù)據(jù)完全相符,而且其也不會適用于任意環(huán)境與任意時(shí)間節(jié)點(diǎn),所以評價(jià)數(shù)據(jù)挖掘結(jié)果是很有必要的。倘若讀者反饋挖掘結(jié)果能解決問題,則可說明數(shù)據(jù)挖掘目標(biāo)、讀者需求均得以實(shí)現(xiàn),也能證明該模型是合理而實(shí)用的。當(dāng)讀者根據(jù)數(shù)據(jù)挖掘結(jié)果滿足了自身需求時(shí),則會反饋滿意的信息。圖書館決策者收到這一反饋信息后會進(jìn)行下一步實(shí)施。這一階段完成之后,高校圖書館也就實(shí)現(xiàn)了完整的數(shù)據(jù)挖掘過程,從而為讀者提供個(gè)性化服務(wù)。需要注意的是,若數(shù)據(jù)挖掘結(jié)果不能使讀者需求得到滿足,則系統(tǒng)會重復(fù)以上步驟,對數(shù)據(jù)進(jìn)行重新抽取,對數(shù)據(jù)轉(zhuǎn)換方法進(jìn)行重新選擇,對挖掘參數(shù)值進(jìn)行重新設(shè)置,并對新算法加以選取。

猜你喜歡
數(shù)據(jù)挖掘個(gè)性化數(shù)據(jù)庫
新聞的個(gè)性化寫作
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
上汽大通:C2B個(gè)性化定制未來
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
滿足群眾的個(gè)性化需求
基于GPGPU的離散數(shù)據(jù)挖掘研究
吴桥县| 陵川县| 沐川县| 武威市| 河北省| 江川县| 津市市| 光山县| 北安市| 仁寿县| 东乌珠穆沁旗| 延吉市| 咸丰县| 洛南县| 二连浩特市| 西和县| 忻州市| 尤溪县| 文成县| 瑞金市| 来凤县| 瑞安市| 佳木斯市| 兴城市| 高碑店市| 平乡县| 都安| 修文县| 内乡县| 阜宁县| 西安市| 德清县| 岐山县| 福清市| 绵竹市| 都昌县| 泸水县| 康平县| 奉新县| 五华县| 清新县|