国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

圖書館數(shù)據(jù)挖掘模型初探

2020-06-04 12:55梁勇
關(guān)鍵詞:數(shù)據(jù)模型數(shù)據(jù)挖掘大數(shù)據(jù)

梁勇

摘要:大數(shù)據(jù)技術(shù)是建立在現(xiàn)代基礎(chǔ)算法之上產(chǎn)生的新型應(yīng)用技術(shù),大數(shù)據(jù)應(yīng)用范圍廣泛,尤其是在圖書檢索領(lǐng)域,當(dāng)前圖書館生態(tài)逐步形成,本文通過對圖書館數(shù)據(jù)挖掘模型的研究,揭示圖書館大數(shù)據(jù)技術(shù)的應(yīng)用途徑與方向。

關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;數(shù)據(jù)模型

中圖分類號:G250 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2020)03-0089-02

0 引言

大數(shù)據(jù)、云存儲、5G網(wǎng)絡(luò)信號基站的建設(shè),讀者通過手機(jī)獲得的圖書資源數(shù)據(jù)遠(yuǎn)超過小型圖書館的圖書總和,大數(shù)據(jù)裹挾著巨量的信息涌入到讀者的閱讀設(shè)備中,無紙化閱讀變得越來越輕松。如何將圖書館中的“立體式”資源變成“數(shù)字化”資源,目前來說是圖書館發(fā)展的新課題。

1 圖書館大數(shù)據(jù)架構(gòu)與發(fā)展特征

大數(shù)據(jù)技術(shù)是建立在現(xiàn)代基礎(chǔ)算法之上產(chǎn)生的新型應(yīng)用技術(shù),大數(shù)據(jù)應(yīng)用范圍廣泛,尤其是在圖書檢索領(lǐng)域,當(dāng)前,以大數(shù)據(jù)為核心的圖書館生態(tài)逐步形成,首先,圖書館在業(yè)務(wù)運(yùn)行中的內(nèi)部管理數(shù)據(jù),其次,圖書館的用戶行為數(shù)據(jù);第三,圖書館在知識服務(wù)中,挖掘和產(chǎn)生各類主題知識信息,為知識服務(wù)和技術(shù)發(fā)展提供大數(shù)據(jù)。

圖書館大數(shù)據(jù)的應(yīng)用特征:以基礎(chǔ)數(shù)據(jù)為中心,以發(fā)展大數(shù)據(jù)為主要目標(biāo),挖掘圖書館的館藏資源,為讀者打造全方位、全資源的服務(wù)需求。同時圖書館的資源轉(zhuǎn)換也從普通的存儲模式轉(zhuǎn)變?yōu)閼?yīng)用模式,數(shù)據(jù)存儲到數(shù)據(jù)應(yīng)用,已成為圖書館數(shù)據(jù)大數(shù)據(jù)發(fā)展的關(guān)鍵與核心。

1.1 圖書館在業(yè)務(wù)運(yùn)行中的內(nèi)部管理數(shù)據(jù)

圖書館運(yùn)行過程中,主要是對文獻(xiàn)信息的采集、加工、編目、提供、管理、收藏。在所有的業(yè)務(wù)環(huán)節(jié)中都會產(chǎn)生業(yè)務(wù)管理數(shù)據(jù)。例如:圖書出版數(shù)據(jù),圖書發(fā)行數(shù)據(jù),圖書館采購數(shù)據(jù),圖書館編目加工數(shù)據(jù),不同學(xué)科類目數(shù)據(jù),圖書館圖書的流通率等,對于圖書館管理,對于圖書館的上游機(jī)構(gòu),圖書出版發(fā)行都將提供數(shù)據(jù)依據(jù)。

1.2 圖書館的用戶行為數(shù)據(jù)

圖書館在的用戶服務(wù)中會產(chǎn)生大量的用戶行為數(shù)據(jù),包括用戶分類、用戶的職業(yè)、用戶的查閱、檢索、復(fù)制、外借行為等數(shù)據(jù),可以掌握用戶多方面數(shù)據(jù),并進(jìn)行關(guān)聯(lián),通過用戶行為數(shù)據(jù)分析,深入了解用戶行為特點(diǎn),用戶需求內(nèi)容,更好的為知識組織和生產(chǎn)環(huán)節(jié)提供專業(yè)信息檢索和技術(shù)咨詢服務(wù)。

1.3 圖書館的文獻(xiàn)知識數(shù)據(jù)

圖書館在為用戶提供文獻(xiàn)檢索時,對文獻(xiàn)信息進(jìn)行了編目分類標(biāo)引,并提供知識組織的專題服務(wù)。根據(jù)用戶需求,經(jīng)過知識組織的文獻(xiàn)信息,可全面揭示某一主題的數(shù)據(jù)和信息,可為不同的用戶提供主題知識服務(wù)。經(jīng)過積累和整合的的多學(xué)科知識組織信息和書目信息,可以為更多的用戶提供服務(wù)。

2 平臺聚合數(shù)據(jù)挖掘的創(chuàng)新模式探討

目前圖書館在大數(shù)據(jù)挖掘和服務(wù)中,做了以下探索。首先以讀者借閱信息為基礎(chǔ),依托互聯(lián)網(wǎng)基礎(chǔ)運(yùn)算模型,為借閱圖書的人員主動進(jìn)行資源整合,目前形成了搜索與推薦互相結(jié)合的發(fā)展模式。

2.1以CNKI為領(lǐng)銜的商業(yè)大數(shù)據(jù)平臺服務(wù)模式

目前圖書館參考的商業(yè)模式,主要是參照中國知網(wǎng)CNKI(China National Knowledge Infrastructure)等數(shù)據(jù)服務(wù)商推出的知識服務(wù)平臺,如何依托大數(shù)據(jù)技術(shù)有效利用圖書館的圖書資源為圖書館以后的發(fā)展道路提出了挑戰(zhàn)。CNKI等各類商業(yè)數(shù)據(jù)服務(wù)平臺,提供大量知識數(shù)據(jù)和讀者讀書的基礎(chǔ)信息,基于以上信息,經(jīng)過大數(shù)據(jù)整合,才能為讀者推薦更個性化的圖書內(nèi)容。

CNKI中國知網(wǎng)由于長期的數(shù)據(jù)積累,形成了文獻(xiàn)信息大數(shù)據(jù)庫,在大數(shù)據(jù)庫的基礎(chǔ)上,為不同的用戶提供主題性知識信息服務(wù),取得了較好的社會效益和經(jīng)濟(jì)效益。

2.2 圖書館以微信為領(lǐng)銜的社交平臺大數(shù)據(jù)分析模式

大數(shù)據(jù)技術(shù)的基礎(chǔ)是算法資源,載體是社交網(wǎng)絡(luò),信息的傳播需要依靠某些技術(shù)手段,以微信、微博為平臺,拓展信息化傳播途徑。除此之外,對于讀者信息的采集方面要注重讀者隱私,維護(hù)讀者信息安全,將讀者借閱的讀書資源精細(xì)記錄,將這份記錄存儲到本地數(shù)據(jù)庫中,為以后圖書館會更好的服務(wù)打下基礎(chǔ)。

近幾年不同類型的圖書館,啟動微信公眾服務(wù)平臺,為用戶提供更多的文獻(xiàn)信息服務(wù)。國家圖書館,省市圖書館,高校圖書館等在微信公眾平臺上,發(fā)布資源信息和服務(wù)信息,提高了圖書館數(shù)字資源的傳播和利用效率,也方便了廣大用戶。

2.3 圖書館用戶利用信息數(shù)據(jù)整合平臺

圖書館擁有用戶利用文獻(xiàn)信息數(shù)據(jù),對用戶利用文獻(xiàn)信息數(shù)據(jù)進(jìn)行采集,分析,追蹤,可以通過用戶利用的大數(shù)據(jù),進(jìn)一步分析研究用戶對文獻(xiàn)信息的需求方向、內(nèi)容、數(shù)量,以及相關(guān)聯(lián)信息的利用情況。可以為文獻(xiàn)生命周期的發(fā)展提供大數(shù)據(jù)支撐。例如:可以采集文獻(xiàn)的出版發(fā)行,圖書館文獻(xiàn)機(jī)構(gòu)的采購,用戶文獻(xiàn)的利用率等多方面的數(shù)據(jù),為不同的用戶提供數(shù)據(jù)。

3 圖書館數(shù)據(jù)挖掘典型模型構(gòu)建

圖書館數(shù)據(jù)挖掘其實(shí)是將圖書館的館藏資源整合之后,再進(jìn)行細(xì)致劃分,讀者根據(jù)劃分出來的分類,選擇相關(guān)專業(yè)書籍,同時借閱的數(shù)據(jù)反饋給數(shù)據(jù)后臺進(jìn)行分析,更好的把握每一位讀者的喜好和需求,為他們提供準(zhǔn)確的知識服務(wù)。

圖書館模型的構(gòu)建不是簡單的垂直模型,它可以分為很多種類,每一本圖書都會和其它知識相互關(guān)聯(lián),就像大樹的枝杈,每一科的知識又可以進(jìn)行交叉。還有互動模型、圖書借閱信用歸還模型等。

3.1 圖書館知識體系的交叉模型

算法是大數(shù)據(jù)的基礎(chǔ),也是大數(shù)據(jù)的核心,基于統(tǒng)計數(shù)據(jù)給出最佳合理的安排,為讀者提供更好的服務(wù),可以借鑒維基百科的知識檢索方式,將引用的資料列出鏈接,形成知識與知識之間的交叉模型體系的構(gòu)建。

3.2 圖書館圖書資源的匹配模型

在進(jìn)行匹配模型之前,首先要有借閱者的讀書數(shù)據(jù),這期間需要考慮到兩種因素,一是借閱者的身份基礎(chǔ)信息,二是借閱者平時最多閱讀的知識區(qū)域,把握這兩個因素可以精確的給讀者提供更好的服務(wù)、提供更精準(zhǔn)的信息。

3.3 圖書館的信用模型體系構(gòu)建

資源的數(shù)字化對圖書館的發(fā)展來說好處非常多,但是紙質(zhì)化的資源更能給培養(yǎng)讀者清晰的思維邏輯,在借閱讀書時,通過大數(shù)據(jù)的基礎(chǔ)算法,針對圖書不歸還的現(xiàn)象建立信用模型,詳細(xì)的記錄借閱者的借閱用途,歸還時間等,保護(hù)館藏資源,懲治失信人員。同時還可以按照按照讀者信用提供優(yōu)惠性服務(wù),如免押金、滯納金、提升服務(wù)優(yōu)先級。

3.4 圖書館讀者借閱動態(tài)追蹤模型

在沒有引進(jìn)大數(shù)據(jù)技術(shù)之前,圖書館的借閱過程非常傳統(tǒng),也不容易搜集到圖書信息,很少能從借閱單中挖掘出更多有價值的信息。但隨著數(shù)字化的發(fā)展,就可以把借閱單變成基礎(chǔ)數(shù)據(jù),通過讀者自主學(xué)習(xí)對圖書館知識服務(wù)數(shù)據(jù)進(jìn)行調(diào)整。依據(jù)讀者特征進(jìn)行差別化知識服務(wù),當(dāng)讀者想要研究別的知識領(lǐng)域時,系統(tǒng)就可以通過這些基層數(shù)據(jù)為讀者提供更為精確的知識體系書籍,幫助讀者更好的深入研究。

3.5 圖書館信息聚合分類模型

方便和效率;數(shù)據(jù)閱讀集成一體,個性話定制知識服務(wù)界面使信息獲取更加方便,對信息進(jìn)行聚合分類大大提升閱讀效率。閱讀效率的提升一方面除了有科技的輔助作用外;另一方面也要能夠適時地激發(fā)讀者的閱讀興趣。大數(shù)據(jù)技術(shù)的應(yīng)用就是根據(jù)每個人的閱讀狀態(tài)、興趣等多方面為讀者提供更為精確的讀書內(nèi)容、更優(yōu)質(zhì)的學(xué)習(xí)內(nèi)容。聚合模型自己要進(jìn)行定期更新,根據(jù)讀者數(shù)量的增減重新進(jìn)行模型計算分析,為讀者提供新的閱讀建議,最終打造成全平臺數(shù)字資源共享供圖書館行業(yè)使用。

4 結(jié)語

圖書館大數(shù)據(jù)將徹底改變圖書館的發(fā)展脈絡(luò),重塑下一代圖書館的生態(tài)環(huán)境,也對圖書館事業(yè)的發(fā)展提出了新的挑戰(zhàn)。

參考文獻(xiàn)

[1] 馬宏斌,王柯,馬團(tuán)學(xué).大數(shù)據(jù)時代的空間數(shù)據(jù)挖掘綜述[J].測繪與空間地理信息,2014(07):19-22.

[2] 王菲菲,李晶.基于數(shù)據(jù)挖掘的電子商務(wù)動態(tài)定價模型[J].中國信息界,2012(11):179.

Abstract:Big data technology is a new type of application technology based on modern basic algorithms. Big data has a wide range of applications, especially in the field of book retrieval, and the current library ecology is gradually taking shape. Through the study of library data mining models in this paper, Reveal the application path and direction of library big data technology.

Key words:big data; data mining; data model

猜你喜歡
數(shù)據(jù)模型數(shù)據(jù)挖掘大數(shù)據(jù)
面板數(shù)據(jù)模型截面相關(guān)檢驗(yàn)方法綜述
加熱爐爐內(nèi)跟蹤數(shù)據(jù)模型優(yōu)化
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于GPGPU的離散數(shù)據(jù)挖掘研究
面向集成管理的出版原圖數(shù)據(jù)模型
一種顧及級聯(lián)時空變化描述的土地利用變更數(shù)據(jù)模型
隆回县| 玉门市| 逊克县| 高青县| 怀仁县| 陇南市| 博爱县| 乐平市| 临西县| 伊川县| 宁强县| 凌海市| 会宁县| 京山县| 黎平县| 伊宁县| 右玉县| 临潭县| 贡觉县| 丘北县| 宁夏| 荃湾区| 泰兴市| 山阴县| 陕西省| 光山县| 横峰县| 莱芜市| 温州市| 南涧| 陆河县| 邯郸县| 邵东县| 额尔古纳市| 三门县| 达尔| 全椒县| 襄城县| 宁国市| 二连浩特市| 辽宁省|