国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

二分網(wǎng)絡(luò)在高校圖書(shū)館云計(jì)算中的實(shí)現(xiàn)研究

2012-04-29 12:42:11水靜張瑞
現(xiàn)代情報(bào) 2012年9期
關(guān)鍵詞:云計(jì)算應(yīng)用程序高校圖書(shū)館

水靜 張瑞

〔摘 要〕文章針對(duì)高校圖書(shū)館管理中出現(xiàn)的實(shí)際問(wèn)題,結(jié)合目前云計(jì)算技術(shù)的發(fā)展,利用二分網(wǎng)絡(luò)的研究手段及方法對(duì)其進(jìn)行了全面的分析研究,具體包括度、集聚系數(shù)、社團(tuán)結(jié)構(gòu)及聚類算法,深入討論了二分網(wǎng)絡(luò)在云計(jì)算中的部署,以及二分網(wǎng)絡(luò)在高校圖書(shū)館管理中的具體應(yīng)用和所需面臨的問(wèn)題,為目前的高校圖書(shū)館的數(shù)據(jù)分析提供一種比較實(shí)用的方法,幫助高校圖書(shū)館建設(shè)一個(gè)穩(wěn)定安全而且實(shí)用的數(shù)據(jù)分析環(huán)境。

〔關(guān)鍵詞〕高校圖書(shū)館;云計(jì)算;二分網(wǎng)絡(luò);應(yīng)用程序

〔中圖分類號(hào)〕G250.7;391 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2012)09-0094-03

伴隨我國(guó)高等教育的大發(fā)展,各個(gè)高校圖書(shū)館以“加強(qiáng)系統(tǒng)資源建設(shè),促進(jìn)服務(wù)質(zhì)量提高”為宗旨,逐步更新管理理念,完善管理措施,不斷提高圖書(shū)館的信息服務(wù)能力。與此同時(shí),目前的大學(xué)圖書(shū)館大都引入基于數(shù)據(jù)庫(kù)的自動(dòng)化管理系統(tǒng),這就使得高校圖書(shū)館管理不得不面對(duì)一個(gè)圖書(shū)館日常借閱數(shù)據(jù)劇增的事實(shí)。其主要原因在于,各大學(xué)圖書(shū)館不斷擴(kuò)充自身的館藏書(shū)籍?dāng)?shù)量以及各大學(xué)在校學(xué)生數(shù)量的增加。據(jù)調(diào)查顯示,目前我國(guó)一個(gè)普通的綜合性大學(xué)館藏書(shū)籍種類大體在3~4萬(wàn)種,數(shù)量在100~200萬(wàn)冊(cè)之間,1個(gè)月產(chǎn)生的借閱信息大體在1~2萬(wàn)條,1年的借閱信息在20萬(wàn)條左右。如此數(shù)量的信息背后絕對(duì)包含著許多待挖掘的信息,但就這些數(shù)據(jù)的存儲(chǔ)和研究處理方法卻遭遇了許多問(wèn)題,首先是各高校對(duì)圖書(shū)館管理系統(tǒng)及硬件的投入越來(lái)越多,與之同時(shí)產(chǎn)生的海量數(shù)據(jù)保存卻越來(lái)越吃力,而且各高校保存的數(shù)據(jù)由于類型差異較大,無(wú)法實(shí)現(xiàn)共享。其次,缺乏架構(gòu)化、內(nèi)在的和深層次的分析數(shù)據(jù)的分析方法,目前的分析效果不盡理想。

1 云計(jì)算與復(fù)雜網(wǎng)絡(luò)的發(fā)展

2008年以來(lái),云計(jì)算與圖書(shū)館管理結(jié)合逐漸成為一個(gè)熱門(mén)話題,各大學(xué)圖書(shū)館緊跟云計(jì)算的步伐,積極研究云計(jì)算給圖書(shū)館帶來(lái)的影響,希望充分利用云計(jì)算能切實(shí)提高高校圖書(shū)館的信息管理能力。所謂的云計(jì)算是分布式計(jì)算技術(shù)的一種,其最基本的概念,是透過(guò)網(wǎng)絡(luò)將龐大的計(jì)算處理程序自動(dòng)分拆成無(wú)數(shù)個(gè)較小的子程序,再交由多部服務(wù)器所組成的龐大系統(tǒng)經(jīng)搜尋、計(jì)算分析之后將處理結(jié)果回傳給用戶。透過(guò)這項(xiàng)技術(shù),網(wǎng)絡(luò)服務(wù)提供者可以在數(shù)秒之內(nèi),達(dá)成處理數(shù)以千萬(wàn)計(jì)甚至億計(jì)的信息,達(dá)到和“超級(jí)計(jì)算機(jī)”同樣強(qiáng)大效能的網(wǎng)絡(luò)服務(wù)。就高校圖書(shū)館而言,可以將圖書(shū)信息、借閱者信息以及借閱信息上傳至提供云計(jì)算服務(wù)的服務(wù)器中,而且不用考慮數(shù)據(jù)存儲(chǔ)空間的大小,同時(shí)這些數(shù)據(jù)可以動(dòng)態(tài)更新。高校圖書(shū)館不用擔(dān)心應(yīng)用軟件是否是最新版本,極大的減少了學(xué)校為維護(hù)和升級(jí)的應(yīng)用軟件投入的費(fèi)用;另外,數(shù)據(jù)儲(chǔ)存在云端,因此無(wú)需擔(dān)心病毒的入侵和硬件的損壞導(dǎo)致數(shù)據(jù)丟失。

目前,高校圖書(shū)館對(duì)于圖書(shū)及圖書(shū)借閱等數(shù)據(jù)的研究主要集中在3個(gè)方面:(1)依靠本身技術(shù)力量, 憑借業(yè)務(wù)管理系統(tǒng)自帶的功能對(duì)數(shù)據(jù)進(jìn)行諸如查詢、匯總等分析工作。(2)依靠數(shù)據(jù)挖掘應(yīng)用技術(shù)對(duì)上述數(shù)據(jù)進(jìn)行定量、歸納分析,調(diào)查顯示2003-2009年間,國(guó)內(nèi)數(shù)據(jù)挖掘技術(shù)在圖書(shū)館應(yīng)用研究方面的論文達(dá)到533篇。(3)依靠統(tǒng)計(jì)學(xué)提供的分析方法對(duì)高校圖書(shū)館自身數(shù)據(jù)進(jìn)行分析研究,并由此產(chǎn)生了一些高校圖書(shū)統(tǒng)計(jì)指標(biāo)。近幾年,伴隨近年大型數(shù)據(jù)庫(kù)的建立和計(jì)算機(jī)存儲(chǔ)與運(yùn)算能力的迅速提高,復(fù)雜網(wǎng)絡(luò)的研究逐步深入,人們利用大量的真實(shí)網(wǎng)絡(luò)數(shù)據(jù)對(duì)高校圖書(shū)館系統(tǒng)進(jìn)行分析,尋找呈現(xiàn)表象的內(nèi)在機(jī)制和模式,進(jìn)而試圖發(fā)現(xiàn)支配和影響這些復(fù)雜系統(tǒng)的動(dòng)力學(xué)和演化規(guī)律的內(nèi)在本質(zhì)。

高校圖書(shū)館將基本業(yè)務(wù)數(shù)據(jù)上傳至云服務(wù)器,并在云服務(wù)器的基礎(chǔ)架構(gòu)上開(kāi)發(fā)針對(duì)自身數(shù)據(jù)分析的復(fù)雜網(wǎng)絡(luò)應(yīng)用程序能為高校圖書(shū)管理業(yè)務(wù)開(kāi)辟一條嶄新的思路。

2 復(fù)雜網(wǎng)絡(luò)二分網(wǎng)技術(shù)研究及方法

復(fù)雜網(wǎng)絡(luò)的理論研究對(duì)網(wǎng)絡(luò)安全、網(wǎng)絡(luò)控制和計(jì)算機(jī)病毒傳播的控制與防御等研究產(chǎn)生了重大影響。用圖論的語(yǔ)言來(lái)描述,一個(gè)網(wǎng)絡(luò)可以抽象為一個(gè)由節(jié)點(diǎn)的集合V和邊集E組成的圖G=(V,E)。節(jié)點(diǎn)數(shù)記為N=V,邊數(shù)記為M=E。E中每條邊都有V中一對(duì)點(diǎn)與之相對(duì)應(yīng)。對(duì)于高校圖書(shū)管理系統(tǒng)而言,點(diǎn)集指的是一個(gè)個(gè)獨(dú)立的圖書(shū)和借閱者,而邊集就是圖書(shū)與借閱者之間的鏈接,一個(gè)圖書(shū)系統(tǒng)的這些大量信息被提取出來(lái)就構(gòu)成了一個(gè)完整的復(fù)雜網(wǎng)絡(luò)。該復(fù)雜網(wǎng)絡(luò)同時(shí)具備了一個(gè)顯著的特點(diǎn),該網(wǎng)絡(luò)由兩類節(jié)點(diǎn)以及兩類節(jié)點(diǎn)之間的連邊組成,同類節(jié)點(diǎn)之間不存在連邊,U代表借閱者,B代表書(shū)籍,最終關(guān)系如圖1所示,這樣的網(wǎng)絡(luò)在復(fù)雜網(wǎng)絡(luò)中被稱為二分網(wǎng)絡(luò)。

圖1 高校圖書(shū)借閱系統(tǒng)二分網(wǎng)絡(luò)示意圖

利用二分網(wǎng)絡(luò)分析對(duì)圖書(shū)借閱系統(tǒng)的研究起始于3項(xiàng)基本的內(nèi)容,它們分別是二分網(wǎng)的度、集聚系數(shù)及社團(tuán)結(jié)構(gòu)及聚類算法。

2.1 二分網(wǎng)的度

度本身的意義是指與該節(jié)點(diǎn)連接的其它節(jié)點(diǎn)的數(shù)目,一個(gè)節(jié)點(diǎn)的度又分為出度和入度兩種。在圖書(shū)借閱網(wǎng)絡(luò)的二分網(wǎng)絡(luò)模型中主要包括借閱者的度分布和書(shū)籍的度分布,它們分別是指一個(gè)單獨(dú)的借閱者借過(guò)書(shū)本的數(shù)目的分布,或者是一本書(shū)被多少位閱讀者借閱的分布。所有節(jié)點(diǎn)度的平均值稱為網(wǎng)絡(luò)的平均度。從二分網(wǎng)絡(luò)圖書(shū)借閱系統(tǒng)實(shí)證的角度出發(fā),一個(gè)節(jié)點(diǎn)無(wú)論從出度或入度的大小直接與該節(jié)點(diǎn)的重要程度相關(guān)。換句話說(shuō),通過(guò)度分布的研究可以非常直觀的找到最受青睞的書(shū)籍作品以及在借閱過(guò)程中最活躍的書(shū)籍閱讀者。另外,高校圖書(shū)借閱的度分布具有時(shí)間演化不變性者,均呈現(xiàn)出指數(shù)分布特征。

2.2 二分網(wǎng)的集聚系數(shù)

集聚系數(shù)是復(fù)雜網(wǎng)絡(luò)非常重要的特性之一,它實(shí)際表達(dá)了網(wǎng)絡(luò)連接的聚集程度,即網(wǎng)絡(luò)有多緊密。如果一個(gè)網(wǎng)絡(luò)結(jié)點(diǎn)有數(shù)個(gè)直接的鄰居結(jié)點(diǎn),那么這些鄰居結(jié)點(diǎn)之間有可能也是鄰居。聚集性用于描述這種可能性程度。對(duì)于復(fù)雜二分網(wǎng)絡(luò)而言,集聚系數(shù)又細(xì)化為點(diǎn)聚集系數(shù)與邊聚集系數(shù)兩類。對(duì)于高校圖書(shū)借閱系統(tǒng)而言,它擁有較多的書(shū)籍,但同時(shí)書(shū)籍之間具備了較高的關(guān)聯(lián)性,它們中都存在著一些規(guī)模不等的連通集團(tuán)結(jié)構(gòu)。連通集團(tuán)的中心節(jié)點(diǎn)包含某一相關(guān)主題,而中心節(jié)指向的各個(gè)分支節(jié)點(diǎn)含有與該主題有關(guān)的一些內(nèi)容。就是說(shuō)高校圖書(shū)是各學(xué)科或?qū)I(yè)的學(xué)習(xí)資料的集合,這樣很容易形成相關(guān)資料的聚集鏈接,這些內(nèi)容的分析與高校圖書(shū)館的管理有著緊密的關(guān)系。

2.3 社團(tuán)結(jié)構(gòu)及聚類算法

高校圖書(shū)館借閱圖書(shū)節(jié)點(diǎn)呈現(xiàn)出若干個(gè)“群”或“團(tuán)”的結(jié)構(gòu),復(fù)雜網(wǎng)絡(luò)稱之為社團(tuán)結(jié)構(gòu)。它是指網(wǎng)絡(luò)中的頂點(diǎn)可以分成組,組內(nèi)頂點(diǎn)間的連接比較稠密,組間頂點(diǎn)的連接比較稀疏,如圖2。社團(tuán)結(jié)構(gòu)在實(shí)際高校圖書(shū)借閱研究過(guò)程中有著重要的意義,它是了解整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)及促進(jìn)有效借閱的重要途徑。其主要步驟包括:(1)設(shè)定某種標(biāo)準(zhǔn)衡量社團(tuán)與社團(tuán)之間的距離或相似度;(2)將圖書(shū)館中的每一個(gè)被借閱的圖書(shū)視為一個(gè)社團(tuán),所以在初始狀態(tài),社團(tuán)數(shù)目與頁(yè)面數(shù)量相等;(3)根據(jù)設(shè)定的衡量標(biāo)準(zhǔn),計(jì)算社團(tuán)與社團(tuán)間的距離或相似度,并將距離最近的社團(tuán)或相似度最高的社團(tuán)合并在一起形成新的社團(tuán);(4)重新計(jì)算每對(duì)社團(tuán)間的距離或相似度;(5)不斷重復(fù)合并及重新計(jì)算的步驟,直到找到所有聚類的社團(tuán)。

目前,眾多劃分網(wǎng)絡(luò)社團(tuán)結(jié)構(gòu)的算法被設(shè)計(jì)出來(lái),主要包括凝聚算法、分裂算法,搜索算法及其他算法四大類。

3 二分網(wǎng)絡(luò)在云計(jì)算中具體實(shí)現(xiàn)

利用二分網(wǎng)絡(luò)對(duì)高校圖書(shū)館借閱信息的分析,對(duì)于提高高校圖書(shū)館的管理工作非常有幫助,但同時(shí)也存在如下

圖2 社團(tuán)結(jié)構(gòu)網(wǎng)絡(luò)示意圖

幾個(gè)難點(diǎn)問(wèn)題:(1)根據(jù)筆者調(diào)查收集的數(shù)據(jù)顯示,針對(duì)一個(gè)中等規(guī)模的大學(xué)圖書(shū)館,其1年的借閱數(shù)據(jù)基本在20萬(wàn)條,這些數(shù)據(jù)利用圖書(shū)館自身的分析耗時(shí)又耗力。(2)利用復(fù)雜網(wǎng)絡(luò)的分析方法對(duì)于專業(yè)的要求過(guò)高,不針對(duì)一般的管理人員。所以,需要一個(gè)平臺(tái),使圖書(shū)管理人員不再淹沒(méi)于大量的數(shù)據(jù)和技術(shù)方法,而直接得到分析的結(jié)果。

3.1 平臺(tái)選擇與技術(shù)實(shí)現(xiàn)

云計(jì)算在圖書(shū)館領(lǐng)域的應(yīng)用與研究已陸續(xù)展開(kāi),圖書(shū)館的云時(shí)代即將到來(lái),重塑圖書(shū)館生存和發(fā)展的環(huán)境、推動(dòng)圖書(shū)館自身變革是云計(jì)算環(huán)境下圖書(shū)館發(fā)展的未來(lái)趨勢(shì)。云計(jì)算是分布式處理、并行處理和網(wǎng)格計(jì)算的發(fā)展。從本質(zhì)上講,云計(jì)算是指用戶終端通過(guò)遠(yuǎn)程連接,獲取存儲(chǔ)、計(jì)算、數(shù)據(jù)庫(kù)等計(jì)算資源。目前,業(yè)界提供云計(jì)算服務(wù)的運(yùn)營(yíng)商較多,對(duì)于高校圖書(shū)管理二分網(wǎng)技術(shù)云計(jì)算實(shí)現(xiàn)而言,可以選用谷歌Google。日常在使用的Google Search,Google Earth,GoolgeMap,Google Gmail,Google Doc等等業(yè)務(wù)都是Google基于自己云計(jì)算平臺(tái)來(lái)提供的。Google也是通過(guò)云計(jì)算的方式,大量的降低計(jì)算成本,使之業(yè)務(wù)更具有競(jìng)爭(zhēng)力,其云計(jì)算平臺(tái)架構(gòu)如圖3所示。

對(duì)于高校圖書(shū)管理云計(jì)算的實(shí)現(xiàn),首先是各類軟件應(yīng)用,一般常見(jiàn)的形式包括圖書(shū)館自動(dòng)化系統(tǒng)、辦公自動(dòng)化系統(tǒng)等,都以一種網(wǎng)絡(luò)服務(wù)的形式提供;第二,云存儲(chǔ)服務(wù),大量的數(shù)字資源都可以存放服務(wù)器上,而不再需要“鏡像”于本地;第三,云計(jì)算服務(wù)提供商,提供本地?cái)?shù)據(jù)中心或者其他業(yè)務(wù)支持;第四,平臺(tái)服務(wù),大型圖書(shū)館引入“云”設(shè)施,利用商用的云計(jì)算解決方案,架構(gòu)滿足本地或局部應(yīng)用的“私有云”平臺(tái);第五,互聯(lián)網(wǎng)整合服務(wù),圖書(shū)館作為一種服務(wù)中介,需要整合多家平臺(tái)和資源,利用各類云實(shí)現(xiàn)不同“云”之間的互操作,向管理者提供更有效的服務(wù)。

Google云計(jì)算軟件系統(tǒng)為圖書(shū)館數(shù)據(jù)的二分網(wǎng)絡(luò)分析提供了一種理想的平臺(tái),原因在于Google云計(jì)算平臺(tái)軟件系統(tǒng)特別提供了Python與Java開(kāi)發(fā)開(kāi)發(fā)工具,而目前絕大多數(shù)的二分網(wǎng)絡(luò)分析程序都是基于上述兩種程序語(yǔ)言編制的,它保證了數(shù)據(jù)分析的可擴(kuò)充性與通用性。同時(shí),Google云計(jì)算平臺(tái)的并行計(jì)算算法及并行數(shù)據(jù)庫(kù)將極大提高高校圖書(shū)館數(shù)據(jù)的分析速度。另外,在借助google云計(jì)算平臺(tái)處理數(shù)據(jù)的同時(shí),必須注重?cái)?shù)據(jù)存儲(chǔ)格式的界定,目前高校大多數(shù)的數(shù)據(jù)多以EXCEL的xls格式或其它自主格式保存,這對(duì)云端數(shù)據(jù)的二分網(wǎng)絡(luò)處理分析非常不利,高校圖書(shū)館的借閱數(shù)據(jù)應(yīng)該轉(zhuǎn)向更加具體的網(wǎng)絡(luò)數(shù)據(jù)格式,例如CSV或NET等格式,這對(duì)后期的處理創(chuàng)造有利的基礎(chǔ)。

3.2 存在問(wèn)題的思考

云計(jì)算與二分網(wǎng)絡(luò)分析技術(shù)的結(jié)合,將為高校圖書(shū)館數(shù)據(jù)分析插上有力的翅膀,但同時(shí)也存在某些待解決的問(wèn)題:首先是互操作性和標(biāo)準(zhǔn)化問(wèn)題,在云計(jì)算與圖書(shū)管理自動(dòng)化的初步成長(zhǎng)期,由于各廠商都試圖建立自己的接口,同樣是高校圖書(shū)館借閱數(shù)據(jù),卻存在著大相徑庭的存儲(chǔ)與處理方式,導(dǎo)致解決同一問(wèn)題的方法多樣化。其次,信息安全與保密問(wèn)題,目前,高校圖書(shū)館的數(shù)據(jù)絕大部分是內(nèi)部數(shù)據(jù),采用不公開(kāi)的方式處理,但另一方面,二分網(wǎng)方法對(duì)一所大學(xué)數(shù)據(jù)的分析不具備可比性,只有累計(jì)多方的數(shù)據(jù),才能讓分析處理結(jié)果具備合理性。

猜你喜歡
云計(jì)算應(yīng)用程序高校圖書(shū)館
刪除Win10中自帶的應(yīng)用程序
基于云計(jì)算的移動(dòng)學(xué)習(xí)平臺(tái)的設(shè)計(jì)
高校圖書(shū)館閱讀推廣案例分析
科技視界(2016年21期)2016-10-17 19:32:37
微信公眾平臺(tái)在高校圖書(shū)館信息服務(wù)中的應(yīng)用研究
科技視界(2016年21期)2016-10-17 19:25:20
實(shí)驗(yàn)云:理論教學(xué)與實(shí)驗(yàn)教學(xué)深度融合的助推器
云計(jì)算中的存儲(chǔ)虛擬化技術(shù)應(yīng)用
科技視界(2016年20期)2016-09-29 13:34:06
高校圖書(shū)館閱讀推廣實(shí)踐探討
科技視界(2016年20期)2016-09-29 13:17:57
高校圖書(shū)館電子資源的宣傳與推廣
科技視界(2016年20期)2016-09-29 11:22:45
關(guān)閉應(yīng)用程序更新提醒
電腦迷(2012年15期)2012-04-29 17:09:47
三星電子將開(kāi)設(shè)應(yīng)用程序下載商店
隆化县| 南丹县| 昭苏县| 张家界市| 涡阳县| 延边| 万载县| 鄯善县| 万宁市| 石柱| 沽源县| 亳州市| 靖西县| 玉林市| 桂林市| 辛集市| 昆山市| 古田县| 兖州市| 沂南县| 渑池县| 南靖县| 沁源县| 黄大仙区| 陆丰市| 闽侯县| 简阳市| 阿拉善右旗| 伊春市| 杂多县| 镇江市| 彭州市| 余江县| 崇信县| 凉城县| 获嘉县| 会宁县| 遵化市| 搜索| 鲜城| 大姚县|