薛美芳
[摘 要]隨著網(wǎng)絡(luò)技術(shù)與應(yīng)用的不斷發(fā)展,計(jì)算機(jī)網(wǎng)絡(luò)在圖書(shū)館建設(shè)中已經(jīng)變得越來(lái)越普遍。網(wǎng)絡(luò)圖書(shū)館建設(shè)嚴(yán)重依賴于計(jì)算機(jī)網(wǎng)絡(luò),因此網(wǎng)絡(luò)運(yùn)行的穩(wěn)定性、可靠性就顯得至關(guān)重要,于是網(wǎng)絡(luò)管理就應(yīng)運(yùn)而生。本文是通過(guò)數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法應(yīng)用在高校網(wǎng)絡(luò)圖書(shū)館建設(shè)中。它對(duì)大規(guī)模網(wǎng)絡(luò)圖書(shū)館的故障診斷具有理論指導(dǎo)意義和實(shí)際應(yīng)用價(jià)值。
[關(guān)鍵詞]網(wǎng)絡(luò)圖書(shū)館;數(shù)據(jù)挖掘;故障診斷
一、引言
在信息社會(huì)里,網(wǎng)絡(luò)圖書(shū)館具有巨大的發(fā)展?jié)摿蛢?yōu)勢(shì)。但在我國(guó)高校目前的客觀條件中,建設(shè)網(wǎng)絡(luò)圖書(shū)館還存在諸多問(wèn)題,網(wǎng)絡(luò)的可靠性是推行網(wǎng)絡(luò)圖書(shū)館的發(fā)展與建設(shè)過(guò)程中的一個(gè)難點(diǎn)。圖書(shū)館網(wǎng)絡(luò)的通訊線路和站點(diǎn)都會(huì)由于某種原因出現(xiàn)故障,甚至有可能造成整個(gè)圖書(shū)館網(wǎng)絡(luò)不能正常工作。因此對(duì)網(wǎng)絡(luò)圖書(shū)館的可靠性研究已成為當(dāng)今急需解決的課題之一。近幾年來(lái),網(wǎng)絡(luò)的可靠性研究已經(jīng)有很多成果。本文是通過(guò)數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法應(yīng)用在高校網(wǎng)絡(luò)圖書(shū)館建設(shè)中。它對(duì)大規(guī)模網(wǎng)絡(luò)圖書(shū)館的故障診斷具有理論指導(dǎo)意義和實(shí)際應(yīng)用價(jià)值。
二、數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法
應(yīng)用數(shù)據(jù)挖掘方法,網(wǎng)絡(luò)故障診斷系統(tǒng)可以通過(guò)分析已有的異常信息的正確處理方法以及各種異常之間的前后關(guān)系的記錄,得到其間的關(guān)聯(lián)規(guī)則,這些有價(jià)值的信息可用于網(wǎng)絡(luò)故障的定位檢測(cè)和嚴(yán)重故障的預(yù)測(cè)等任務(wù)。并能根據(jù)當(dāng)前的診斷信息,就可以得到其后續(xù)發(fā)生各種情況的可能性,對(duì)危險(xiǎn)事件可以起到預(yù)防的作用,從而使通信網(wǎng)絡(luò)得以安全運(yùn)轉(zhuǎn)。
數(shù)據(jù)挖掘的任務(wù)是從大量的數(shù)據(jù)中的找到模式或知識(shí)。根據(jù)它們的作用方式可分為兩類:一類稱為描述性模式,它是使存在于數(shù)據(jù)描述的規(guī)律。如泛化模式,聚類分析模型,及時(shí)問(wèn)的關(guān)聯(lián)模式序列模式。另一種是預(yù)測(cè)模型,它是基于知識(shí)從現(xiàn)有的數(shù)據(jù)挖掘某些數(shù)據(jù)得到預(yù)測(cè)未知的性質(zhì)。包括分類模型和回歸模型。其中,分類模型是一個(gè)重要的預(yù)測(cè)模型。
抽象分析,挖掘分類模型步驟如下:首先,我們必須把挖掘數(shù)據(jù)庫(kù)進(jìn)行預(yù)處理:把數(shù)據(jù)庫(kù)中的記錄進(jìn)行排序,包括取消一些不完整的記錄和獨(dú)立的性質(zhì),主要是為了確定一個(gè)類別的屬性,并確保每一個(gè)記錄類別屬性已經(jīng)給出。然后,從待挖數(shù)據(jù)中提取形成訓(xùn)練樣本集。把訓(xùn)練樣本集運(yùn)用一種或多種分類挖掘方式進(jìn)行挖掘,最后輸出某種方式的分類模式。分類模式的方式有決策樹(shù),數(shù)學(xué)公式,分類規(guī)則等。
所謂數(shù)據(jù)挖掘是從大量的不完整的,嘈雜的,模糊的和隨機(jī)提取隱含在其中的實(shí)際應(yīng)用數(shù)據(jù),人們先前不知道,但又是潛在的有用的信息和知識(shí)。這個(gè)定義包括幾層意思:數(shù)據(jù)源必須是真實(shí)的,有很多嘈雜的,發(fā)現(xiàn)是用戶感興趣的知識(shí),知識(shí)發(fā)現(xiàn)是可以接受的,可以理解,可以應(yīng)用,不要求發(fā)現(xiàn)放之四海皆準(zhǔn)的知識(shí),僅支持特定的發(fā)現(xiàn)問(wèn)題。數(shù)據(jù)挖掘可以看作是KDD的一個(gè)小步驟,如圖所示。
三、數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法在高校網(wǎng)絡(luò)圖書(shū)館智能服務(wù)中的應(yīng)用
目前,在網(wǎng)絡(luò)中的高校圖書(shū)館智能服務(wù)網(wǎng)絡(luò)診斷數(shù)據(jù)挖掘應(yīng)用還比較少,和智能網(wǎng)絡(luò)服務(wù)的許多方面,該庫(kù)已經(jīng)應(yīng)用:如分類,編目,索引,流通管理,信息檢索等。在建設(shè)一個(gè)圖書(shū)館以及圖書(shū)館和信息管理過(guò)程的可靠性分析,智能書(shū)籍改進(jìn)信息技術(shù),從而完成傳統(tǒng)圖書(shū)館向數(shù)字圖書(shū)館發(fā)展的數(shù)據(jù)挖掘過(guò)程中使用的網(wǎng)絡(luò)診斷方法是智能圖書(shū)館的飛躍,是一個(gè)重要的研究圖書(shū)館的發(fā)展和建設(shè)。
1、數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法在網(wǎng)絡(luò)圖書(shū)館文獻(xiàn)分類中的應(yīng)用
文檔分類是根據(jù)相似性和文學(xué)之間的差異的內(nèi)容和形式定義的,按照一定的體系,有系統(tǒng)地組織和分化的文獻(xiàn)。工作人員在圖書(shū)館分類是基于文獻(xiàn)揭示和整理文件,所反映的主題內(nèi)容和功能的外在形式。文學(xué)的主要目的是基于對(duì)組織文化的不同類別的學(xué)科知識(shí)的系統(tǒng)分類,使文學(xué)的同一學(xué)科性質(zhì)在一起,形成學(xué)科體系,使用文獻(xiàn)檢索,以滿足讀者的需求。
網(wǎng)絡(luò)圖書(shū)館收集了大量的書(shū)籍和文件,也有幾十萬(wàn),上百萬(wàn),甚至千萬(wàn)。每個(gè)在這些文獻(xiàn)中引用的文件分類給予DOI。每個(gè)CLC對(duì)準(zhǔn)對(duì)應(yīng)于一個(gè)固定的位置。如此大量的文檔可以按照分類系統(tǒng)排列有序。然而,這樣一個(gè)龐大的網(wǎng)絡(luò)圖書(shū)館系統(tǒng),有效和快速的分類管理,極大地測(cè)試計(jì)算機(jī)系統(tǒng)網(wǎng)絡(luò)的可靠性。當(dāng)嚴(yán)重的網(wǎng)絡(luò)故障發(fā)生在網(wǎng)絡(luò)圖書(shū)館系統(tǒng),以及它如何能夠有效排除故障?當(dāng)在網(wǎng)絡(luò)圖書(shū)館文獻(xiàn)分類數(shù)據(jù)挖掘的網(wǎng)絡(luò)故障診斷,可以發(fā)揮自己的優(yōu)勢(shì),迅速而準(zhǔn)確地排除網(wǎng)絡(luò)故障,網(wǎng)絡(luò)圖書(shū)館文獻(xiàn)分類數(shù)據(jù)挖掘的網(wǎng)絡(luò)診斷具有非常廣闊的應(yīng)用前景。
2、數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法在網(wǎng)絡(luò)圖書(shū)館的檢索工作環(huán)節(jié)的應(yīng)用
現(xiàn)有的網(wǎng)絡(luò)庫(kù)的檢索方面是利用人工智能技術(shù)來(lái)模擬人腦的收集,存儲(chǔ),檢索和匹配,推理(感性)和管理。和信息的收集,存儲(chǔ),檢索和匹配,推理(感性)和管理的檢索過(guò)程中其他方面的工作,難免會(huì)遇到諸如故障情況。數(shù)據(jù)挖掘的網(wǎng)絡(luò)診斷,以排除網(wǎng)絡(luò)庫(kù)中檢索故障的各個(gè)方面都有非常快速和準(zhǔn)確的優(yōu)點(diǎn),將解決這個(gè)問(wèn)題不能得到解決在圖書(shū)館遇到的檢索網(wǎng)絡(luò)鏈路上,導(dǎo)致網(wǎng)絡(luò)庫(kù)檢索革命?!?/p>
檢索網(wǎng)絡(luò)圖書(shū)館是一個(gè)綜合的人機(jī)系統(tǒng)由一個(gè)由幾個(gè)子網(wǎng)絡(luò),由全球性組織實(shí)現(xiàn)圖書(shū)數(shù)據(jù)檢索和共享,提供分析,規(guī)劃,預(yù)測(cè)和信息綜合控制系統(tǒng)的一部分。經(jīng)常會(huì)發(fā)生在這樣一個(gè)大的檢索系統(tǒng)的故障的問(wèn)題,因此操作系統(tǒng)到網(wǎng)絡(luò)所需的系統(tǒng)維護(hù)在固定的時(shí)間間隔,例如沒(méi)有解決的問(wèn)題。并解決了數(shù)據(jù)挖掘的核心是研究網(wǎng)絡(luò)診斷方法的一個(gè)網(wǎng)絡(luò)問(wèn)題。如果在先進(jìn)的數(shù)據(jù)挖掘庫(kù)網(wǎng)絡(luò)診斷網(wǎng)絡(luò)可靠性分析技術(shù)使用時(shí),將被綁定到一個(gè)網(wǎng)絡(luò)庫(kù)的變化。
3、數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法在圖書(shū)館自動(dòng)化網(wǎng)絡(luò)中的應(yīng)用
計(jì)算機(jī)網(wǎng)絡(luò)連接,并控制了大量的庫(kù)現(xiàn)代化圖書(shū)館的網(wǎng)絡(luò),也稱為庫(kù)計(jì)算機(jī)網(wǎng)絡(luò)的形成。由于書(shū)目數(shù)據(jù)庫(kù)的出發(fā)點(diǎn)和它的北美建筑的基礎(chǔ)上,也被稱為書(shū)目機(jī)構(gòu)。
圖書(shū)館自動(dòng)化網(wǎng)絡(luò)具有多種功能:
①連續(xù)出版物管理,建立連續(xù)劇會(huì)員庫(kù),開(kāi)展自動(dòng)化業(yè)務(wù)的聯(lián)合目錄。
②權(quán)限控制,通過(guò)網(wǎng)絡(luò)集線器規(guī)范文檔書(shū)目數(shù)據(jù)庫(kù),編目成員館,以控制名稱規(guī)格(人名,地名,書(shū)籍名稱,組織機(jī)構(gòu)名等)和主題規(guī)范,以達(dá)到規(guī)范化和標(biāo)準(zhǔn)化。
③在網(wǎng)絡(luò)共享計(jì)算機(jī)硬件和軟件資源。一般情況下,各個(gè)業(yè)務(wù)庫(kù)可以使用所有圖書(shū)館自動(dòng)化網(wǎng)絡(luò)的全部或部分,但更側(cè)重于聯(lián)合編目,館際互借和權(quán)限控制等。每個(gè)特定的網(wǎng)絡(luò)具有不同的功能。
④聯(lián)合目錄查詢,使用終端來(lái)檢查網(wǎng)絡(luò)是否藏在一個(gè)特定的文件,隱藏在庫(kù)中。
⑤電子郵件,利用計(jì)算機(jī)網(wǎng)絡(luò)進(jìn)行通信大廳的電子郵箱服務(wù)的成員。
⑥聯(lián)合編目成員館使用的網(wǎng)絡(luò)為中心的大型書(shū)目數(shù)據(jù)庫(kù),并取得產(chǎn)品目錄在線目錄,同時(shí)生成的工會(huì)大廳的中心的所有成員的目錄(請(qǐng)參閱合作編目)。
⑦館際互借,與聯(lián)合目錄,網(wǎng)絡(luò)通過(guò)終端大廳的每個(gè)成員可以在網(wǎng)上館際互借。
⑧采購(gòu)協(xié)調(diào),聯(lián)合目錄,以了解情況和西藏博物館收藏功能協(xié)調(diào)采購(gòu)政策及其成員圖書(shū)館和決定是否特定于采購(gòu)文件。
圖書(shū)館自動(dòng)化網(wǎng)絡(luò)如此強(qiáng)大的功能,在其運(yùn)行的過(guò)程中勢(shì)必出現(xiàn)無(wú)法解決的可靠性分析問(wèn)題,數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法應(yīng)用于自動(dòng)化網(wǎng)絡(luò)故障診斷技術(shù)中,勢(shì)必又會(huì)促使圖書(shū)館自動(dòng)化網(wǎng)絡(luò)技術(shù)產(chǎn)生進(jìn)一步提升。
四、結(jié)語(yǔ)
總體而言,與傳統(tǒng)圖書(shū)館相比,圖書(shū)館的網(wǎng)絡(luò)化具有巨大的發(fā)展?jié)摿蛢?yōu)勢(shì)。在大型網(wǎng)絡(luò)庫(kù)的可靠性分析各個(gè)環(huán)節(jié)的中,數(shù)據(jù)挖掘的網(wǎng)絡(luò)診斷方法應(yīng)用到解決這些問(wèn)題的理論意義的可靠性和實(shí)用價(jià)值。但是,數(shù)據(jù)挖掘的網(wǎng)絡(luò)診斷和組合應(yīng)用到網(wǎng)絡(luò)圖書(shū)館的建設(shè)的各個(gè)方面還需要長(zhǎng)期艱苦的努力。因此,在聯(lián)合過(guò)程中應(yīng)由易到難,一步一步,最終建設(shè)勢(shì)必成為高校發(fā)展過(guò)程中一顆燦爛的明珠。
參考文獻(xiàn):
[1]李康.數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)故障診斷中的應(yīng)用研究[J].計(jì)算機(jī)軟件與理論2004.12
[2]郭淑蘭.交叉撕裂網(wǎng)絡(luò)診斷法在高校網(wǎng)絡(luò)圖書(shū)館建設(shè)中的應(yīng)用[J].大江周刊2013.1
[3]李峰,趙海興,徐宗本.構(gòu)建一類新網(wǎng)絡(luò)簇的可靠性控制集[J].計(jì)算機(jī)學(xué)報(bào),2013.6
[4]郭軍.人工智能技術(shù)在圖書(shū)館中的應(yīng)用[J].現(xiàn)代情報(bào).2002.8
[5]楊曉玉.淺談圖書(shū)館文獻(xiàn)分類工作[J].投資與合作.2011.12
[6]郭淑蘭.論高校網(wǎng)絡(luò)圖書(shū)館的建設(shè)[J].都市家教2010.11