(北安市機(jī)構(gòu)編制數(shù)據(jù)中心,北安 164099)
數(shù)據(jù)挖掘是基于計(jì)算機(jī)科學(xué),通過統(tǒng)計(jì)、在線分析處理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)和模式識(shí)別等方法對大數(shù)據(jù)高度自動(dòng)化地分析每個(gè)數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù)。數(shù)據(jù)控制具有聚類、概念描述、關(guān)聯(lián)分析、趨勢預(yù)測等功能,其常用的方法有分類、回歸分析、Web數(shù)據(jù)挖掘等。數(shù)據(jù)挖掘技術(shù)側(cè)重于應(yīng)用,數(shù)據(jù)挖掘在網(wǎng)絡(luò)管理中應(yīng)用具有重要現(xiàn)實(shí)意義。數(shù)據(jù)挖掘技術(shù)分為數(shù)據(jù)層、表示層以及應(yīng)用層邏輯架構(gòu)方式。網(wǎng)絡(luò)管理中用戶可以將WEB技術(shù)作為基礎(chǔ),應(yīng)用兼容Browser的操作系統(tǒng)實(shí)現(xiàn)用戶端和應(yīng)用服務(wù)器間數(shù)據(jù)信息相互交流。服務(wù)器在接收客戶端應(yīng)用層的查詢指令和數(shù)據(jù)集成訪問請求時(shí),將客戶端和應(yīng)用服務(wù)器進(jìn)行高效連接,調(diào)用應(yīng)用服務(wù)器或靜態(tài)頁面響應(yīng)請求,經(jīng)用戶合法性身份核實(shí)認(rèn)證后對應(yīng)服務(wù)器提出請求,激活查詢?nèi)蝿?wù)應(yīng)用,采用接口處理實(shí)現(xiàn)數(shù)據(jù)交換。
網(wǎng)絡(luò)是通信媒介和為人們提供綜合服務(wù)的分布式信息處理平臺(tái),網(wǎng)絡(luò)管理技術(shù)是伴隨著計(jì)算機(jī)、網(wǎng)絡(luò)、通信技術(shù)發(fā)展的,網(wǎng)絡(luò)管理是指監(jiān)測、控制和記錄電信網(wǎng)絡(luò)資源的性能和使用情況,以使網(wǎng)絡(luò)有效運(yùn)行,為用戶提供一定質(zhì)量水平的電信業(yè)務(wù)。網(wǎng)絡(luò)管理包括對故障管理、配置管理、性能管理、安全管理、計(jì)費(fèi)管理。常見的網(wǎng)絡(luò)管理方式有SNMP管理技術(shù)、RMON管理技術(shù)和WEB的網(wǎng)絡(luò)管理,數(shù)據(jù)挖掘被應(yīng)用于網(wǎng)絡(luò)管理能有效監(jiān)視、測試、配置、分析、評(píng)價(jià)和控制數(shù)據(jù)流,有效增強(qiáng)信息檢索系統(tǒng)的能力,及時(shí)報(bào)告和處理故障,提升實(shí)時(shí)運(yùn)行性能和和服務(wù)質(zhì)量,促進(jìn)網(wǎng)絡(luò)系統(tǒng)高效運(yùn)行。
數(shù)據(jù)挖掘在不同領(lǐng)域的應(yīng)用步驟是不同的,數(shù)據(jù)挖掘在網(wǎng)絡(luò)管理中需要針對不同需求實(shí)施有針對性的流程規(guī)劃設(shè)計(jì)。數(shù)據(jù)挖掘網(wǎng)絡(luò)管理實(shí)現(xiàn)流程為在表示層中,使用人員運(yùn)用WEB瀏覽器HTML文件發(fā)出HTYP命令,WEB服務(wù)器接受并響應(yīng)請求,經(jīng)由翻譯處理轉(zhuǎn)換成應(yīng)用服務(wù)器可以處理的命令,實(shí)現(xiàn)與數(shù)據(jù)庫的對接,生成查詢西方世界如果傳輸給客戶端;在應(yīng)用層中服務(wù)器在初步分析處理后組建分析模型,采用科學(xué)算法自動(dòng)生成有價(jià)值信息;基于數(shù)據(jù)挖掘技術(shù)形成的網(wǎng)絡(luò)告警數(shù)據(jù)庫中,包含著反映網(wǎng)絡(luò)管理規(guī)律的有價(jià)值信息,運(yùn)用故障分析管理模塊對網(wǎng)絡(luò)運(yùn)行情況進(jìn)行評(píng)估協(xié)助網(wǎng)管人員分析故障信息、快速故障定位,挖掘告警關(guān)聯(lián)規(guī)則,強(qiáng)化告警分析和故障診斷,快速發(fā)現(xiàn)、做出故障決策和預(yù)測以排除故障,確保網(wǎng)絡(luò)安全。
數(shù)據(jù)挖掘是一個(gè)完整的過程,數(shù)據(jù)挖掘主要分為數(shù)據(jù)準(zhǔn)備、規(guī)律尋找和規(guī)律表示解釋三個(gè)步驟。網(wǎng)絡(luò)管理中數(shù)據(jù)挖掘應(yīng)用程序一般有以下幾步:
清晰定義業(yè)務(wù)問題,對數(shù)據(jù)進(jìn)行有預(yù)見性的挖掘,防止數(shù)據(jù)挖掘盲目性。
數(shù)據(jù)準(zhǔn)備分為數(shù)據(jù)選擇、數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換工作。網(wǎng)絡(luò)管理中的數(shù)據(jù)挖掘要檢索與網(wǎng)絡(luò)管理相關(guān)的內(nèi)部和外部數(shù)據(jù)信息,依據(jù)需求確定挖掘操作的類型,濾除掉數(shù)據(jù)的無用、冗余和無法判別的資料,保留可用有效數(shù)據(jù),進(jìn)行數(shù)據(jù)的整合歸集、壓縮、倉儲(chǔ)等數(shù)據(jù)預(yù)處理,提升數(shù)據(jù)分析準(zhǔn)確率;數(shù)據(jù)挖掘中由于人類和計(jì)算語言表達(dá)的不同,要將針對挖掘算法建立分析模型將數(shù)據(jù)進(jìn)行集成轉(zhuǎn)換成計(jì)算機(jī)可識(shí)別的格式、形式。
對依據(jù)挖掘算法進(jìn)行轉(zhuǎn)換的數(shù)據(jù)進(jìn)行完善,運(yùn)用數(shù)據(jù)探勘引擎系統(tǒng)功能對相關(guān)數(shù)據(jù)的關(guān)系進(jìn)行有效分析、判別、群組分析;運(yùn)用用戶接口溝通用戶互動(dòng)、搜索,根據(jù)樣式評(píng)估判斷數(shù)據(jù)關(guān)聯(lián)性和有用性。數(shù)據(jù)的完整程度、專業(yè)人員支持的程度對數(shù)據(jù)挖掘有效性具有制約影響。常用的數(shù)據(jù)探勘工具有支持文本、網(wǎng)絡(luò)、圖像或是鏈接開放式數(shù)據(jù)挖掘的Rapidminer開源式框架;用于數(shù)據(jù)挖掘任務(wù)的算法的集合WEKA;具有自由開源信息匯整能力,支持?jǐn)?shù)據(jù)查詢、處理、分析和流程規(guī)劃管理能力的KNIME圖形接口。Rapidminer不需要程序語言的編輯能力,通過簡潔易懂的圖形接口設(shè)計(jì)流程,使用者可自由配置操作接口具有較強(qiáng)的擴(kuò)展性,通過擴(kuò)充元件協(xié)同系統(tǒng)內(nèi)部運(yùn)作;WEKA具有四種模式、約五百種功能可供使用者選擇;KNIME平臺(tái)可自由配置操作接口,在同一時(shí)間開戶不同視窗滿足不同功能服務(wù)。
網(wǎng)絡(luò)管理中要視挖掘操作條件而選用合適的分析方法,可視化技術(shù)可以應(yīng)用到網(wǎng)絡(luò)數(shù)據(jù)挖掘應(yīng)用中;在挖掘中將分析所得有效數(shù)據(jù)集成到業(yè)務(wù)信息系統(tǒng)組織結(jié)構(gòu)中可以提升網(wǎng)絡(luò)管理應(yīng)用水平。
綜上所述,數(shù)據(jù)挖掘是一個(gè)系統(tǒng)完整的流程,運(yùn)用數(shù)據(jù)挖掘能為網(wǎng)絡(luò)管理系統(tǒng)提供更好的指導(dǎo),高效利用網(wǎng)絡(luò)資源,降低運(yùn)營成本,保證網(wǎng)絡(luò)安全,提升網(wǎng)絡(luò)管理質(zhì)量。網(wǎng)絡(luò)管理中要建立網(wǎng)絡(luò)管理系統(tǒng),推廣數(shù)據(jù)挖掘應(yīng)用,實(shí)現(xiàn)數(shù)據(jù)資源共享,為用戶提供高質(zhì)量、可靠服務(wù)。