国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

“層次分析法構(gòu)建挖掘模型”的基本內(nèi)涵及應(yīng)用效能研究

2014-08-15 00:53王瑾
陜西教育·高教版 2014年3期
關(guān)鍵詞:類(lèi)別分析法數(shù)據(jù)挖掘

王瑾

一般來(lái)說(shuō),在系統(tǒng)的“層次分析法構(gòu)建挖掘模型”體系結(jié)構(gòu)之中,主要包括數(shù)據(jù)挖掘處理模式、知識(shí)數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘處理方法、數(shù)據(jù)模型學(xué)習(xí)與數(shù)據(jù)模型評(píng)估等幾個(gè)方面的重要內(nèi)容。該系統(tǒng)從整個(gè)戰(zhàn)略的高度、不同層面的技術(shù)水平以及差異化的抽象層面來(lái)支撐不同挖掘組件之間的設(shè)置與組合,隨后再重新設(shè)計(jì)、實(shí)施整個(gè)數(shù)據(jù)挖掘過(guò)程,最終形成一個(gè)合理的“數(shù)據(jù)挖掘模型結(jié)構(gòu)”。

具體來(lái)說(shuō),“層次分析法構(gòu)建挖掘模型”從不同的角度和層次上對(duì)整個(gè)數(shù)據(jù)挖掘的過(guò)程進(jìn)行結(jié)構(gòu)化、系統(tǒng)化的處理和改進(jìn)。在層次分析法構(gòu)建挖掘模型流程開(kāi)始的時(shí)候,為了提升整個(gè)模型的準(zhǔn)確性與高效性,知識(shí)數(shù)據(jù)庫(kù)會(huì)與各種挖掘模型方法通過(guò)交互或者是互動(dòng)的方式實(shí)施系統(tǒng)模型的自我學(xué)習(xí)。隨后,每一個(gè)模型也會(huì)與知識(shí)數(shù)據(jù)庫(kù)的構(gòu)成部分之一Analytical Base通過(guò)交互的方式對(duì)現(xiàn)存的模型系統(tǒng)進(jìn)行打分和評(píng)估。在完成了具體的評(píng)估與打分工作之后,它便會(huì)進(jìn)入到挖掘模式環(huán)節(jié),然后對(duì)比分析每一個(gè)“挖掘模型方法”,對(duì)其進(jìn)行聚類(lèi)、分類(lèi)、回歸等相關(guān)的處理活動(dòng),最后會(huì)在挖掘模式層之中按照從優(yōu)至劣的順序?qū)⒏鞣N模型進(jìn)行排列,并通過(guò)數(shù)據(jù)表格的方式表示出來(lái)。一般來(lái)說(shuō),“優(yōu)秀”的挖掘模型處于結(jié)構(gòu)的最頂端,隨后的是“成功”的挖掘模型。這些以數(shù)據(jù)表格呈現(xiàn)出來(lái)的排列結(jié)果會(huì)傳輸給執(zhí)行引擎進(jìn)行相關(guān)的處理,也即是對(duì)“優(yōu)秀”挖掘模型進(jìn)行數(shù)據(jù)的挖掘與預(yù)測(cè)活動(dòng)。在充分使用“Analytical Base”與“Knowledge Engine”的時(shí)候,執(zhí)行條件不同,挖掘模型評(píng)估結(jié)果的質(zhì)量水平也會(huì)呈現(xiàn)出比較大的差異,但是其模式分支可以自由地進(jìn)行插播,因此,不僅大大提升了工作效率,而且準(zhǔn)確性也會(huì)隨之有明顯的提高。這是層次分析法構(gòu)建挖掘模型的優(yōu)良之處。

“層次分析法構(gòu)建挖掘模型”的數(shù)據(jù)挖掘與處理的流程可以概括為:首先是建立相應(yīng)的層次結(jié)構(gòu);其次是與知識(shí)數(shù)據(jù)庫(kù)進(jìn)行相關(guān)的交互活動(dòng);第三是對(duì)既定模型系統(tǒng)的分析和學(xué)習(xí);第四是選擇和評(píng)估合適的模型樣式。在整體的層次結(jié)構(gòu)設(shè)計(jì)過(guò)程中,通過(guò)先分解、后綜合的思想達(dá)到對(duì)“層次分析法構(gòu)建挖掘模型”系統(tǒng)分析的目的。

模型學(xué)習(xí)、模型評(píng)估以及模型學(xué)習(xí)與評(píng)估的影響關(guān)系是“層次分析法構(gòu)建挖掘模型”中的三個(gè)重要概念。第一,模型學(xué)習(xí)主要是在M-KPI環(huán)節(jié)實(shí)現(xiàn)的。其核心目的在于通過(guò)使用新的數(shù)據(jù)來(lái)更新原有模型,從而形成一個(gè)嶄新的模型樣式。模型之間的不同之處就在于新的數(shù)據(jù)建構(gòu)起新的模型,計(jì)算的設(shè)置、類(lèi)型以及模型的范式都是一樣的。第二,模型評(píng)估是在M-KPI和M-CSF兩個(gè)層面發(fā)生的。輸入“樣品數(shù)據(jù)”,隨后進(jìn)行相關(guān)的評(píng)估和打分活動(dòng),得到相應(yīng)的預(yù)測(cè)結(jié)果之后,通過(guò)實(shí)際結(jié)果來(lái)評(píng)估模型,并且給其賦予相關(guān)的“權(quán)值”。從而使所有M-KPI都能夠得到相應(yīng)的“權(quán)值”,以此來(lái)篩選評(píng)估模型和計(jì)算方法。第三,在模型學(xué)習(xí)與評(píng)估的影響關(guān)系方面,首先是各個(gè)M-KPI刷新模型,由此產(chǎn)生適合于新數(shù)據(jù)內(nèi)容的模型;其次通過(guò)“Analytics Data”來(lái)評(píng)估各個(gè)模型,因此,輸入迥異的需求數(shù)據(jù),也能夠產(chǎn)生不同的線(xiàn)性結(jié)構(gòu)圖。通過(guò)綜合分析各個(gè)KPI的影響,各個(gè)M-CSF也就形成了特定的自適應(yīng)影響的波動(dòng)效果圖。

層次分析法構(gòu)建挖掘模型中包括諸多的成功關(guān)鍵因素,其中,分類(lèi)-CSF作為層次分析法構(gòu)建挖掘模型中一個(gè)非常重要的成功關(guān)鍵因素,其目的是學(xué)會(huì)一個(gè)分類(lèi)模型或者是分類(lèi)函數(shù),從而把復(fù)雜數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)映射到特定類(lèi)別中的某一個(gè)模型之上,由此實(shí)現(xiàn)數(shù)據(jù)信息的聚合、分類(lèi)與預(yù)測(cè)活動(dòng)。從系統(tǒng)內(nèi)容的角度來(lái)說(shuō),分類(lèi)-CSF中包含決策樹(shù)算法、Bayes算法等諸多計(jì)算方式。比如Bayes分類(lèi)算法假設(shè)是在特定的數(shù)據(jù)樣本中通過(guò)一個(gè)n維特征的向量來(lái)描述n個(gè)屬性特征的值。也即是說(shuō),X={x1,x2,x3,……,xm},如果擁有 m個(gè)類(lèi)別,就可以使用 C1,C2,C3,……,Cm來(lái)進(jìn)行表示。預(yù)存一個(gè)未知的數(shù)據(jù)樣本X,也即是沒(méi)有類(lèi)標(biāo)號(hào),如果將其分配給類(lèi)Ci,也就一定會(huì)存在P(Ci/X)>P(Cj/X),1≤i≤m,1≤j≤m,j≠i。

根據(jù)此原理,對(duì)于所有類(lèi)P(X)都為常數(shù),因此P(Ci/X)作為最大化后驗(yàn)概率能夠轉(zhuǎn)換成為P(X/Ci)P(Ci),即最大化先驗(yàn)概率。假設(shè)諸多屬性和元組存在于訓(xùn)練數(shù)據(jù)集之中,核算P(X/Ci)開(kāi)銷(xiāo)的概率就非常高。因此,大部分情況下假設(shè)各個(gè)屬性的取值都是相互獨(dú)立的。在此情況下,就能夠從訓(xùn)練數(shù)據(jù)庫(kù)中獲得先驗(yàn)概率 P(X1/Ci),P(X2/Ci),P(X3/Ci),……P(Xn/Ci)。依據(jù)此種計(jì)算方式,針對(duì)特定的未知樣本X,可以先計(jì)算出X樣本屬于每一個(gè)類(lèi)別Ci的概率,隨后以概率最大的類(lèi)別作為該未知樣本的類(lèi)別。

為了識(shí)別該模型數(shù)據(jù)預(yù)測(cè)結(jié)果的準(zhǔn)確性,筆者以某醫(yī)院的醫(yī)療數(shù)據(jù)作為數(shù)據(jù)庫(kù)樣本來(lái)進(jìn)行數(shù)據(jù)挖掘的驗(yàn)證。首先通過(guò)DRUG I N系統(tǒng)來(lái)建立和學(xué)習(xí)該模型系統(tǒng),隨后采用DRUG4N的真實(shí)數(shù)據(jù)來(lái)評(píng)估ACMC建立的諸多模型樣式,最終通過(guò)該系統(tǒng)得到Bayes分類(lèi)算法所構(gòu)建的系統(tǒng)模型作為取得的最優(yōu)模型樣式。在此基礎(chǔ)上,筆者使用該模型來(lái)決定特定患者該使用什么樣類(lèi)型的藥品。

[1]韓家煒,孟小峰.W eb挖掘研究[J].計(jì)算機(jī)研究與發(fā)展,2011,(4):92-95.

[2]琚春華,郭飛鵬.基于支持向量機(jī)的分布數(shù)據(jù)挖掘模型DSVM[J].系統(tǒng)工程理論與實(shí)踐,2010,(10):29-32.

[3]胡文瑜,孫志輝.數(shù)據(jù)挖掘取樣方法研究[J].計(jì)算機(jī)研究與發(fā)展,2011,(1):43-46.

猜你喜歡
類(lèi)別分析法數(shù)據(jù)挖掘
異步機(jī)傳統(tǒng)分析法之困難及其克服
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
基于時(shí)間重疊分析法的同車(chē)倒卡逃費(fèi)探析
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
層次分析法在SWOT分析法中的應(yīng)用
服務(wù)類(lèi)別
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
AHP和SWOT分析法在規(guī)劃編制中的應(yīng)用
論類(lèi)別股東會(huì)
中醫(yī)類(lèi)別全科醫(yī)師培養(yǎng)模式的探討