国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

正態(tài)云模型霧化性質(zhì)統(tǒng)計分析

2010-03-16 09:22
關(guān)鍵詞:正態(tài)論域正態(tài)分布

劉 禹

(北京航空航天大學(xué) 計算機(jī)學(xué)院,北京 100191)

李德毅

(中國電子系統(tǒng)工程研究所,北京 100039)

正態(tài)云模型霧化性質(zhì)統(tǒng)計分析

劉 禹

(北京航空航天大學(xué) 計算機(jī)學(xué)院,北京 100191)

李德毅

(中國電子系統(tǒng)工程研究所,北京 100039)

對于超熵較大情況下的正態(tài)云模型,說明了云模型霧化過程.通過統(tǒng)計分析云滴離散的整體趨勢,說明超熵增大過程中,云滴整體趨于離散.通過分析各論域區(qū)間內(nèi)云滴離散趨勢,說明靠近概念核心的云滴的離散速度相對緩慢.歸納云模型霧化性質(zhì):在超熵取值持續(xù)增大的過程中(He>En/3),正態(tài)云表示的概念的論域范圍持續(xù)增大,呈霧化狀態(tài),但靠近概念核心的論域區(qū)間內(nèi)的云滴不失數(shù)量優(yōu)勢.霧化性質(zhì)適用于建模偏離正態(tài)分布、缺乏共識的定量數(shù)據(jù),期望表示概念語義值核心,熵描述概念語義的離散程度,超熵表示各種語義的共識程度,擴(kuò)展了云模型知識表示的應(yīng)用范圍.

知識表示;不確定性;統(tǒng)計分析;云模型

知識表示一直是人工智能研究中的一個瓶頸,其難點在于知識中隱含有不確定性,即模糊性和隨機(jī)性.李德毅教授提出云模型[1],用一個統(tǒng)一的模型實現(xiàn)定性概念與定量描述之間的不確定轉(zhuǎn)換,已成功應(yīng)用于數(shù)據(jù)挖掘[2]、系統(tǒng)評估[3]等領(lǐng)域.傳統(tǒng)應(yīng)用中,超熵取值較熵小.在超熵變大的過程中,云滴分布會呈現(xiàn)明顯的離散趨勢,本文使用統(tǒng)計分析的方法,對云模型超熵變大過程中云滴分布規(guī)律進(jìn)行分析,并將其定義為正態(tài)云模型的第 4個數(shù)學(xué)性質(zhì).

1 云模型

云模型使用 3個數(shù)字特征:期望 Ex、熵 En和超熵 He來表征定性概念,它們反映了定性概念 C的整體特性[4].

期望 Ex:云滴在論域空間分布的期望,是最能夠代表定性概念的點,反映這個概念的云滴群的重心.

熵 En:定性概念的不確定性度量,由概念的隨機(jī)性和模糊性共同決定,反映了概念外延的離散程度和模糊程度.

超熵 He:超熵是熵的不確定性的度量,即熵的熵,反映了二階不確定性,是對熵反映的不確定性的再描述.

可以計算求出任意一個云滴屬于這個概念的隸屬度,但是該隸屬度不是一個確定的值,而是一個具有穩(wěn)定傾向的隨機(jī)數(shù)[4],正態(tài)云模型中,使用隸屬度 μ刻畫云滴對概念的貢獻(xiàn).

云模型的示意圖如圖 1所示.

圖1 云模型示意圖

由云模型的定義及正態(tài)云發(fā)生器算法可知,從統(tǒng)計學(xué)角度,正態(tài)云模型具有 3點數(shù)學(xué)性質(zhì)[4],3個數(shù)學(xué)特征說明:正態(tài)云模型 X的分布可以退化為正態(tài)分布,由于正態(tài)分布的普適性[4],應(yīng)用云表示不確定概念時,往往采用較小的超熵,此時云接近于正態(tài)分布;正態(tài)云模型確定度 Y的分布與云的數(shù)字特征無關(guān);正態(tài)云的幾何形狀特點明顯,存在云心曲線.然而,性質(zhì) 1和性質(zhì) 3均是在超熵He取值較小的情況下研究正態(tài)云模型特征.

2 正態(tài)云模型的霧化性質(zhì)

超熵的存在使正態(tài)云模型區(qū)別于正態(tài)分布,He取值為 0時,離散的云滴勾勒出正態(tài)分布的形態(tài);He取值較小時,云滴呈泛正態(tài)分布狀態(tài);He取值較大時,云滴所呈現(xiàn)的形狀明顯區(qū)別于正態(tài)分布:外圍云滴更加分散,核心云滴出現(xiàn)明顯的集中趨勢,云的期望曲線不再明顯,將超熵取值較大時的云稱之為“霧”.隨著 He的變化,正態(tài)云由一個極端(正態(tài)分布)到另一個極端(充分離散)的變化過程稱之為霧化.

2.1 霧化的形成過程

He>En/3時,部分云滴均逃離了兩曲線所夾范圍,見圖 2b.正態(tài)云的形態(tài)在 He=En/3時出現(xiàn)分界,可以將 En/3稱作正態(tài)云模型的霧化點,當(dāng)He<En/3,云滴呈現(xiàn)泛正態(tài)狀態(tài),He>En/3時,呈現(xiàn)霧化狀態(tài).

圖2 霧化的形成過程

2.2 云滴分布規(guī)律統(tǒng)計分析

研究霧化狀態(tài)下正態(tài)云模型的云滴分布規(guī)律,可以考察正態(tài)云模型 X的分布.正態(tài)云模型中,所有云滴 x構(gòu)成隨機(jī)變量 X.En'服從以 En為期望值,He2為方差的正態(tài)分布,X的概率密度函數(shù)沒有明確的解析形式[4],可采用統(tǒng)計分析方法研究正態(tài)云模型霧化狀態(tài)下云滴的分布規(guī)律.

2.3 云滴離散的整體趨勢

定義 2.1 云論域區(qū)間 Cd.云論域區(qū)間分割了正態(tài)云所表示概念的論域范圍,若記云 C(X)中所有云滴的集合為 Drops={x|x∈ C(X)},則論域區(qū)間 Cd為云滴在 X軸上的投影(投影點與Ex的距離不大于 d)所構(gòu)成的區(qū)域.對于二維正態(tài)云模型,如圖 3所示,論域區(qū)間可以看作以概念核心為中心,以變量 d為半徑的圓形.

圖3 二維正態(tài)云的論域區(qū)間

云圖中擁有無窮多個論域區(qū)間,論域區(qū)間的中心是云的期望,由于云滴的離散特性,不存在精確的最大論域區(qū)間(CT).在實驗過程中為了計算的可行性,對于一維正態(tài)云模型,可以近似地將最大論域區(qū)間定義為云滴最小值 min(Drops)到最大值 max(Drops)之間的直線距離.

定義 2.2 云密度.云密度用來表示投影在論域區(qū)間單位寬度或單位面積上的云滴數(shù),一維正態(tài)云記為 ρ=Δc/Δd,二維正態(tài)云記為 ρ=Δc/Δs.ρ代表云密度,反映某個論域區(qū)間上云滴的密集程度;Δd(Δs)表示單位寬度(面積);Δc代表在Δd(Δs)之上的云滴個數(shù).

由于云滴本身是離散的點,對一維正態(tài)云模型,統(tǒng)計 X的某一區(qū)間 A(A∈Cd)上的密度更有意義,可以近似地用投影在區(qū)間 A上的云滴個數(shù)與區(qū)間長度的比值來表示區(qū)間云密度,記為 ρA,而將云滴整體的平均密度記為 ρV.

實驗1

1)取數(shù)字特征 Ex=0,En=1,He=h,通過正態(tài)云發(fā)生器生成云滴(n=1000,h初值為 0);

2)計算云近似最大論域區(qū)間 CTi與云平均密度 ρVi,i初值為 0;

3)重復(fù)步驟 1)~2),i=i+1,5000次,得到正態(tài)云模型在 He為 h時的平均密度 ρVh;

4)變化參數(shù) h,h=h+0.01En,重復(fù)步驟1)~3),分別計算出 He在區(qū)間[0,10En]上的近似最大論域區(qū)間和云密度.

實驗 1結(jié)果表明,隨著超熵的變大,云最大論域區(qū)間寬度呈線性增長趨勢,而云團(tuán)的整體密度呈下降趨勢,下降過程中,隨 He變大,云密度下降趨勢趨于緩和.

2.4 典型論域區(qū)間內(nèi)云滴離散趨勢

本部分研究各個典型論域區(qū)間內(nèi)的云密度變化情況,論域區(qū)間的選取仍舊沿用已有區(qū)間范圍和命名方式[4]:骨干區(qū)間 A[Ex-0.67En,Ex+0.67En],基本區(qū)間 B[Ex-En,Ex+En],外圍區(qū)間 C[Ex-2En,Ex+2En],弱外圍區(qū)間 D[Ex-3En,Ex+3En].

實驗2

1)取數(shù)字特征 Ex=0,En=1,He=h,通過正態(tài)云發(fā)生器生成云滴(n=1000,h初值為 0);

2)計算云滴 X投影于骨干區(qū)間、基本區(qū)間、外圍區(qū)間、弱外圍區(qū)間內(nèi)的云滴數(shù),從而得到各區(qū)間內(nèi)的云密度 ρAi,ρBi,ρCi和 ρDi,i初始 0;

3)重復(fù)步驟 1)~2),5 000次,得到正態(tài)云模型在 He為 h時各區(qū)間密度的均值 ρA,ρB,ρC,ρD;

4)變化參數(shù) h,h=h+0.01En,重復(fù)步驟1)~3),分別計算出 He在區(qū)間[0,10En]上各區(qū)間的區(qū)間密度.

表 1給出了實驗 2的具有典型代表性的部分結(jié)果.

表 1 論域區(qū)間密度變化表

從表 1實驗結(jié)果中可以看出:當(dāng) He<En時,隨著 He的增大,骨干區(qū)間密度 ρA沒有減小反而增大.當(dāng) He>En時,ρA呈現(xiàn)出減小的趨勢,此時才與云滴整體密度的趨勢相符合.基本區(qū)間與骨干區(qū)間有類似表現(xiàn).外圍區(qū)間和弱外圍區(qū)間上的密度變化,在 He很小時達(dá)到峰值,在表 1中無法得到密度變大的過程,總體呈現(xiàn)出減小的趨勢,與云整體密度的變化趨勢相符合.結(jié)論如下:

1)考慮超熵變大整體過程,各區(qū)間內(nèi)的云滴都呈現(xiàn)離散趨勢,但是不同區(qū)間內(nèi)的云滴的離散速率不同;

2)越靠近概念核心(Ex),云滴密度越大,且在 He增大過程中,一直保持較外圍區(qū)間的密度優(yōu)勢;

3)隨著 He增大,骨干區(qū)間和基本區(qū)間內(nèi)的云滴會出現(xiàn)一個密度增大的過程,到達(dá)極大值后,呈下降狀態(tài).

在霧化過程中,云滴呈現(xiàn)抱團(tuán)特性,靠近概念核心區(qū)域內(nèi)的云滴密度明顯高于外圍區(qū)間的云滴密度.

設(shè)云 Cloud(Ex,En,He),包括 N個云滴,在 X軸的投影落在區(qū)間[Ex-δ,Ex+δ]范圍的云滴個數(shù)為 m.有

據(jù) 3δ規(guī)則[4],得

據(jù)正態(tài)云發(fā)生器算法,得

顯然,m與投影區(qū)間范圍 δ相關(guān),在使用云模型表示定性概念時,希望核心云滴數(shù)目最多,亦即取 δ=En,設(shè) He=kEn,此時

通過數(shù)據(jù)擬合可以得到,k=0.98時,m取最大值.所以,在霧化過程中,當(dāng) He=0.98En時[Ex-En,Ex+En]區(qū)間內(nèi)的核心云滴數(shù)量達(dá)到最大值.此時云模型適用于表示“難于形成共識的概念”:所謂“共識”,指的是觀察值存在明顯的多數(shù)核心;而“難于形成共識”是指在概念核心 Ex附近的區(qū)間之內(nèi),定量數(shù)據(jù)已經(jīng)不再呈明顯的階梯型分布,彼此的數(shù)量十分接近,難分伯仲.雖然數(shù)據(jù)的核心不能由一個確定的取值來表示,但可以使用一系列接近的數(shù)值來表示,故仍舊稱之為“概念”.極端情況下,當(dāng)樣本取值充分離散后,有限的定量數(shù)據(jù)已經(jīng)不能夠形成定性概念.

3 霧化性質(zhì)應(yīng)用舉例

已有的云模型應(yīng)用,大多采用較小的 He,霧化特征的提出,豐富了云模型在知識表示領(lǐng)域的應(yīng)用范圍.

3.1 霧化性質(zhì)表示控制知識

在基于云模型的進(jìn)化算法中,使用云模型的霧化性質(zhì),通過超熵可以控制期望附近云滴的比例和遠(yuǎn)離期望的云滴的比例,從而達(dá)到定性控制進(jìn)化方向的目的,而這種控制方法可以有效地保持基因(概念)的遺傳特性并體現(xiàn)變異特性,而不是片面地強(qiáng)調(diào)一方,使得進(jìn)化算法可以達(dá)到大范圍、高精度的執(zhí)行效果.實驗結(jié)果表明,應(yīng)用云模型的霧化性質(zhì)指導(dǎo)進(jìn)化過程,可得高精度進(jìn)化算法[5-6].

3.2 霧化性質(zhì)與定量-定性轉(zhuǎn)換

對于給定的定量數(shù)據(jù)集合,如果數(shù)據(jù)本身符合泛正態(tài)分布,使用逆向云發(fā)生器[4],可得到這些數(shù)據(jù)所代表的定性概念云描述.如果定量數(shù)據(jù)來源于隨機(jī)實驗結(jié)果,且數(shù)據(jù)量不夠大,即使客觀上符合正態(tài)分布,傳統(tǒng)的逆向云發(fā)生器算法不能有效地得到數(shù)據(jù)所表示概念的定性描述.基于云模型的分類算法[7]中,將云模型霧化性質(zhì)與逆向云發(fā)生器相結(jié)合,對缺乏共識的定量數(shù)據(jù)可以采用擴(kuò)大超熵的辦法進(jìn)行表示.霧化性質(zhì)的提出擴(kuò)展了云模型知識表示的范圍.

例如:采用 Iris數(shù)據(jù)集[8],圖 4中給出了花瓣長度數(shù)據(jù)的云表示.圖 4a表示 setosa類型的鸞尾花的花瓣長數(shù)據(jù),圖 4b表示 versicolor類型的鸞尾花的花瓣長數(shù)據(jù).由柱狀圖可看出,setosa的花瓣長度統(tǒng)計接近正態(tài),表示其分布接近于正態(tài)分布,可以使用云 Cloud(1.464,0.164,0.056)表示其花瓣長:花瓣長度分布在 1.464周圍,熵為0.164,且熵較為穩(wěn)定(He=0.056);針對 versicolor鸞尾花,其花瓣長度比較接近,[3.8,5]區(qū)間內(nèi)的花瓣長取值統(tǒng)計數(shù)量沒有明顯差異,樣本統(tǒng)計結(jié)果表示缺乏概念共識.此時可以使用Cloud(4.26,0.47,0.465)表示 versicolor的花瓣長,He取值較大且 He=0.98En,落在[4.26-0.47,4.26+0.47]區(qū)間內(nèi)云滴數(shù)最多,最大限度地保證了靠近概念核心的樣本數(shù)量,使用霧化性質(zhì)實現(xiàn)了對不同統(tǒng)計樣本的統(tǒng)一建模.

圖4 Iris數(shù)據(jù)集花瓣長度的云表示

4 結(jié) 論

本文使用統(tǒng)計學(xué)方法論述了正態(tài)云模型在超熵增大過程中的云滴分布特征,拓展了正態(tài)云模型的數(shù)學(xué)性質(zhì),可定義正態(tài)云模型的數(shù)學(xué)性質(zhì) 4:在超熵取值持續(xù)增大的過程中(He>En/3),正態(tài)云表示的概念的論域范圍持續(xù)增大,呈霧化狀態(tài),但靠近概念核心的論域區(qū)間內(nèi)的云滴不失數(shù)量優(yōu)勢.霧化狀態(tài)下的超熵反映了定量數(shù)據(jù)對定性概念的共識程度.正態(tài)云模型霧化性質(zhì)的提出,為云模型在知識表示與定性-定量轉(zhuǎn)換方面的應(yīng)用提供了新的思路和依據(jù).下一步研究工作可將霧化性質(zhì)應(yīng)用于其他領(lǐng)域,充分驗證其在知識表示領(lǐng)域的有效性.

References)

[1]李德毅,劉常昱,杜鹢,等.不確定性人工智能[J].軟件學(xué)報,2004,15(11):1-13 Li Deyi,Liu Changyu,Du Yi,et al.Artificial intelligence with uncertainty[J].Journal of Software,2004,15(11):1-13(in Chinese)

[2]Wang Shuliang,Li Deren,Shi Wenzhong,et al.Cloud modelbased spatial data mining[J].Geographical Information Science,2003,9(2):67-78

[3]呂輝軍,王曄,李德毅.逆向云在定性評價中的應(yīng)用[J].計算機(jī)學(xué)報,2003,26(8):1009-1014 LǜHuijun,Wang Ye,Li Deyi.The application of backward cloud in qualitative evaluation[J].Chinese Journal of Computers,2003,26(8):1009-1014(in Chinese)

[4]李德毅,杜鹢.不確定性人工智能[M].北京:國防工業(yè)出版社,2004 Li Deyi,Du Yi.A rtificial intelligencewith uncertainty[M].Beijing:National Defence Industry Press,2004(in Chinese)

[5]張光衛(wèi),李德毅,劉禹.基于正態(tài)云模型的進(jìn)化算法[J].計算機(jī)學(xué)報,2008,7(7):1082-1091 Zhang Guangwei,Li Deyi,Liu Yu.An evolutionary algorithm based on cloudmodel[J].Chinese Journal ofComputers,2008,7(7):1082-1091(in Chinese)

[6]張光衛(wèi),康建初,李鶴松,等.基于云模型的全局最優(yōu)化算法[J].北京航空航天大學(xué)學(xué)報,2007,33(4):486-490 Zhang Guangwei,Kang Jianchu,Li Hesong,et al.Cloud model based algorithm for global optimization of functions[J].Journal of Beijing University of Aeronautics and Astronautics,2007,33(4):486-490(in Chinese)

[7]Liu Yu,Chen Guisheng.Cloud model based classifier[C]//Luo Qi,Tan Honghua.2009 Internal Conference on Test and Measurement.Hong Kong:IEEE,2009:427-430

[8]Blake C L,Merz C J.UCI repository of machine learning databases[DB/OL].Irvine,CA:University of California,1998.http://www.ics.uci.edu/~mlearn/MLRepository.html

(編 輯:文麗芳)

Statistics on atomized feature of normal cloud model

Liu Yu

(School of Computer Science and Technology,Beijing University of Aeronautics and Astronautics,Beijing 100191,China)

LiDeyi

(China Institute of Electronics Engineering,Beijing 100039,China)

The cloud model atomization process was related to a larger hyper enctropy.Through statistical analysis of the overall trend of the cloud drops,the cloud drops dispersed over the course of hyper entropy increase.By analyzing the dispersion trend of cloud drops in each semantic ranges,it is indicated that the drops represent the core concept dispersed in a low speed.The atomization feature of the cloud model was summarized.The semantic range of the concept represented by the cloud model extended while the hyper entropy increased step by step.The cloud drops spread but the drops nearby the core semantic keep a high density.The atomization feature of the cloud model was used to model the data deviates from the normal distribution.A cloud with a large hyper entropy value represented the concept lack of consensus.Foreach parameter,the expectation stands for the core semantic value,the entropy represents the semantic range and the hyper entropy shows the degree of consensus of the different semantics ranges.The cloud model knowledge representation application range was extended.

knowledge representation;uncertainty;statistics;cloud model

TP 18

A

1001-5965(2010)11-1320-05

2009-10-21

國家基礎(chǔ)研究重點計劃資助項目(2007CB310803)

劉 禹(1980-),男,河北辛集人,博士生,liuyu8014@163.com.

猜你喜歡
正態(tài)論域正態(tài)分布
基于Simulink變論域算法仿真技術(shù)研究
關(guān)于n維正態(tài)分布線性函數(shù)服從正態(tài)分布的證明*
著艦指揮官非對稱變論域模糊引導(dǎo)技術(shù)
基于變論域模糊控制的Taylor逼近型內(nèi)模PID算法
利用二元對數(shù)正態(tài)豐度模型預(yù)測鈾資源總量
直覺正態(tài)模糊數(shù)Choquet 積分算子及其決策應(yīng)用
生活常態(tài)模式
雙論域上基于加權(quán)粒度的多粒度粗糙集*
抽樣分布的若干反例
正態(tài)分布及其應(yīng)用