陳昊,龍文佳
(1.湖北大學(xué)計(jì)算機(jī)與信息工程學(xué)院,湖北武漢430062;2.湖北大學(xué)知行學(xué)院,湖北武漢430011)
高斯云模型的霧化特性
陳昊1,龍文佳2
(1.湖北大學(xué)計(jì)算機(jī)與信息工程學(xué)院,湖北武漢430062;2.湖北大學(xué)知行學(xué)院,湖北武漢430011)
摘要:高斯云模型是通過運(yùn)用高斯分布和高斯隸屬函數(shù)的普適性,用3個(gè)相互獨(dú)立的參數(shù)共同表達(dá)一個(gè)定性概念的數(shù)字特征,反映概念的隨機(jī)性和模糊性.隨著超熵不斷增大,高斯云呈現(xiàn)出霧化狀態(tài),高斯云霧化后云滴表現(xiàn)出既離散又抱團(tuán)的特性,能很好地表示演化計(jì)算中的變異與遺傳.①
關(guān)鍵詞:云模型;超熵;高斯云;霧化特性
云模型利用賦予隨機(jī)樣本點(diǎn)以隨機(jī)確定度,來統(tǒng)一刻畫語言原子中的隨機(jī)性、模糊性及其關(guān)聯(lián)性.利用云模型,可以從概念表達(dá)的定性信息中獲得定量數(shù)據(jù)的范圍和分布規(guī)律,也可以把精確數(shù)值樣本轉(zhuǎn)換為3個(gè)數(shù)字特征描述的定性概念,從而實(shí)現(xiàn)了定性概念與定量數(shù)值之間的自然轉(zhuǎn)換.通過定義3個(gè)數(shù)字特征,設(shè)計(jì)不同的算法生成表示定性概念的云滴定量值及確定度,從而構(gòu)造不同類型的云模型[1-2].高斯云是云模型中最重要、應(yīng)用最廣泛的一種.
1.1高斯云定義在概率分布中,高斯(正態(tài))分布最基本、最重要,應(yīng)用也最廣泛.高斯(鐘形、正態(tài))隸屬函數(shù)是模糊理論中最常使用的隸屬函數(shù).利用云模型的3個(gè)數(shù)字特征,將原本固定的方差用一個(gè)隨機(jī)分布代替,并用這個(gè)隨機(jī)分布,結(jié)合隸屬函數(shù)來產(chǎn)生隨機(jī)確定度,是云的一種實(shí)現(xiàn)方法.高斯云模型是利用兩次高斯分布實(shí)現(xiàn)云滴的分布,同時(shí)利用高斯隸屬度函數(shù)實(shí)現(xiàn)隨機(jī)確定度[3].
定義1設(shè)U是一個(gè)精確數(shù)值表示的論域,C是U上的定性概念.若定量值x?U,且x是定性概念C的一次隨機(jī)實(shí)現(xiàn),x滿足以Ex為期望,En′2為方差的高斯分布,即:x~N(Ex,En′2);其中En′滿足以En為期望,He2為方差的高斯分布,即:En′~N(En,He2);定量值x對定性概念C的確定度為;則x在論域U上的分布稱高斯云.
從高斯云的定義可以發(fā)現(xiàn)高斯云具有以下幾個(gè)特點(diǎn):
1)高斯云的云滴分布不同于高斯分布.
在高斯分布中隨機(jī)變量每一次具體實(shí)現(xiàn)時(shí),方差都是固定值.而高斯云每一次具體實(shí)現(xiàn)方差都是一個(gè)隨機(jī)值,同時(shí)這個(gè)隨機(jī)值又滿足高斯分布,可以將高斯云理解為二次高斯分布.
高斯隸屬度函數(shù)為,其中參數(shù)a和b都是固定值,因此元素x和隸屬度y是一一對應(yīng)關(guān)系.高斯云的云滴確定度的計(jì)算方法與高斯隸屬函數(shù)相同,但是對應(yīng)的參數(shù)b不是固定值,而是一個(gè)滿足高斯分布的隨機(jī)變量.因此,高斯云的云滴元素x與其確定度y是一對多的對應(yīng)關(guān)系.
3)高斯云將定性概念的隨機(jī)性與模糊性有機(jī)集成在一起.
一方面,高斯云的云滴分布擴(kuò)展了高斯分布,同時(shí),高斯云的云滴確定度也擴(kuò)展了傳統(tǒng)的一型模糊集中高斯隸屬函數(shù).可以說高斯云既放松了人們在研究符合某個(gè)概率分布時(shí)的前提條件,也避免了人們在研究模糊現(xiàn)象時(shí)人為確定精確隸屬度的尷尬.
1.2高斯正向云發(fā)生器由云模型的3個(gè)數(shù)字特征(Ex,En,He)產(chǎn)生若干云滴,稱為正向云發(fā)生器(forward cloud generator),如圖1所示.正向云發(fā)生器是從概念表達(dá)的定性信息中獲取定量數(shù)據(jù)的范圍和分布情況.
圖1 一維正向云發(fā)生器
根據(jù)定義,給定高斯云的3個(gè)數(shù)字特征就能生成成千上萬個(gè)帶有確定度的云滴定量值,稱為高斯正向云發(fā)生器,具體實(shí)現(xiàn)算法如下:
算法1高斯正向云發(fā)生器算法
輸入:高斯云的3個(gè)數(shù)字特征(Ex,En,He)以及云滴數(shù)N .
輸出:N個(gè)云滴的定量值x以及代表概念的確定度μ(x) .
(1)生成以En為期望值、He為均方差的正態(tài)隨機(jī)數(shù)En′;
(2)生成以Ex為期望值、En′為均方差的正態(tài)隨機(jī)數(shù)x;
(4)(x,y)成為論域中1個(gè)云滴;
(5)重復(fù)步驟1~4直至產(chǎn)生N個(gè)云滴.
通過高斯正向云發(fā)生器能直觀反映出數(shù)字特征熵En和超熵He的變化對定量數(shù)據(jù)的范圍和分布情況的影響.通常熵越大,表示概念的可度量粒度越大,概念越宏觀,如圖2所示.
圖2 熵變化對云圖影響
超熵越大,云滴離散程度也越大,確定度的隨機(jī)性也越大,體現(xiàn)不同個(gè)體對概念認(rèn)知的差異也越大,如圖3所示.特別當(dāng)超熵為0時(shí),云滴定量值x將退化為嚴(yán)格高斯分布,x的確定度也退化為精確的高斯隸屬函數(shù).
圖3 超熵變化對云圖影響
高斯云將概念的隨機(jī)性和模糊性有機(jī)結(jié)合在一起,同時(shí)通過超熵He將表示定性概念的定量值x的分布推廣為泛高斯分布,x的確定度也不是恒定不變的,而是在某個(gè)期望值附近細(xì)微變化著,用形式化的方法直觀貼切的描述了人類對定性概念帶有不確定的認(rèn)知.
定性概念對應(yīng)的論域空間是數(shù)域空間,可以是一維、二維、甚至是多維的.在一維高斯云模型基礎(chǔ)上,很容易推廣到二維乃至多維高斯云,表示兩個(gè)或者多個(gè)定性概念組合而成的復(fù)雜定性概念.二維正向云發(fā)生器邏輯結(jié)構(gòu),如圖4所示,具體二維高斯正向云發(fā)生器具體實(shí)現(xiàn)算法如下:
算法2二維高斯正向云發(fā)生器算法
圖4 二維正向云發(fā)生器
輸入:二維高斯云的數(shù)字特征(Ex1,Ex2),(En1,En2),(He1,He2)及云滴數(shù)N .
輸出:N個(gè)云滴的定量值(x1,x2)以及代表概念的確定度y .
(1)生成以En1為期望值、He1為均方差的正態(tài)隨機(jī)數(shù)En′1;
(2)生成以Ex1為期望值、En′1為均方差的正態(tài)隨機(jī)數(shù)x1;
(3)生成以En2為期望值、He2為均方差的正態(tài)隨機(jī)數(shù)En′2;
圖5 二維正態(tài)云
(4)生成以Ex2為期望值、En′2為均方差的正態(tài)隨機(jī)數(shù)x2;
(6)(x1,x2,y)成為論域中1個(gè)云滴;
(7)重復(fù)步驟1~6直至產(chǎn)生N個(gè)云滴.
例如通常用“身高、體重”兩個(gè)指標(biāo)評價(jià)兒童身體發(fā)育狀況,以兒童的身高和體重的期望Ex,熵En和超熵He為數(shù)字特征,利用二維高斯正向云發(fā)生器算法就能夠得到兒童身體發(fā)育狀態(tài)云圖,如圖5所示.
如果定性概念能用高斯云的3個(gè)數(shù)字特征表示,一般而言,超熵He的大小會(huì)比熵En小一個(gè)數(shù)量級.但如果一個(gè)定性概念缺少共識(shí),反映其數(shù)字特征的超熵He會(huì)變得很大,從而導(dǎo)致表示定性概念的定量云滴表現(xiàn)更加離散,云的整體輪廓不再清晰可見,將超熵He取值較大時(shí)候稱為霧[4].
通過分析可知,當(dāng)高斯云的He 圖6 He 當(dāng)高斯云的He=En/3時(shí),邊界曲線y2的函數(shù)值趨于0,云滴的輪廓不再清晰,云滴分布出現(xiàn)霧化特征,如圖7所示. 當(dāng)高斯云的He>En/3時(shí),邊界曲線y2值的內(nèi)徑開始變寬,部分云滴落在邊界曲線y1和y2圍成的區(qū)域之外.隨著超熵He的繼續(xù)增大,越來越多的云滴超出了邊界曲線圍成的區(qū)域.最終變化趨勢為:Hlei→m∞y2→y1,即兩條邊界曲線趨向于重合,此時(shí)所有的云滴均脫離了兩條邊界曲線圍成的區(qū)域,整個(gè)變化過程如圖8所示. 可以將He=En/3稱作霧化點(diǎn),當(dāng)He>En/3時(shí)高斯云圖呈現(xiàn)出霧化狀態(tài).下面定量分析高斯云霧化狀態(tài)時(shí),云滴分布隨超熵He變化狀況. 圖7 He=En/3的云圖 圖8 He>En/3的霧化圖 定義2云心窗口:高斯云滴定量值最集中的論域[Ex-En, Ex+En],稱作大小為2En的云心論域. 定義3云滴論域:包含所有云滴定量值的論域范圍,計(jì)算公式為:Max{x1,x2,…xn}-Min{x1,x2,…xn}. 定義4云心密度:云心窗口內(nèi)的云滴數(shù)/2En . 定義5云平均密度:云滴總數(shù)/云滴論域. 表1 云滴分布隨超熵He變化狀況 假設(shè)Ex=0、En=3、He的大小從1逐漸遞增到10,對應(yīng)每個(gè)超熵通過高斯正向云發(fā)生器產(chǎn)生5 000個(gè)云滴,統(tǒng)計(jì)云滴論域、云心密度、云平均密度、云心密度/云平均密度等4項(xiàng)指標(biāo)大小.由于高斯正向云發(fā)生器每次產(chǎn)生的5 000個(gè)云滴具有隨機(jī)性,因此,對應(yīng)每個(gè)超熵重復(fù)試驗(yàn)100次, 每次統(tǒng)計(jì)4項(xiàng)指標(biāo)大小,最后再取平均值,如表1所示. 隨著超熵不斷增大,云滴論域范圍不斷變大,落入云心窗口中的云滴在不斷減少,因此云心密度在不斷減小.由于論域范圍變大,云平均密度在不斷減小.而且隨著超熵增大,云心部分的密度相對于云整體的平均密度,有升高趨勢.圖9直觀地表示了以上變化趨勢. 圖9 超熵增大云滴分布變化 高斯云霧化狀態(tài)下,對云滴分布情況的定量分析說明高斯云對定性概念的保持性,隨著超熵增大,概念的外延迅速增大,然而概念的內(nèi)涵仍舊保持在原始概念的中心附近.雖然霧化的過程中云滴整體上趨向離散,但能夠始終保持云心部分的優(yōu)勢,而且隨著He的擴(kuò)大云心部分的平均密度相對整體密度有升高的趨勢. 高斯分布廣泛存在于自然、社會(huì)和生產(chǎn)活動(dòng)中,實(shí)際中許多隨機(jī)現(xiàn)象都服從或近似服從高斯分布,因此高斯分布在理論和實(shí)際中應(yīng)用非常廣泛.但是如果決定隨機(jī)現(xiàn)象的各因素不是均勻的小,相互之間并不獨(dú)立就不符合高斯分布產(chǎn)生條件,不能構(gòu)成高斯分布或只能用高斯分布近似處理.用云模型描述此類隨機(jī)性,用數(shù)字特征值超熵He衡量偏離高斯分布的程度,將高斯分布擴(kuò)展為泛高斯分布.高斯云模型運(yùn)用高斯分布和高斯隸屬函數(shù)的普適性,放寬約束條件,用3個(gè)相互獨(dú)立的參數(shù)共同表達(dá)一個(gè)定性概念的數(shù)字特征,反映概念的隨機(jī)性和模糊性.高斯云霧化后云滴表現(xiàn)出既離散又抱團(tuán)的特性,能很好地表示演化計(jì)算中的變異與遺傳[5-6].云滴有抱團(tuán)特性,能良好地表示遺傳;云滴又有離散特性,能良好地表示變異.通過熵和超熵能方便地控制抱團(tuán)和離散的程度,體現(xiàn)了以種群為基本進(jìn)化單位的現(xiàn)代綜合進(jìn)化論思想. [1]李德毅.知識(shí)表示中的不確定性[J].中國工程科學(xué),2000,2(10):73-79. [2]李德毅,杜鹢.不確定性人工智能[M].北京:國防工業(yè)出版社,2005. [3]李德毅,劉常昱.論正態(tài)云模型的普適性[J].中國工程科學(xué),2004,6(8):28-33. [4]劉禹,李德毅,張光衛(wèi),等.云模型霧化特征及在進(jìn)化算法中的應(yīng)用[J].電子學(xué)報(bào),2009,37(8):1651-1658. [5]張光衛(wèi),何銳,劉禹等.基于云模型的進(jìn)化算法[J].計(jì)算機(jī)學(xué)報(bào),2008,31(7):1082-1091. [6]He R,Zhang G W,Niu J W. Clouding algorithm: a novel multi-population evolution model and its applying to global numerical optimization[C]. Third International Conference on Natural Computation,2007. (責(zé)任編輯趙燕) 投稿日期:2015-04-03 The atomization characteristics in Gauss cloud model CHEN Hao1,LONG Wenjia2 Abstract:Applying with the universality of the Gauss distribution and the Gauss membership function,used three distinct parameters to express digital characteristics of the qualitative concept the Gauss cloud model reflected the randomness and fuzziness of the concept. The Gauss cloud presented atomization state while the hyper entropy was increasing. The drops of the Gauss cloud after atomization showed the characteristics of both dispersion and aggregation,which could represent heredity and variation in evolutionary computation. Keywords:cloud model;hyper entropy;Gauss cloud;atomization characteristics 作者簡介:陳昊(1977-),男,博士,副教授,E-mail:6724768@qq.com 基金項(xiàng)目:湖北省教育廳科學(xué)技術(shù)研究重點(diǎn)項(xiàng)目(D20141005)資助 文章編號:1000-2375(2015)06-0560-05 中圖分類號:TP18 文獻(xiàn)標(biāo)志碼:A DOI:10.3969/j.issn.1000-2375.2015.06.0093 小結(jié)
4 參考文獻(xiàn)
(1. School of Computer Science and Information Engineering,Hubei University,Wuhan 430062,China;2. Zhixing College,Hubei University,Wuhan 430011,China)