王洪利
(西安交通大學 管理學院,西安710004)
現(xiàn)實中需要處理的復雜系統(tǒng)問題往往都是定性的、難以量化的,為了彌補定量方法的缺陷,錢學森先生提出了定性與定量相互融合的綜合集成方法及其理論體系,綜合集成方法的實質(zhì)就是將專家群體、知識體系、數(shù)據(jù)與信息體系和計算機體系結(jié)合起來,從定性到定量進行綜合集成,實現(xiàn)以人的思維、思維成果、人的知識、智慧為主以及各種情報、數(shù)據(jù)信息集成起來的大成智慧的綜合集成[1]。綜合集成法為處理難以量化的復雜系統(tǒng)問題提供了理論指導。管理科學的研究對象中包括大量的由無數(shù)個體組合而成的無限多樣性和復雜性的復雜系統(tǒng),采用建模仿真的手段來研究復雜系統(tǒng)內(nèi)在運行機制是復雜系統(tǒng)研究的最主要方法。定性仿真是以定性建模和定性推理為基礎(chǔ)的,定性建模理論研究如何建立不完備知識系統(tǒng)的模型,即定性模型。定性推理則是研究如何用這種定性知識模型進行形式化推理,把定性推理應(yīng)用于系統(tǒng)定性模型上,通過推理來產(chǎn)生和解釋系統(tǒng)的行為便是定性仿真。由于系統(tǒng)的復雜性和參數(shù)的難以量化,系統(tǒng)過于復雜和知識的不完備[2],復雜系統(tǒng)研究主要采用的是定性仿真。但復雜系統(tǒng)仿真的發(fā)展趨勢是采用定性定量相融合的仿真,也被稱為半定性半定量仿真,微觀上分為在定性仿真中使用定量信息的仿真和在定量仿真中使用定性信息的仿真兩種[3],復雜系統(tǒng)的特點決定其仿真應(yīng)以前一種為主。但在當前復雜系統(tǒng)的量性融合仿真中,仿真的可靠性不高,定性與定量相互脫節(jié),不能同時為系統(tǒng)建模和仿真利用。產(chǎn)生這種情況的主要原因在于:復雜系統(tǒng)仿真中,定量信息沒有進行有效的定性表示;定性信息和定量信息相互不能有效轉(zhuǎn)化。解決以上問題的關(guān)鍵就是從仿真系統(tǒng)中變量表示這個最根本的基石入手,引入更加有效的定量信息定性表達模型和定性信息與定量信息的互相轉(zhuǎn)化方法。并在此變量表達模型的基礎(chǔ)上,研究具有量性融合特征的半定性仿真的定性建模、定性推理的理論和方法。
已有的研究中,為了解決系統(tǒng)仿真中不確定變量的半定量化的問題,提出以下有代表性的不確定性變量的定量化方法:(1)基于區(qū)間數(shù)的方法[4];(2)模糊數(shù)方法[5];(3)概念灰數(shù)方法[6]。
參考和借鑒錢學森先生的綜合集成思想和方法,本文將在系統(tǒng)仿真中,引入擅長量性轉(zhuǎn)化的云模型作為復雜系統(tǒng)中不確定性變量的表示方法,對復雜系統(tǒng)仿真中不確定性變量的半定量化方法進行分析和研究。
云模型是由中國的著名學者李德毅院士1995年提出的一種定性表達與定量互相轉(zhuǎn)化的模型[7]。從其誕生至今在解決諸如世界著名難題三維倒立擺控制、知識發(fā)現(xiàn)與數(shù)據(jù)挖掘、評價與決策、信息與控制等諸多方面和領(lǐng)域取得了較大的成功應(yīng)用。
云和云滴[8]:設(shè)U是一個用數(shù)值表示的定量論域,C是U上的定性概念,若定量值x∈U是定性概念C的一次隨機實現(xiàn),x對C的確定度μ(x)∈[0,1]是有穩(wěn)定傾向的隨機數(shù):μ:U→[0,1] ?x∈Ux→μ(x),則x在論域U上的分布稱為云(Cloud),記為云C(X).每一個x稱為一個云滴。如果概念對應(yīng)的論域是n維空間,那么可以拓廣至n維云。
云模型所表達概念的整體特性可以用云的數(shù)字特征來反映。云用期望Ex(Expected value)、熵En(Entropy)和超熵He(Hyper entropy)這3個數(shù)字特征來整體表征一個概念,多維云模型的整體特征可由多組數(shù)字特征表示,期望Ex是云滴在論域空間分布的期望,是最能夠代表定性概念的點,或者說是這個概念量化的最典型樣本;熵En代表定性概念的可度量粒度,熵越大通常概念越宏觀,也是定性概念不確定性的度量,由概念的隨機性和模糊性共同決定。一方面En是定性概念隨機性的度量,反映了能夠代表這個定性概念的云滴的離散程度;另一方面又是定性概念亦此亦彼性的度量,反映了在論域空間可被概念接受的云滴的取值范圍;超熵He(Hyper entropy)是熵的不確定性度量,即熵的熵,由熵的隨機性和模糊性共同決定。用三個數(shù)字特征表示的定性概念的整體特征記做C(Ex,En,He)。
一維正態(tài)云模型[9][10]:ArForward(C(Ex,En,He))是一個把定性概念的整體特征變換為定量表示的映射π:C→∏,滿足以下條件:
(1)Θ={ti|Norm(En,He)的一次實現(xiàn)i=1..N}
(2)X={xi|xi為Norm(Ex,ti)的一次實現(xiàn)ti∈Θ,i=1..N}
其中,Norm(μ,δ)為期望為μ方差為δ的正態(tài)隨機變量,N為云滴的個數(shù)。
利用正態(tài)云,就可以把定性概念C(Ex,En,He)變換為數(shù)值表示的云滴集合,實現(xiàn)了概念空間到數(shù)值空間的轉(zhuǎn)換。一維正態(tài)云可以拓廣至n維正態(tài)云。其中正態(tài)云模型是最重要的一種云模型,李德毅院士已證明了正態(tài)云模型的普適性[9]。
首先,需要明確一下不確定性變量和定性變量的區(qū)別。定性變量是不用數(shù)值型來體現(xiàn)的一組變量。比如性別、宗教信仰、客戶滿意度等等。定性變量表示的并非真有數(shù)量上的變化,而只有性質(zhì)上的差異。這些量還可以分為兩種,一種是有序變量,它沒有數(shù)量關(guān)系,只有次序關(guān)系,如某教師的工作評價分為優(yōu)秀、良好、一般等;另一種是名義變量,這種變量既無等級關(guān)系,也無數(shù)量關(guān)系,如顏色(紅、黑)、性別(男、女)等。定量變量是可用具體數(shù)值來表示的變量,就是通常所說的連續(xù)量,如產(chǎn)量、庫存、現(xiàn)金、發(fā)表論文的數(shù)量等,它們是由測量或計數(shù)、統(tǒng)計所得到的量,這些變量具有數(shù)值特征,稱為定量變量。確定性變量是指根據(jù)現(xiàn)有的客觀條件和人們頭腦中的知識和經(jīng)驗可以確定其具體值(定性或定量值)的變量。不確定性變量是指由于系統(tǒng)的復雜性,根據(jù)現(xiàn)有的客觀條件和人們頭腦中的知識和經(jīng)驗無法確定其具體數(shù)值,但通過人們的觀察、判斷和分析可以判斷其大致范圍的變量。從以上可以看出,不確定性變量可能是定量變量,也可能是定性變量。不確定變量在我們處理復雜系統(tǒng)問題時是普遍存在的一種變量。不確定性變量不是我們對其一無所知的變量,也不是完全透徹清楚了解其具體取值的變量。除此之外,某些定性變量具有“與生俱來”客觀的不確定性存在。如對人按年齡劃分分為少年、青年、中年、老年等幾個階段,那么一個人16歲,屬于少年還是青年呢?人們總是回答屬于青年的可能性是多少,同時也沒有否定有屬于少年的可能性。這種定性劃分上中間臨界值就客觀上存在很大的不確定性。
對于以上描述的不確定性變量的取值的獲取,一直是各相關(guān)領(lǐng)域研究的關(guān)鍵和難點問題。在復雜系統(tǒng)的仿真中,本文對不確定性變量取值的獲取,采取在社會科學和管理科學中的德爾菲、調(diào)查、訪問、頭腦風暴法等科學實用的方法來獲取專家的判斷。
假設(shè)對象集合為O={o1,o2,...,on},對象O的定性變量 集合 為X={x1,x2,...,xn},專 家集 合為E={e1,e2,...,en}。以下分為幾種情況來研究群體領(lǐng)域?qū)<业呐袛嘀缔D(zhuǎn)化為半定量的云模型表示的方法:
(1)假如不同專家給出的判斷值是不同的準確值(不是區(qū)間)
表1為第k個專家ek對各對象變量的判斷值。其中表示第k個專家對j個對象的第i個變量的判斷值。
表1 第k個專家ek對各對象變量的判斷值
根據(jù)表1的數(shù)據(jù)首先針對單個對象oj的變量xi統(tǒng)計各取值的專家頻次(表2)。
表2 對象oj的變量xi的各取值頻次統(tǒng)計
表3 變量xi的各取值的專家個數(shù)的比例
表3中所給的pi就是該變量取vi的可能性,越多的專家選擇此選項,則表示不確定性變量取該值的可能性越大。將pi最大時的vi的取值記為vmax(pi)。
如果表2中vi的個數(shù)足夠多(即個數(shù)多到數(shù)據(jù)分布符合正態(tài)分布規(guī)律特征),首先將表2繪制成直方圖(橫坐標為vi,縱坐標為取該值的專家的個數(shù)),采用云模型理論中的方法,創(chuàng)建該不確定性變量取值的云模型。步驟如下:
①根據(jù)“復雜問題相信和依靠領(lǐng)域?qū)<摇迸c“少數(shù)服從多數(shù)”兩個基本準則,取群體專家判斷所對應(yīng)的云模型的數(shù)字特征中的期望Ex=vmax(pi)。如果存在兩個以上的相等的pi,則在一定的水平閾值δ內(nèi),選取其中最左邊和最右邊的兩個vi,作為梯形云的左期望和右期望(只有一個pi最大,可看成左期望等于右期望)。
②分別從左期望向左和右期望向右,將熵值從0以較小的步長逐漸增加,直到左右半正態(tài)云的函數(shù)值與直方圖值之差小于誤差容許閾值。將左右兩個半正態(tài)云的熵值記為梯形云的兩個熵值Enl、Enr。
可將以上兩步過程看成將整個數(shù)據(jù)集只變換成一個云模型的云變換過程。
④各根據(jù)下式計算左右半正態(tài)云模型的超熵:
如果表2中vi取值的數(shù)量不是足夠多,但多于兩個,為了最好的擬合數(shù)據(jù)可使用最小二乘法,計算云的數(shù)字特征。如果表2中vi取值的數(shù)量少到只有兩個。則可以采用幾何云的方法來計算云的數(shù)字特征[10]。
(2)考慮到大多數(shù)專家對某個定性變量量化賦值可能許多不確定性,而且還涉及到個人判斷因素,通常很難甚至不能確定地說出是多少,但總能說出“大約是多少”或“在多少到多少之間”,即給出不確定性變量量化的區(qū)間值。為此作如下定義:
定義1 設(shè)區(qū)間有兩個區(qū)間[a,b],[c,d],如果a<c,b<d,則稱區(qū)間[a,b]<[c,d]。如果a<c,則稱區(qū)間[a,b]“左小于”區(qū)間[c,d]。如果d>b,則稱區(qū)間[c,d]“右大于”區(qū)間[a,b]。
定義2 如果存在一個實數(shù)點x∈[a,b],則稱x“點包含于”區(qū)間[a,b]。
表4 序列中點包含vi的區(qū)間個數(shù)
表4 序列中點包含vi的區(qū)間個數(shù)
取值vi序列中點包含vi的區(qū)間個數(shù)q′i v1 vk v2 q′1 q′2……q′k
表5 序列中點包含vi的區(qū)間個數(shù)占全體包含總數(shù)的比例
首先將表4繪制成直方圖(橫坐標為vi,縱坐標為序列中點包含vi的區(qū)間個數(shù)),采用云模型理論中的方法,創(chuàng)建該不確定性變量取值的云模型。步驟如下:
①根據(jù)表5取群體專家判斷所對應(yīng)的云模型的數(shù)字特征中的期望。如果存在兩個以上的相等的,則在一定的水平閾值δ內(nèi),選取其中最左邊和最右邊的兩個vi,作為梯形云的左期望和右期望(只有一個最大,可看成左期望等于右期望)。
②分別從左期望向左和右期望向右,將熵值從0以較小的步長逐漸增加,直到左右半正態(tài)云的函數(shù)值與直方圖值之差小于誤差容許閾值。將左右兩個半正態(tài)云的熵值記為梯形云的兩個熵值Enl、Enr。
可將以上兩步過程看成將整個數(shù)據(jù)集只變換成一個云模型的云變換過程。
④各根據(jù)下式計算左右半正態(tài)云模型的超熵:
本文提出了面向復雜系統(tǒng)定性仿真,從理論和方法上提出了一種基于云模型的不確定性變量的半定量化方法。該方法將充分發(fā)揮云模型在定性變量半定量化表示、量性融合與轉(zhuǎn)化方面的優(yōu)勢,為復雜系統(tǒng)中不確定性變量的半定量化提供一種可供借鑒的方法,將可能促進定性與定量仿真的進一步融合。進一步的研究工作包括在應(yīng)用中驗證本文所提出的方法等。
[1]顧基發(fā),王浣塵,唐錫晉.綜合集成方法體系與系統(tǒng)學研究[M].北京:科學出版社,2007,(1).
[2]胡斌,肖人彬.復雜系統(tǒng)的定性仿真[J].系統(tǒng)仿真技術(shù),2006,2(1).
[3]陳宗海,段家慶,桂旺盛.智能模擬之定性定量仿真的發(fā)展[J].自動化博覽,2005,(s1).
[4]Benjamin Kuipers,Daniel Berleant.Using Incomplete Quantitative Knowledge in Qualitative Reasoning[C].AAAI Press.The Seventh Conference on Artificial Intelligent,1988.
[5]Qiang Shen,Roy Leitch.Extending Qualitative Simulation by the Use of Fuzzy Sets[J].IEEE Transaction on Systems,Man,and Cybernetics,1992,22(2).
[6]黃元亮.灰色定性仿真基礎(chǔ)研究[D].中國科學技術(shù)大學,博士學位論文,2004.
[7]李德毅,孟海軍,史雪梅.隸屬云和隸屬云發(fā)生器[J].計算機研究和發(fā)展,1995,32(6).
[8]邸凱昌.空間數(shù)據(jù)發(fā)掘與知識發(fā)現(xiàn)[M].武漢:武漢大學出版社,2001.
[9]李德毅,劉常昱.論正態(tài)云模型的普適性[J].中國工程科學,2004,6(8).
[10]張勇,趙東寧,李德毅.相似云及其度量分析方法[J].信息與控制,2004,33(2).