謝勇來
【摘 要】D-S證據(jù)理論是一種非常有效的不確定性推理方法,其核心是D-S證據(jù)組合算法,為不確定信息的表達和合成提供了強有力的方法。本文對D-S組合算法及其幾種改進組合算法進行討論,分析了算法之間的內(nèi)在聯(lián)系,通過一個例子對比了運算結果,最后總結了這幾種算法的適用性。
【關鍵詞】D-S證據(jù)理論;證據(jù)組合算法;高沖突證據(jù)
0.概述
隨著火電廠信息化的不斷發(fā)展,目前電廠廣泛采用的分散控制系統(tǒng)DCS可以對整個機組實現(xiàn)實時的、全方位和多層次的監(jiān)控,這些關于設備和系統(tǒng)的豐富信息是進行故障診斷的寶貴資源。采用多源信息融合技術可以充分挖掘這些信息的內(nèi)涵,并有效全方位的綜合利用,從而提高對故障診斷的準確性、有效性和可靠性。因此多源信息融合理論在電力系統(tǒng)的故障診斷中具有較高的理論優(yōu)勢和應用前景。
D-S證據(jù)理論構造了不確定性模型的一般框架,建立了命題和集合之間的一一對應關系,把命題的不確定性問題轉(zhuǎn)化為集合的不確定問題。D-S證據(jù)理論是信息融合技術中極其有效的一種不確定性推理,其核心是D-S證據(jù)組合規(guī)則,為不確定信息的表達和合成提供了強有力的方法。本文對D-S組合算法及其改進組合算法進行討論、分析和對比。
1.基本概念[1,2]
設Θ為識別框架,則函數(shù)m:2Θ滿足:
m(Φ)=0
m(A)=1 (1)
則稱函數(shù)m為A的基本概率分配函數(shù)。m(A)稱為命題A的基本概率賦值,表示對命題A的精確信任度,表示了對A的直接支持。設Θ為一識別框架,m:2Θ→[0,1]是Θ上的基本概率分配函數(shù),定義函數(shù)Bel:2Θ→[0,1]
Bel(A)=m(B)(?A?Θ) (2)
則稱函數(shù)Bel為Θ上的信任函數(shù),稱Bel(A)為命題A的信任度。Bel(A)表示A的所有子集的可能性度量之和,即表示對A的總的信任程度。由此,基本概率賦值可以表示為:
m(A)=(-1)Bel(B)(?A?Θ) (3)
從這種意義上說,基本概率賦值和信任函數(shù)精確地傳遞同樣的信息。如果識別框架Θ的一個子集為A,且m(A)>0,則稱Θ的子集A為信任函數(shù)Bel的焦元。信任函數(shù)的全部焦元的并集成為信任函數(shù)的核(Core)。設Θ為一識別框架,定義函數(shù)Pl:2Θ→[0,1]。
pl(A)=m(B)=1-Bel() (4)
則稱函數(shù)Pl為Θ上的似真函數(shù),稱Pl(A)為命題A的似真度。Pl(A)表示不否定A的信任度,是所有與A相交的集合的信任分配之和。它與信任函數(shù)傳遞的是同樣的信息。當證據(jù)拒絕A時,Pl(A)=0;當沒有證據(jù)反對A時,Pl(A)=1。于是我們有
Bel(A)≤pl(A) (5)
2.幾種證據(jù)組合規(guī)則
2.1 D-S組合規(guī)則
D-S組合規(guī)則采用了稱作正交和的規(guī)則。
設Bel1和Bel2是同一識別框架Θ上的信任函數(shù),m1和m2分別是對應的基本概率分配函數(shù),焦元分別是A1,…,Ak和B1,…Br,則組合后新的基本概率分配函數(shù) , 定義為組合算子:
其中:
D-S組合規(guī)則為了保持基本概率分配函數(shù)的歸一性,在處理矛盾因子時,使兩個證據(jù)的公共焦元的基本概率賦值變?yōu)樵瓉淼?/(1-K),這意味著把局部的沖突放在全局中去分配。這里的“沖突”是指證據(jù)之間所支持命題的不一致性。
2.2 Yager組合規(guī)則
對于證據(jù)沖突的問題,Yager修改D-S組合規(guī)則,提出了一個與基本概率分配函數(shù)(Basic Probability Assignment Function,用m表示)不同的概念:基礎概率分配函數(shù)(Ground Probability Assignment Function,用q表示)。這兩者的主要區(qū)別有兩點:一是歸一化因子;二是m(Θ)的確定,它代表了由不知道所引起的不確定性。基礎概率分配q(A)的定義如下[3]:
其中B和C是冪集2Θ的子集,A是B和C的交集。注意這個公式里沒有歸一化因子,它是通過讓q(Φ)≥0,(這里的Φ表示的是空集),從而避免了歸一化的問題,而在D-S組合公式1中,有m(Φ)=0這個條件,為滿足bpa之和等于1,就必須進行歸一化。q(Φ)的計算式與D-S組合規(guī)則中的K的一樣,即:
在處理由不知道所引起的不確定性的基本概率賦值時,Yager把代表沖突的q(Φ)加到了q(Θ)上,從而轉(zhuǎn)化成Yager規(guī)則下的基本概率賦值mY(Θ)。這樣做的后果顯然是增大了不確定性。則Yager規(guī)則下的組合公式如下:
mY(Φ)=0 (9)
mY(A)=q(A) (10)
mY(Θ)=q(Θ)+ q(Φ) (11)
顯然,就可以得到在Yager證據(jù)組合規(guī)則下的函數(shù)q與在D-S證據(jù)組合規(guī)則下的函數(shù)m之間的關系:
m(Φ)=0 (12)
m(A)=q(A)/(1-q(Φ)),A≠Φ,Θ (13)
m(Θ)=q(Θ)/(1-q(Φ)) (14)
當q(Φ)=0時,也就是證據(jù)沒有沖突的情況下,Yager規(guī)則的結果與D-S規(guī)則的相等。
2.3 Inagaki組合規(guī)則
Inagaki利用Yager定義的基礎信任分配函數(shù)q的概念,定義一個連續(xù)型參數(shù)w(Continuous Parametrized Class),提出了一種統(tǒng)一的(Unified)組合規(guī)則,它包含了D-S和Yager兩種組合規(guī)則。Inagaki認為所有的組合規(guī)則可以表達為如下形式[4]:
m(C)=q(C)+f(C)q(Φ),C≠Φ (15)
f(C)≥0 (17)
其中:函數(shù)f可以解釋為q(Φ)的比例函數(shù)(Scaling Function)。參數(shù)w表示沖突,定義如下:
w=,?C≠Θ,Φ (18)
把公式18帶入到公式15可得:
m(C)=q(C)+wq(C)q(Φ)=q(C)(1+q(Φ))
同樣有:
m(D)=q(D)+wq(D)q(Φ)=q(D)(1+q(Φ))
兩式相比則有:
=,?C,D≠Θ,Φ (19)
上式表明m和q的比率是一致的,這也是Inagaki規(guī)則的限制條件,說明在Inagaki組合規(guī)則中,認為所有的信息源(包括傳感器和專家的知識、判斷等)都是可靠的,不存在關于其可靠性和可信度的判斷。如果對證據(jù)的可靠性進行判斷,就必然增加權重系數(shù),m和q的比率就會變化,等式19就不再成立。從公式15、16和18可知,Inagaki證據(jù)組合規(guī)則如下:
mw(C)=[1+wq(Φ)]q(C),C≠Φ,Θ (20)
mw(Θ)=[1+wq(Φ)]q(Θ)+[1+wq(Φ)-w]q(Φ) (21)
0≤w≤ (22)
在公式中參數(shù)w的確定是重要的一步,其取值將直接影響組合后的結果,但現(xiàn)有文獻中并沒有給出一個合理明確的方法,一般只能從專家經(jīng)驗或者仿真實驗中得到。在Inagaki組合規(guī)則中,當參數(shù)w取某些特定值時,就會相應轉(zhuǎn)換成D-S規(guī)則和Yager規(guī)則。當w=0時,公式22就轉(zhuǎn)化成公式12,公式23就轉(zhuǎn)化成公式13;當w=1/1-q(Φ)時,公式22就轉(zhuǎn)化成公式15,公式23就轉(zhuǎn)化成公式16。在公式22中,若參數(shù)w取其上限值時,即:wext=1/(1-q(Φ)-q(Θ)),就得到另一種組合規(guī)則,稱為極限規(guī)則(Extreme Rule or Extra Rule)。
mext(C)=q(C),for C≠Θ (23)
mext(Θ)=q(Θ) (24)
從公式23可知,(1-q(Φ))/(1-q(Φ)-q(Θ))可以理解為q(C)的比例因子,也就是說,最后的組合結果包含了沖突q(Φ)和由不知道所引起的不確定q(Θ),其作用是對證據(jù)進行了選擇。從以上可知,參數(shù)w如何選擇,其本質(zhì)就是如何處理沖突信息。Yager證據(jù)組合規(guī)則(w=0)把沖突那部分概率全部賦予了識別框架Θ,沒有改變證據(jù);D-S組合規(guī)則(w=1/1-q(Φ))忽略所有的沖突信息,采用歸一化方法把沖突信息按比例分配給了其它命題,因此對證據(jù)進行了較大程度的選擇;Inagaki極限組合規(guī)則(wext=1/1-q(Φ)-q(Θ)),既包含了沖突q(Φ)又包含了由不知道所引起的不確定q(Θ),對證據(jù)的選擇程度由q(Φ)和q(Θ)的大小決定。w值越大,對證據(jù)的選擇作用也越大。
3.不同組合規(guī)則的比較
本文采用具有高沖突證據(jù)的例子來比較各種組合規(guī)則的處理結果。
假定引起故障的原因有A、B和C三種情況,有兩組證據(jù),
m1(A)=0.9,m (B)=0.1,m1(C)=0.0;
m2(A)=0.0,m2(B)=0.1,m2(C)=0.9;
3.1 D-S組合規(guī)則
根據(jù)D-S組合規(guī)則可以得到如下表1的信任分配組合結果。
表1 D-S 組合規(guī)則的信任分配組合結果
根據(jù)公式6,由表1可知:
K=∑m(Φ)=0.09+0.81+0.09=0.99,
1-K=1-0.99=0.01;
m12(A)=m(A)/(1-K)=0;
m12(B)=m(B)/(1-K)=0.01/0.01=1;
m12(C)=m(C)/(1-K)=0;
m12(Θ)=m(Θ)/(1-K)=0;
例子中可以看出,兩個證據(jù)支持都很低的命題B經(jīng)過合成之后的支持度是1,而支持很高的命題A和C合成后的支持度卻都是0,即使再增加新的證據(jù),無論新證據(jù)對A和C的支持度是多少,組合后的支持度都為0,說明只要有一條證據(jù)否定某一命題,則組合后將始終被否定。產(chǎn)生這種有悖于常理結果的原因是D-S組合公式把空集m(Φ)的值舍去,并采用歸一化因子K來保證所有基本信任分配m之和等于1,實質(zhì)上是把沖突的那部分值按各自比重的不同分配給了其它命題,顯然只有命題B不為0,所以這部分值都分配給命題B。
3.2 Yager組合規(guī)則
利用Yager組合規(guī)則計算也會得到與D-S組合規(guī)則相同的中間運算結果矩陣,見表1,但是在沖突的處理上有明顯的不同,并且采用一個新的概念,就是基礎概率分配函數(shù)q。根據(jù)公式10可得:
q12(A)=m12(A)=0;
q12(B)=m12(B)=0.01;
q12(C)=m12(C)=0;
q12(Φ)=m12(Φ)=K=∑m(Φ)=0.99;
q12(Θ)=m12(Θ)=0
根據(jù)公式11、12和13則有:
mY(A)=0;mY(B)=0.01;mY(C)=0;
mY(Θ)=q12(Φ)+q12(Θ)=0.99
Yager組合規(guī)則雖然沒有采用歸一化因子K,但是把沖突那部分概率賦值分配給了未知命題mY(Θ),從而增大了未知命題的概率分配,因此其最終結果是降低了命題的信任度,提高了命題的似真度,而且也比原始證據(jù)對命題的判斷要小的多。當證據(jù)沖突越嚴重,似真度提高的越顯著。所以Yager組合規(guī)則的應用也有其局限性。
3.3 Inagaki組合規(guī)則
Inagaki規(guī)則也需要用到D-S規(guī)則的中間運算結果,并且使用了Yager組合規(guī)則中的基礎信任分配函數(shù)q的概念。從Inagaki規(guī)則的組合公式中可知,m12(B)的值跟參數(shù)w有直接的關系。當w=0時,Inagaki組合規(guī)則就變成了Yager證據(jù)組合規(guī)則。當w=1/1-q(Φ)=1/(1-0.99)=100時,Inagaki組合規(guī)則就變成了D-S證據(jù)組合規(guī)則,此時m12(B)=1。當w=wup=1/(1-q(Φ)-q(Θ)),就是Inagaki上限規(guī)則,但在本例中q(Θ)=0,此時就變成D-S規(guī)則。當w取不同值時,Inagaki規(guī)則是對D-S規(guī)則的擴展和延伸。當w的取值不斷增加時,對證據(jù)的選擇作用也不斷加強。
4.討論
總之,通過對D-S理論的證據(jù)組合規(guī)則的研究,我們發(fā)現(xiàn),在沖突很小或者沖突不相關時,并且所有的信息源被認為是可靠的情況下,D-S組合可以認為是合理的,Yager規(guī)則、Inagaki規(guī)則和D-S規(guī)則得出基本相似的結果。隨著相關的沖突水平增加,沖突不被忽略,則可以采用Yager規(guī)則和Inagaki組合規(guī)則。在選擇采用哪個組合運算時,首先要考慮的問題是沖突的程度和關聯(lián)度,以及如何用某一個組合規(guī)則處理這些問題。 [科]
【參考文獻】
[1]Shafer,G..A mathematical theory of evidence Princeton,NJ,Princeton University Press,1976.
[2]Dempster,A.P.Upper and lower probabilities induced by a multivalued mapping.The Annals of Statistics,1967,28:25-339.
[3]Yager, R.On the Dempster-Shafer Framework and New Combination Rules. Information Sciences 41,1987:93-137.
[4]Inagaki,T.Interdependence between Safety-Control Policy and Multiple-Sensor Schemes via Dempster-Shafer Theory.IEEE Transactions on Reliability 40(2),1991:182-188.