于 爽,王 欣,2?
(1.黑龍江大學自動化系,黑龍江哈爾濱 150080;2.黑龍江省信息融合估計與檢測重點實驗室,黑龍江哈爾濱 150080)
由于噪聲的干擾、傳感器的老化、信號在信道傳輸過程中的衰減以及外界環(huán)境的復雜性等,使得傳感器測量的信息具有強烈的不確定性,不確定性已成為信息的固有屬性.D-S(dempster-shafer)證據(jù)理論在處理不確定信息和未知信息方面采用了樂觀估計和悲觀估計作為區(qū)間估計的上下界,而不是傳統(tǒng)的點估計方法來處理數(shù)據(jù),而通過貝葉斯概率轉(zhuǎn)換,D-S證據(jù)理論又可以將區(qū)間估計轉(zhuǎn)化為點估計,因此,D-S證據(jù)理論已成為處理不確定性信息的有效方法之一,可以有效提高決策的準確性.當前,D-S證據(jù)理論在故障診斷[1]、模式識別[2]、目標決策[3]等多個領(lǐng)域得到廣泛應(yīng)用,在與不確定性相關(guān)的各種問題中,不確定性度量是至關(guān)重要的一步,它是定量研究信息不確定性的基礎(chǔ),可以用來解決沖突證據(jù)的組合問題[4].
為了解決D-S證據(jù)理論中不確定性度量問題,許多學者提出了不同的不確定性度量方法.具有代表性的兩種不確定性度量方法是聚合不確定度(aggregate uncertainty,AU)[5]和多義度(ambiguity measure,AM)[6],但是這兩種度量方法都是概率論中香農(nóng)熵的推廣,而不是在證據(jù)理論框架下的直接定義.也就是說這兩種方法是把D-S框架下的證據(jù)經(jīng)過概率轉(zhuǎn)換得到一定的概率,然后計算相應(yīng)的概率的香農(nóng)熵來間接描述證據(jù)的不確定性程度.這種轉(zhuǎn)化容易造成信息丟失,因此AU和AM存在對基本概率賦值(basic probability assignment,BPA)的變化不敏感等問題,這些問題的出現(xiàn)在一定程度上都與證據(jù)理論框架和概率論的框架之間的不一致性有關(guān).證據(jù)理論并不是概率理論的簡單推廣,證據(jù)理論框架以信任函數(shù)理論為基礎(chǔ),信任函數(shù)不滿足可列可加性[7],而可列可加性是概率論的公理化假設(shè).
因此,在D-S框架下直接度量證據(jù)不確定性已成為研究熱點.Yang等[8]提出了一種在D-S框架下總體不確定度(total uncertainty,TU)計算方法,然而該方法不滿足不變性,即當識別框架變化后,不確定性也隨之改變.Deng等[9]克服了Yang方法的局限性,提出了一種在D-S 證據(jù)理論框架下改進的總體不確定度(improved TU,iTU)度量方法.Li 等[10]提出了NTU(new total uncertainty measure)方法,該方法基于證據(jù)區(qū)間和最不確定區(qū)間之間的歐氏距離來度量總體的不確定性.Deng 等[11]基于海林格距離方法提出了DU(distance-based uncertainty)方法.上述幾種方法都是在D-S證據(jù)理論框架下定義的,避免了D-S框架和概率理論框架之間的轉(zhuǎn)換可能帶來的信息丟失問題,然而這些方法在某些情況下會出現(xiàn)對證據(jù)的焦元或焦元質(zhì)量變化不敏感的情況.
綜上可知,解決不確定性度量問題的關(guān)鍵是直接在D-S證據(jù)理論框架下定義度量方法.由文獻[8-11]所提方法的性質(zhì),可知一個好的度量方法應(yīng)滿足非負性、有界性、不變性、單調(diào)性、敏感性和低計算負擔等性質(zhì),依據(jù)這些性質(zhì)要求,本文首先提出了改進的歸一化投影方法(improved normalized projection,iNP),并基于該方法,在D-S證據(jù)理論框架下提出了一種新的投影不確定性(projective uncertainty,PU)度量方法來度量證據(jù)的不確定性.對于給定的證據(jù),本文使用每個單子集命題的信任函數(shù)和似然函數(shù)構(gòu)成的證據(jù)區(qū)間與最大不確定區(qū)間之間的iNP來度量證據(jù)的不確定性.由于不需要在D-S證據(jù)理論框架和概率理論框架之間切換,因此該方法可以避免傳統(tǒng)不確定性度量方法的局限性.最后基于PU方法給出了一種新的證據(jù)組合方法,通過目標決策仿真和Iris分類識別實例說明了該證據(jù)組合方法的有效性.
本文做了如下創(chuàng)新性工作:1)提出了新的改進的歸一化投影方法iNP,給出了該方法的數(shù)學性質(zhì);2)在D-S框架下,提出了基于iNP的證據(jù)不確定性度量方法PU,理論證明和仿真實驗說明了PU滿足非負性、有界性、不變性、單調(diào)性、不反直觀性、較高的敏感性和較低的計算負擔等性質(zhì),這些性質(zhì)保證了PU能夠有效對不確定性進行度量;3)提出了基于PU的證據(jù)組合方法,并通過數(shù)值實例和實際應(yīng)用,驗證了本文所提方法的有效性.
定義1(識別框架) 在證據(jù)理論中,一般用集合來表示命題,假設(shè)Θ表示一個互斥又可窮舉元素的集合,則稱此完備集合Θ為識別框架,即
由Θ的全部子集可構(gòu)成Θ的冪集,記作2Θ,即
其中?表示空集.
定義2(基本概率賦值(BPA)) 設(shè)Θ為識別框架,若函數(shù)m:2Θ →[0,1],滿足: ∑A?Θm(A)=1且m(?)=0,則稱m為識別框架Θ下的BPA,m(A)也稱為質(zhì)量函數(shù).對于?A ?2Θ,m(A)表示對命題A的支持度,若m(A)>0,稱A為Θ的一個焦元,所有焦元的并集稱為核.
定義3(證據(jù)區(qū)間) 設(shè)m為識別框架Θ下的BPA,則命題A的證據(jù)區(qū)間為
圖1 證據(jù)區(qū)間Fig.1 Evidence interval
定義4(Dempster組合規(guī)則) 設(shè)識別框架Θ下存在兩個BPAm1和m2,Ai和Bj分別為m1和m2的焦元,當k<1時,Dempster組合規(guī)則為
其中k為沖突因子,即
Dempster組合規(guī)則也稱為兩個證據(jù)m1和m2的正交和,當k=0時Dempster組合規(guī)則沒有意義.
由式(3)知,證據(jù)區(qū)間可以表征對命題的未知情況,而證據(jù)區(qū)間可以作為一個區(qū)間數(shù)來處理,因此不確定性度量可以視為是兩個區(qū)間數(shù)的相似性度量,下面介紹區(qū)間數(shù)的定義及其投影理論.
定義5(區(qū)間數(shù)) 區(qū)間數(shù)a可表示為
若a-=a+,則區(qū)間數(shù)退化為普通實數(shù).設(shè)b=[b-,b+],當且僅當a-=b-,a+=b+時,a=b.
定義6(3種投影方法) 設(shè)a和b為兩個區(qū)間數(shù),則單向投影ProjS(a|b)、雙向投影ProjB(a|b)[12]和歸一化投影ProjN(a|b)[13]分別定義為
3種投影的區(qū)別在于單向投影直接給出投影值的大小,投影大小并不能刻畫兩個區(qū)間數(shù)的接近程度,例如設(shè)區(qū)間數(shù)a=[2,4],b=[1,2],由式(10)計算得,這表明ProjS(b|b) 定義7(聚合不確定度(AU))[5]m為在識別框架Θ下的BPA,則m的聚合不確定度為 其中概率分布p(θ)(θ ∈Θ)滿足 定義8(多義度(AM))[6]m為在識別框架Θ下的BPA,則m的多義度為 其中BetPm(θ)為焦元θ的pignistic概率轉(zhuǎn)換[14],即 其中|·|表示命題·的基數(shù). 由上可知,AU和AM的不確定性度量實質(zhì)上是把BPA轉(zhuǎn)化為概率框架下的香農(nóng)熵對其不確定性進行度量.然而,證據(jù)理論與概率論的理論框架不同,證據(jù)理論中的信任函數(shù)即使退化為貝葉斯信任函數(shù)(BPA的所有焦元均為單子集)也無法滿足概率論中的公理化假設(shè): 可列可加性[7],因此通過BPA轉(zhuǎn)化為概率框架下的信息度量容易造成信息丟失(BPA的參數(shù)變化時,通過概率轉(zhuǎn)化后,仍然得到相同貝葉斯轉(zhuǎn)化結(jié)果的現(xiàn)象稱為信息丟失),這將在第4節(jié)的例3驗證. 定義9(改進的歸一化投影方法(iNP)) 設(shè)a和b為兩個區(qū)間數(shù)a=[a-,a+],b=[b-,b+],當a和b不為相等的實數(shù)時,改進的a向b上的歸一化投影為 ProjI(a|b)具有以下性質(zhì): 1) 0 ≤ProjI(a|b)≤1; 2) 當且僅當a或b退化為實數(shù)時ProjI(a|b)=0; 3) 當a趨近于b(即a-趨近于b-,a+趨近于b+)時,ProjI(a|b)趨近于1,特別的,當且僅當a=b/∈R,ProjI(a|b)=1. 證性質(zhì)1)-3)顯然成立.證畢. 不確定性度量是證據(jù)理論的基礎(chǔ),直接關(guān)系到傳感器的有效性判別,綜合文獻[8-11]所提方法的性質(zhì),可知一個好的度量方法應(yīng)滿足非負性、有界性、不變性、單調(diào)性、敏感性和低計算負擔等性質(zhì).需要指出的是,不確定性度量并不滿足傳統(tǒng)度量空間的公理化定義(非負性、對稱性和三角不等式),從而不是真正意義上的度量,而是一種廣義度量. 定義10(投影不確定度(PU)) 設(shè)識別框架Θ={θ1,θ2,···,θn},m為Θ下的BPA,為θi的證據(jù)區(qū)間,則基于iNP的m的不確定性廣義度量PU定義為 性質(zhì)1 非負有界性.0≤PUΘ(m)≤|Θ|=n.其中當且僅當m為貝葉斯信任函數(shù)時,PUΘ(m)=0,當且僅當m為空信任函數(shù)(m(Θ)=1)時,PUΘ(m)=n. 注1PU的定義中沒有采用歸一化是因為歸一化隱藏了系統(tǒng)的復雜性應(yīng)與識別框架的基數(shù)有關(guān)這一基本特征,即基數(shù)越大,系統(tǒng)越復雜,不確定性的上界應(yīng)該越大,如果采用了歸一化,則不確定度范圍限制在[0,1]中,這可能便于實際應(yīng)用,但它隱藏了系統(tǒng)復雜性的信息. 性質(zhì)2不變性.在開世界的條件下,設(shè)識別框架X=Θ+Θ1,其中Θ1={φ1,···,φk}是由新命題組成的集合,則PUX(m)=PUΘ(m). 證由于只是識別框架的擴張,m中的每個焦元的BPA沒有改變,因此 因此 單調(diào)性的物理含義是: 證據(jù)理論中的不確定性度量不能在未知區(qū)間大(不確定性增加)的情況下,不確定性總量減小. 這引出式(21)成立,由式(21)成立顯然引出式(22)成立.證畢. 性質(zhì)4PUΘ(m)具有較低的計算復雜度. 證由式(18)可知,PUΘ(m)的計算只需要簡單的內(nèi)積、模和初等的代數(shù)運算即可,其計算復雜度為O(n),因而具有較低的計算負擔.證畢. 性質(zhì)5PUΘ(m)對于m的焦元或焦元質(zhì)量的變化具有較高的敏感性. 性質(zhì)6不反直觀性.PUΘ(m)對于m的焦元或焦元質(zhì)量變化時,不確定性度量結(jié)果不反直觀. 性質(zhì)5-6需要舉例來說明. 例1假設(shè)識別框架Θ={A1,A2,···,A19},m為Θ下的BPA,m的各焦元質(zhì)量如下: 其中Xt={A1,A2,···,At},α在[0.05,1]之間變化,t=1,···,19,m的不確定性PU度量結(jié)果如圖2所示. 圖2 t和α變化時PU的值Fig.2 The values of PU when t and α change 從圖2可知,當t或α等于1時,此時m為貝葉斯信任函數(shù),不確定度始終為0,當t=19,α=0 時,即m(Θ)=1,此時m為空信任BPA,不確定性達到最大19.從圖2也可看到,圖像具有一定斜率,沒有出現(xiàn)(稍)平行于xy平面的部分,因此PU的度量結(jié)果對t和α的變化是敏感的,是符合直觀的,這驗證了性質(zhì)5-6. 由于傳感器自身的限制和環(huán)境噪聲等因素的干擾,使得傳感器測量的信息存在不同程度的不確定性.上節(jié)提出的PU方法可以對不確定性進行度量,在多傳感器證據(jù)組合中,不確定性大的傳感器證據(jù)權(quán)重小,反之亦然.基于這一思想提出基于PU的證據(jù)組合方法. 設(shè)在多傳感器目標決策系統(tǒng)中,有N個傳感器對某一目標進行識別,設(shè)識別框架為Θ={θ1,···,θn},N個傳感器獲得的BPA分別為m1,m2,···,mN,則基于PU的證據(jù)組合方法步驟如下: 步驟1由式(18)計算每個證據(jù)的不確定度PUΘ(mi),i=1,2,···,N. 步驟2確定每個證據(jù)的權(quán)重. 其中λ為調(diào)節(jié)系數(shù).由式(26)知PUΘ(mi)與權(quán)重ω(mi)成反比,即不確定性大的證據(jù)權(quán)重小. 步驟3加權(quán)原始證據(jù). 步驟4由式(7)對~m進行N-1次Dempster 融合. 其中mf是最終的融合結(jié)果. 步驟5做出決策. θtarget即為目標決策結(jié)果. 注2式(26)中調(diào)節(jié)系數(shù)λ的引入,是為了增加權(quán)重對不確定性的敏感程度,使得不確定性不同的傳感器的權(quán)重具有較大差異,從而提升目標決策精度.λ越大對不確定性的抑制作用越明顯.λ選的過小使得該方法過于保守,忽略了不同傳感器不確定性的差異,λ也不宜選的過大,即使是不確定大的傳感器也可能包含有用信息.λ的取值可根據(jù)實際情況進行選取,一般情況下λ可取5~10之間的數(shù). 在第3.2節(jié)PU的單調(diào)性證明中知,PU滿足單調(diào)性是因為iNP滿足單調(diào)性,下面通過例2驗證這一性質(zhì),并說明其他投影方法不滿足此性質(zhì). 例2設(shè)區(qū)間數(shù)a=[α,β],其中α和β為變化的值,α∈[0,0.99],β ∈[α,1],當α和β變化時單向投影ProjS(a|MUI)、雙向投影ProjB(a|MUI)、歸一化投影ProjN(a|MUI),以及本文提出的ProjI(a|MUI)的變化結(jié)果如圖3所示. 圖3 區(qū)間數(shù)的4種投影Fig.3 Four projections of interval numbers 由單調(diào)性知,對于區(qū)間[α,β],當固定α時,投影結(jié)果應(yīng)該隨著β的增加而增加,固定β時,投影結(jié)果應(yīng)該隨著α的增加而減小,而在圖3中,單向投影出現(xiàn)了當β等于1時,無論α為何值,投影值始終為1的情況,這顯然不滿足單調(diào)性,而雙向投影和歸一化投影,當固定α或β時,兩者的度量值都出現(xiàn)了先增加后減小的情況,這顯然也不滿足單調(diào)性.在4種方法中,只有本文提出的iNP滿足單調(diào)性,這說明了其有效性. 例3識別框架Θ={θ1,θ2},m為在Θ下的BPA,m的各焦元質(zhì)量如下: 其中α,β ∈[0,0.5].分別計算α和β取不同值時5種不確定性度量方法AU,AM,TU,iTU和PU的值.仿真結(jié)果如圖4所示. 圖4 5種不確定性度量方法比較Fig.4 Comparison of five uncertainty measurement methods 從圖4(a)可以看到,AU出現(xiàn)了信息丟失問題,這是因為,由式(30)引出 AU 計算證據(jù)的不確定度需要找到使香農(nóng)熵最大的概率均勻的分布,又因為α,β ∈[0,0.5],所以p(θ1)=p(θ2)=0.5滿足上述條件,因此不論α和β怎樣變化,BPA概率轉(zhuǎn)化結(jié)果始終不變,AU的值始終為1,AU出現(xiàn)了信息丟失的問題.AM同樣出現(xiàn)了信息丟失的問題,這是因為,當α=β時,BetPm(θ1)=BetPm(θ2)=1/2,AM始終為1,這顯然也是不對的.因為α=β=0不應(yīng)該和α=β=0.5 的不確定性相等,α=β=0時,m為空信任函數(shù),α=β=0.5時,m為貝葉斯信任函數(shù),未知區(qū)間長度為0.綜上AU和AM均出現(xiàn)了由于信息丟失造成的反直觀的情況. 在證據(jù)理論框架下,TU,iTU和PU的度量結(jié)果如圖4(b)-(d)所示.TU,iTU 和PU 均給出了α=β=0時,m的不確定性達到最大的結(jié)果.從式(30)可知,固定α,不確定度應(yīng)該隨著β的增加而減小,然而圖4(b)中TU方法給出了不確定性先增加后減小的變化結(jié)果,出現(xiàn)了反直觀的情況.iTU和PU的變化趨勢符合預期,但從圖4(c)中知當β從0.05向0變化時,iTU的度量結(jié)果過于平緩,變化不大,這說明了iTU存在對BPA變化不敏感的情況.從圖4(d)知PU的度量結(jié)果均符合預期,說明了PU的有效性. 4.3.1 雷達輻射源證據(jù)組合 例4 以文獻[15]中雷達輻射源識別為例,假設(shè)雷達識別數(shù)據(jù)庫中有3個雷達型號數(shù)據(jù)(T1,T2,T3),即識別框架Θ={T1,T2,T3},現(xiàn)有5 個傳感器m1,···,m5對某雷達輻射源進行識別,給出的BPA如下: 由第3.3節(jié)提出的證據(jù)組合方法計算得 1) 計算每個傳感器BPA的不確定度. 2) 計算每個傳感器BPA的權(quán)重. 其中取調(diào)節(jié)系數(shù)λ=10. 3) 加權(quán)原始證據(jù). 4) 融合加權(quán)后的證據(jù). 5) 決策目標結(jié)果為T1,支持度為0.9834. 同理,再分別基于2 個、3 個和4 個傳感器,重復上述步驟,最終結(jié)果并與Dempster,Liu[15],Murphy[16],Deng[17]等人的方法進行對比,結(jié)果如圖5和表1所示,從中可以看到使用Dempster組合規(guī)則對目標T1的支持度始終為0,這種反直觀結(jié)果被稱為一票否決悖論.Liu,Murphy,Deng和本文方法都得到正確的決策結(jié)果,相比于其他3種方法,PU在2-5個傳感器的情況下的融合結(jié)果均對目標T1有最高的支持度,這是因為m2的模糊度較高,它的權(quán)重較小,因此PU能夠快速識別出目標T1,這說明了其有效性. 表1 不同方法的證據(jù)組合結(jié)果Table 1 _Evidence combination results of different methods 圖5 不同方法對目標對T1的支持度Fig.5 Support degree for target T1 by different methods 在表1的仿真中,取調(diào)節(jié)系數(shù)λ=10.當λ取其他不同值時,5傳感器組合結(jié)果對T1的支持度如圖6所示,從中可知隨著λ的增加,對T1的支持度逐漸增大,這是因為減小了不確定性大的傳感器的權(quán)重,使得向T1結(jié)果收斂的更快.同時也看到,當λ>10之后,實驗結(jié)果的提高幅度變化不大,出現(xiàn)飽和現(xiàn)象,因此在表2的實驗中,取λ為10.同時從圖6也可知,即使取λ=1,對正確結(jié)果的識別率也能達到0.9501,其精度仍然高于Dempster,Liu,Murphy,Deng等人的方法. 表2 不同方法的融合結(jié)果Table 2 Fusion results of different methods 圖6 λ變化時T1的支持度Fig.6 Support degree for T1 with the change of λ 例5 以文獻[18]中5個傳感器S1,S2,···,S5對空中識別目標為例.設(shè)識別框架Θ={A,B,F},其中A表示民用客機,B表示轟炸機,F表示戰(zhàn)斗機,5個傳感器給出的BPA如下: 應(yīng)用本文提出的基于PU 的證據(jù)組合方法(取調(diào)節(jié)系數(shù)λ=5)并與其他方法(Dempster,Murphy[16],Chen[19],Yu[20]和Fei[21]提出的方法)進行比較,計算結(jié)果如表2所示,可以看到本文方法對正確結(jié)果{A}仍具有最高的支持精度,說明了本文方法有效性. 4.3.2 鳶尾花分類識別 例6在Iris數(shù)據(jù)集中,共包括3個種類的鳶尾花: Setosa鳶尾花(Se)、Versicolour鳶尾花(Ve)和Viginica 鳶尾花(Vi),因此識別框架為{Se,Ve,Vi}.每個種類的鳶尾花包含了50條樣本,共計150條.其中每條樣本含有花萼長度(sepal length,SL)、花萼寬度(sepal width,SW)、花瓣長度(petal length,PL)、花瓣寬度(petal width,PW)4種屬性.隨機從4種屬性中各取40個數(shù)據(jù)作為訓練集,每種屬性其余的數(shù)據(jù)作為測試集,現(xiàn)從Se測試集中隨機抽取一個樣本(5.3,3.5,1.3,0.2)作為測試樣本,對于該測試樣本,文獻[22]給出了4個屬性BPA的測試報告,如表3所示.問題是融合表3中4個屬性的BPA,判斷花的種類.為了驗證本文方法的有效性,使用AU[5],AM[6],TU[8],iTU[9],DU[11],以及本文PU方法分別計算表3中BPA的不確定度,取調(diào)節(jié)系數(shù)λ=5,計算結(jié)果如表4所示,再由式(27)-(29)可得融合結(jié)果如表5所示.由表4知,本文方法與其他方法大體一致,認為SW的屬性的不確定性較高,PL的不確定性較低.由表5知,所有方法都高度支持Se,均能有效識別出花的種類,但本文所提出的方法對物種Se的支持度最高,說明PU方法具有較好的敏感性,具有快速識別目標的能力. 表3 樣本的4個屬性的BPA報告Table 3 BPA reports for four attributes of the sample 表4 不同方法的不確定度Table 4 Uncertainty degrees of different methods 表5 不同方法的4種屬性組合結(jié)果Table 5 Combination results of different methods D-S證據(jù)理論BPA的不確定性度量有著重要的意義,它可以對傳感器測得的數(shù)據(jù)的不確定性程度進行量化分析.為了解決這一問題提出了新的改進的歸一化投影方法iNP,本文給出了其數(shù)學性質(zhì).然后,基于iNP提出了證據(jù)理論框架下,新的投影不確定性廣義度量方法PU,理論證明和實驗仿真驗證了PU滿足非負性、有界性、不變性、單調(diào)性、不反直觀性、較高的敏感性和較低的計算負擔等性質(zhì),這些性質(zhì)保證了PU能夠有效度量證據(jù)BPA的不確定性.最后給出了基于PU的證據(jù)組合方法.在仿真實例中,通過和其他文獻的對比分析,說明了本文所提方法的有效性.作為本文的擴展,下一步將研究證據(jù)理論框架下,復數(shù)BPA的不確定性度量.2.3 兩種概率框架下的不確定性度量方法
3 本文所提方法
3.1 改進的歸一化投影方法
3.2 不確定性度量方法PU及其性質(zhì)
3.3 基于PU方法的證據(jù)組合
4 仿真實例
4.1 iNP和其他投影方法的比較
4.2 PU和其他不確定性度量方法的比較
4.3 證據(jù)組合仿真實驗
5 結(jié)論