周恩帆,馬 俊,周永杰,王欠欠,陳博行
(青海師范大學(xué) 物理與電子信息工程學(xué)院,西寧 810008)
隨著科學(xué)技術(shù)的發(fā)展,單一傳感器已經(jīng)不能滿足工業(yè)、軍事、醫(yī)藥及日常生活的需要.多傳感器數(shù)據(jù)融合是一個(gè)具有廣泛應(yīng)用前景的新興研究領(lǐng)域,其基本原理就像人的大腦在多個(gè)環(huán)境因素下綜合處理事件一樣,將各種傳感器得到的數(shù)據(jù)進(jìn)行多層次、多時(shí)空[1]的信息互補(bǔ)和優(yōu)化組合處理,最終產(chǎn)生對(duì)目標(biāo)環(huán)境的統(tǒng)一判斷結(jié)果.常見的數(shù)據(jù)融合有加權(quán)平均法、卡爾曼濾波法、貝葉斯估計(jì)法、Dempster-Shafer(D-S)證據(jù)理論、產(chǎn)生式規(guī)則等[2-5],但因?yàn)閭鞲衅骼匣蛿?shù)據(jù)采集過程中其它因數(shù)干擾所產(chǎn)生的不確定性,往往會(huì)造成數(shù)據(jù)的異常,處理這種不確定性最常用貝葉斯估計(jì)法和D-S證據(jù)理論.但貝葉斯估計(jì)法需要用到以前的先驗(yàn)概率,來得到新的概率,在很多情況下并不適用[6].D-S證據(jù)理論能在先驗(yàn)概率未知的情況下對(duì)不確定性問題進(jìn)行融合,利用基本概率賦值來表示不確定性問題的概率大小,該方法具有良好的融合效果[7].Yager[8]在D-S證據(jù)理論中引入了未知項(xiàng)m(x)來減小證據(jù)間的沖突問題.Murphy[9]提出了一種均值證據(jù)組合規(guī)則,在證據(jù)較多時(shí)能夠取得良好的融合效果,但沒有考慮到證據(jù)間的關(guān)聯(lián),證據(jù)較少時(shí)融合效果不理想.孫偉超[10]等針對(duì)目前區(qū)間證據(jù)合成方法存在融合失效的問題,分析了其產(chǎn)生的原因并提出新的區(qū)間證據(jù)組合方法.對(duì)證據(jù)源本身的特征進(jìn)行提取,依此對(duì)證據(jù)進(jìn)行修改,并提出兩種優(yōu)化方法用于區(qū)間信度結(jié)構(gòu)下的證據(jù)合成.周劍[11]等提出了一種基于區(qū)間證據(jù)理論的多傳感器數(shù)據(jù)融合水質(zhì)判斷方法,該方法能夠?qū)€(gè)別傳感器值異常的情況下判斷水質(zhì)等級(jí),但對(duì)于極端的數(shù)據(jù)不能很好的進(jìn)行融合,并且區(qū)間數(shù)計(jì)算量過于龐大.謝苗苗[12]等用箱線圖法和均值替代法檢測(cè)并修復(fù)異常數(shù)據(jù),然后利用自適應(yīng)加權(quán)融合算法實(shí)現(xiàn)同類傳感器數(shù)據(jù)一級(jí)融合,最后利用改進(jìn)D-S證據(jù)理論算法,實(shí)現(xiàn)全局融合決策.本文方法將從多傳感器得到的同類數(shù)據(jù)先進(jìn)行處理并融合,再將處理后的異類數(shù)據(jù)進(jìn)行D-S證據(jù)理論融合,最后按照決策標(biāo)準(zhǔn)判斷融合后的結(jié)果.針對(duì)目前證據(jù)合成方法存在融合過程沖突大的問題,分析了其產(chǎn)生的原因并提出新的證據(jù)組合方法.數(shù)值實(shí)驗(yàn)結(jié)果表明,提出的方法在面對(duì)沖突區(qū)間證據(jù)融合時(shí)得到了合理的結(jié)果.
證據(jù)理論是Dempster于1967年首先提出,由他的學(xué)生Shafer于1976年進(jìn)一步發(fā)展起來的一種不精確推理理論,也稱為Dempster/Shafer證據(jù)理論(D-S證據(jù)理論)[13].近年來,隨著多傳感器的大力發(fā)展,D-S證據(jù)理論引起了廣大學(xué)者的研究和關(guān)注.D-S證據(jù)理論是一種不精確的推理理論,最早應(yīng)用于專家系統(tǒng)中,能處理不確定信息,并且具有表達(dá)“不確定”和“不知道”的能力[14].
定義1.在D-S證據(jù)理論中,令Θ為辨識(shí)框架,Θ是一個(gè)非空的有限集合,Θ={θ1,θ2,…,θn},其中θ中元素兩兩互斥,θ1表示對(duì)事物或事件做出的一種決策或判斷.Θ中包含了關(guān)于θi所有可能的命題.對(duì)于Θ中的每個(gè)子集按照某個(gè)規(guī)則分配一個(gè)概率,稱為基本概率分配.基本概率分配函數(shù),也稱為mass函數(shù).
定義2.設(shè)Θ為識(shí)別框架,2Θ為Θ的所有子集構(gòu)成的集合,則m:→[0,1]為基本概率函數(shù),對(duì)于m的任何一個(gè)子集A,令m(Ai)∈[0,1],則滿足以下條件:
∑A?Θm(Ai)=1,m(?)=0
(1)
則稱m為Θ上的基本概率賦值函數(shù),m(A)稱為A的基本概率數(shù),表示對(duì)A的精確信任.
定義3.(D-S組合公式)設(shè)識(shí)別框架Θ下兩證據(jù)的基本概率賦值函數(shù)分別為m1和m2,則D-S組合公式為:
(2)
并且:
k=∑Ai∩Bj=?m1(Ai)m2(Bj)
(3)
其中C∈2Θ,Ai∈2Θ,Bj∈2Θ:i,j=1,2,…,N;k表示證據(jù)間的沖突系數(shù).
D-S證據(jù)理論在處理不確定性問題方面具有很大優(yōu)勢(shì),但當(dāng)幾個(gè)證據(jù)間沖突大的時(shí)候融合后常常會(huì)產(chǎn)生悖論[15].如何處理這種悖論是一個(gè)值得研究的重要問題,傳感器節(jié)點(diǎn)中因傳感器的老化和其他干擾因素,造成了采集到的數(shù)據(jù)偏差較大,甚至出現(xiàn)數(shù)據(jù)為零的情況,在對(duì)其進(jìn)行基本概率賦值(BPA)時(shí)就會(huì)造成mass函數(shù)值偏小或者為零的情況.例如表1是3個(gè)水質(zhì)傳感器M1,M2,M3采集到的水質(zhì)數(shù)據(jù),可以看到M1,M3的值明顯偏向于水質(zhì)等級(jí)Ⅰ,雖然M2傳感器更偏向于水質(zhì)等級(jí)Ⅲ,但是M2傳感器在水質(zhì)等級(jí)Ⅰ時(shí)的mass值為0,導(dǎo)致M1,M2,M3融合后對(duì)等級(jí)Ⅰ的支持度為0.這時(shí)M2就會(huì)對(duì)整個(gè)融合結(jié)果產(chǎn)生影響導(dǎo)致決策判斷水質(zhì)等級(jí)為Ⅲ.
表1 M1,M2,M3采集到的數(shù)據(jù)Table 1 Data collected by M1,M2,M3
如何處理D-S證據(jù)理論中出現(xiàn)的悖論問題[16],通常從兩個(gè)方面去解決:1)改變證據(jù)融合規(guī)則;2)改變證據(jù)的獲取從而改變mass值.本文從這兩個(gè)方面入手避免融合過程中產(chǎn)生的沖突問題,并降低構(gòu)造mass函數(shù)的復(fù)雜度,讓融合結(jié)果更加準(zhǔn)確.
本文先對(duì)各個(gè)傳感器節(jié)點(diǎn)采集到的同類數(shù)據(jù)進(jìn)行整理集合,再對(duì)同類數(shù)據(jù)進(jìn)行剔除異常數(shù)據(jù)并融合,最后再對(duì)異類數(shù)據(jù)進(jìn)行融合決策,最后得出決策結(jié)果.基于D-S證據(jù)理論的多傳感器信息融合決策模型,如圖1所示.
圖1 基于D-S證據(jù)理論的多傳感器數(shù)據(jù)融合決策模型Fig.1 Multi-sensor data fusion decision model based on D-S evidence theory
本文提出了一種基于歐式距離的同類數(shù)據(jù)異常值剔除方法,剔除多傳感器數(shù)據(jù)中出現(xiàn)的異常值.其基本思想是當(dāng)兩個(gè)同類數(shù)據(jù)間的距離越小,則代表相似程度越大,數(shù)據(jù)的真實(shí)性越大,反之亦然.通過得到兩兩數(shù)據(jù)間距離的和的平均值,并設(shè)定相應(yīng)的閾值來剔除異常值.
設(shè)傳感器個(gè)數(shù)為n,則采集到的同類數(shù)據(jù)Si={si|i=1,2,…,n},si和除si以外的其他同類數(shù)據(jù)sj的距離可以表示為:
(4)
由公式(4)可以計(jì)算出si和除si以外的其他同類數(shù)據(jù)sj的距離,并表示成一個(gè)距離矩陣:
(5)
距離Dd(dij)反映的是和其他數(shù)據(jù)的相似程度,Dd(dij)中元素值越小,其相似程度越大.
(6)
DSUP(si)=1-DG(si)i=1,2,…,n
(7)
同類數(shù)據(jù)的信任函數(shù)DSUP值反映數(shù)據(jù)的真實(shí)性,通常DSUP(si)值相差不大,并且DSUP(si)越大,數(shù)據(jù)越真實(shí).當(dāng)同類數(shù)據(jù)中出現(xiàn)異常值時(shí),DSUP(si)值會(huì)非常小,并且異常值間的DSUP(si)值會(huì)非常接近;反之正常值比較大,且集中.設(shè)置閾值δ=DSUP(m)×2%,DSUP(m)為DSUP(si)的中位數(shù).當(dāng)DSUP(m)-δ≤DSUP(si)≤DSUP(m)+δ時(shí),保留DSUP(si)值并剔除異常值得出正確的同類數(shù)據(jù).
(8)
(9)
利用公式(10)對(duì)信任函數(shù)MSUP(si)進(jìn)行歸一化處理作為D-S證據(jù)理論的mass函數(shù),如表4所示.最后利用D-S組合公式(2)和公式(3)進(jìn)行最后的融合,得出融合結(jié)果.
(10)
為了驗(yàn)證本文算法的有效性,設(shè)置了兩個(gè)仿真實(shí)驗(yàn).第1個(gè)為水質(zhì)判斷實(shí)驗(yàn),其數(shù)據(jù)為模擬真實(shí)數(shù)據(jù)所假設(shè)的數(shù)據(jù);第2個(gè)為大氣環(huán)境質(zhì)量判斷實(shí)驗(yàn),其數(shù)據(jù)為真氣網(wǎng)2020年10月1日至2020年10月31日的西寧城區(qū)24小時(shí)大氣數(shù)據(jù),傳感器為:PM2.5、PM10、SO2、CO、NO2空氣質(zhì)量傳感器,并在matlab R2018a軟件下實(shí)現(xiàn)算法驗(yàn)證.
假設(shè)把基于D-S證據(jù)理論的多傳感器數(shù)據(jù)融合決策模型應(yīng)用于水質(zhì)判斷中.我們需要采集氨氮(NH3-N)、總磷(TP)、溶解氧(DO)等水質(zhì)參數(shù),并設(shè)傳感器的精度分別為PNH3-N=0.005,PTP=0.01,PDO=0.05.令識(shí)別框架Ti={T1,T2,T3,…,Tn},本文按照《國家地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)(GB3838-2002)》[17]將水質(zhì)分為5個(gè)等級(jí),即θ={Ⅰ,Ⅱ,Ⅲ,Ⅳ,Ⅴ}.
表2 水質(zhì)參數(shù)特征表Table 2 Water quality parameter characteristics Table
表3為模擬平時(shí)的真實(shí)水質(zhì)數(shù)據(jù)所假設(shè)的45個(gè)同一時(shí)刻臨近水域采集的水質(zhì)數(shù)值,其中數(shù)據(jù)為0和同類數(shù)據(jù)中偏大、偏小的數(shù)據(jù)作為模擬多傳感器采集數(shù)據(jù)過程中出現(xiàn)的異常情況.先對(duì)同類數(shù)據(jù)進(jìn)行處理,將15個(gè)傳感器采集到的同類數(shù)據(jù)NH3-N含量放入矩陣為:
表3 水質(zhì)監(jiān)測(cè)數(shù)值Table 3 Water quality monitoring values
傳感器NH3-NTPDO10.730.165.620.750.145.830.730.175.940.750.145.850.740.168.763.50.155.970.720.165.980.740.406.090.750.185.8100.730.135.6110.710.125.81200.810130.740.135.7140.733.250150.740.165.8
根據(jù)式(4),可以得到15個(gè)傳感器采集到的數(shù)據(jù)si與其他數(shù)據(jù)sj間的距離d(si).
?
得出距離矩陣:
距離Dd(dij)反映的是和其他數(shù)據(jù)的相似程度,Dd(dij)值越小,其相似程度越大.根據(jù)距離矩陣給出每個(gè)數(shù)據(jù)的相似度:
求出一個(gè)數(shù)據(jù)的歸一化相似度DG(sij)后,可以獲得同類數(shù)據(jù)的信任函數(shù)DSUP(sij)
通過圖2可以看出15個(gè)傳感器在同一時(shí)刻臨近水域采集數(shù)據(jù)的一個(gè)信任程度,明顯看出第8和第12傳感器的數(shù)據(jù)整體嚴(yán)重偏離,表現(xiàn)為異常值.取DSUP(sij)中位數(shù)DSUP(m)=0.9454為準(zhǔn)值,設(shè)置閾值的2%為δ,δ=DSUP(m)*2%=0.0189,當(dāng)值DSUP(sij)滿足DSUP(m)-δ≤DSUP(sij)≤DSUP(m)+δ時(shí),保留數(shù)據(jù);反之,剔除DSUP(sij)中的異常值并保留正確的數(shù)據(jù).
圖2 信任函數(shù)Fig.2 Trust functions
表4 各水質(zhì)參數(shù)的mass函數(shù)值Table 4 Mass function values of water quality parameters
將得到的mass函數(shù)用D-S證據(jù)組合公式進(jìn)行融合,得到融合結(jié)果如表5所示.專家的水質(zhì)等級(jí)判斷結(jié)果為Ⅲ,可以看出直接用D-S證據(jù)理論進(jìn)行融合會(huì)因?yàn)闆_突的證據(jù)導(dǎo)致對(duì)水質(zhì)等級(jí)的結(jié)果識(shí)別始終為Ⅰ,且與其他等級(jí)間的區(qū)分度小.Mruphy[9]的平均方法雖然能正確識(shí)別出水質(zhì)等級(jí),但由于Mruphy沒有證據(jù)之間的相關(guān)性,籠統(tǒng)的將證據(jù)進(jìn)行平分來減小證據(jù)間的沖突,導(dǎo)致算法在兩個(gè)證據(jù)時(shí),將結(jié)果識(shí)別為Ⅱ,在收集了3個(gè)證據(jù)時(shí)才正確的得到等級(jí)Ⅲ.Zhou Jian[14]的權(quán)重法和本文的方法都能正確的識(shí)別水質(zhì)等級(jí),而本文的水質(zhì)等級(jí)3個(gè)證據(jù)融合決策結(jié)果0.7796比Zhou Jian的0.4837水質(zhì)融合結(jié)果區(qū)別度更高,融合結(jié)果更好.
表5 兩個(gè)水質(zhì)參數(shù)和3個(gè)水質(zhì)參數(shù)的融合結(jié)果Table 5 Fusion results of two water quality parameters and three water quality parameters
圖3是證據(jù)個(gè)數(shù)為2的融合結(jié)果,圖4是證據(jù)個(gè)數(shù)為3的融合結(jié)果,當(dāng)證據(jù)個(gè)數(shù)為2時(shí),Sun Quan[7]和Mruphy的算法融合結(jié)果都錯(cuò)誤的偏向Ⅱ級(jí),D-S證據(jù)理論因?yàn)椴荒芴幚頉_突識(shí)別結(jié)果直接為Ⅰ級(jí).當(dāng)有3個(gè)證據(jù)融合時(shí),只有D-S證據(jù)理論的識(shí)別結(jié)果不正確,其他幾個(gè)算法都正確的識(shí)別出了水質(zhì)等級(jí)Ⅲ,但本文的識(shí)別結(jié)果最好.從圖3和圖4看出本文的方法不僅能在證據(jù)較少時(shí)準(zhǔn)確的識(shí)別出結(jié)果而且識(shí)別出的值更高,更具有說服力.
圖3 2個(gè)證據(jù)的融合結(jié)果Fig.3 Fusion results of the two evidences
圖4 3個(gè)證據(jù)的融合結(jié)果Fig.4 Fusion results of the three evidences
把基于改進(jìn)的D-S證據(jù)理論多傳感器數(shù)據(jù)融合決策模型應(yīng)用于大氣環(huán)境質(zhì)量中.令識(shí)別框架Ti={T1,T2,T3,…Tn},按照《環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)》(GB3095-2012)將大氣環(huán)境質(zhì)量分為4個(gè)等級(jí),即θ={Ⅰ,Ⅱ,Ⅲ,Ⅳ}[17].
表6 大氣質(zhì)量特征值Table 6 Characteristic values of atmospheric mass
表7為155個(gè)31天西寧城區(qū)采集的大氣質(zhì)量參數(shù)數(shù)值,得到的大氣質(zhì)量參數(shù)PM2.5、PM10、SO2、CO、NO2數(shù)值作為1個(gè)傳感器系統(tǒng)5個(gè)傳感器采集的155個(gè)大氣質(zhì)量參數(shù)值,更改其中的5個(gè)數(shù)據(jù),使其值為0作為模擬多傳感器采集數(shù)據(jù)過程中出現(xiàn)的異常情況所修改的值,通過多傳感器數(shù)據(jù)融合算法最終得到一個(gè)大氣質(zhì)量數(shù)據(jù)31天的融合結(jié)果.
表7 31日大氣污染參數(shù)實(shí)時(shí)監(jiān)測(cè)數(shù)值Table 7 Real time monitoring values of air pollution parameters on July 31
日期NO2PM2.5PM10SO2CO2018/7/9332438161.72018/7/10321532151.12018/7/11232041191.12018/7/1227246701.32018/7/13302260261.32018/7/14341955211.42018/7/1527214081.12018/7/16352354131.32018/7/17461856002018/7/18412561221.52018/7/19281732131.42018/7/20301220110.92018/7/21231325130.82018/7/2201834180.82018/7/2329110100.82018/7/24361834171.12018/7/25382242161.22018/7/263927532512018/7/27343158151.22018/7/283232571412018/7/29232962110.92018/7/30251535110.92018/7/31281636121
把同類大氣PM2.5、PM10、SO2、CO、NO2數(shù)據(jù)代入公式(4)~公式(7),得出其中的NO2的DSUP信任函數(shù)結(jié)果如圖5所示.
圖5 NO2的DSUP信任函數(shù)Fig.5 DSUP trust function for NO2
表8 大氣參數(shù)的mass函數(shù)值Table 8 Mass function values of atmospheric parameters
最后將得到的mass函數(shù)利用D-S組合公式(2)和公式(3)進(jìn)行最后的融合,得出31天的大氣數(shù)據(jù)融合結(jié)果如表9所示.專家的大氣質(zhì)量等級(jí)判斷結(jié)果為Ⅰ,實(shí)際案例中本文方法與專家結(jié)果一致,且融合結(jié)果比較好.
表9 融合結(jié)果Table 9 Fusion results
本文的基于D-S證據(jù)理論的多傳感器數(shù)據(jù)融合算法通過水質(zhì)判斷和大氣質(zhì)量等級(jí)評(píng)價(jià)仿真分析都有較好的實(shí)驗(yàn)結(jié)果.
本文將D-S證據(jù)理論應(yīng)用于多傳感器數(shù)據(jù)融合,針對(duì)多傳感器網(wǎng)絡(luò)中采集的數(shù)據(jù)中存在的不確定性和D-S證據(jù)理論中產(chǎn)生的高沖突問題提出了一種新的多傳感器數(shù)據(jù)融合判斷方法.先進(jìn)行同類數(shù)據(jù)融合,提出了基于歐式距離的同種數(shù)據(jù)異常值剔除,再用融合后的同類數(shù)據(jù)求取信任度函數(shù),歸一化后得出無沖突的可靠mass函數(shù)值,按照D-S證據(jù)組合規(guī)則將得到的異類數(shù)據(jù)融合,最后根據(jù)決策規(guī)則,判斷多傳感器數(shù)據(jù)融合等級(jí).仿真分析表明,該方法具有良好的識(shí)別率和區(qū)分度并且能夠在個(gè)別傳感器數(shù)據(jù)異常的情況下,準(zhǔn)確的判斷出多傳感器數(shù)據(jù)融合等級(jí),并且具有應(yīng)用范圍廣等特點(diǎn).