(1. 山東科技大學(xué) 測(cè)繪科學(xué)與工程學(xué)院,山東 青島 266590;2. 齊魯工業(yè)大學(xué)(山東省科學(xué)院) 海洋儀器儀表研究所,山東 青島 266061;3. 自然資源部 第一海洋研究所,山東 青島 266061)
海水溶解氧是維持海洋生物生存的重要物質(zhì),是評(píng)價(jià)水體受污染情況的重要指標(biāo)??焖贉?zhǔn)確、長(zhǎng)期連續(xù)地監(jiān)測(cè)水體溶解氧濃度對(duì)于海洋環(huán)境保護(hù)、水質(zhì)生態(tài)危機(jī)預(yù)報(bào)預(yù)警、海岸帶綜合修復(fù)狀況評(píng)價(jià)以及科學(xué)指導(dǎo)水產(chǎn)養(yǎng)殖都具有重要意義[1]。現(xiàn)有的基于熒光猝滅原理的光學(xué)溶解氧傳感器,尤其是國(guó)產(chǎn)傳感器存在連續(xù)工作穩(wěn)定性可靠性差、易污染、易生物附著、測(cè)量數(shù)據(jù)易漂移等問(wèn)題[1]。究其原因,在于不論何種測(cè)控應(yīng)用場(chǎng)景,依賴各類傳感器測(cè)量獲得的結(jié)果均存在一定程度的數(shù)據(jù)不確定性。這種不確定性來(lái)源于操作誤差、儀器設(shè)備精確度、傳輸干擾或數(shù)據(jù)處理誤差等因素,因此必須對(duì)測(cè)控系統(tǒng)的傳感器輸出采取必要處理,確保數(shù)據(jù)有效性。
現(xiàn)階段,各類測(cè)控場(chǎng)景應(yīng)用最多的方法是信息融合,也稱數(shù)據(jù)融合。其主要思想是以多種渠道或多組測(cè)量獲取的數(shù)據(jù)全體為依據(jù),采用一定的算法邏輯,開展數(shù)據(jù)篩選、提前和整合,獲得的融合后數(shù)據(jù)比原始數(shù)據(jù)更加真實(shí)、可信。針對(duì)這類問(wèn)題,文獻(xiàn)[2-5]進(jìn)行了多傳感器測(cè)量數(shù)據(jù)融合的相關(guān)探索和研究。然而在各類工控領(lǐng)域,獨(dú)立傳感器測(cè)量或多傳感器獨(dú)立分布、組網(wǎng)測(cè)量的方式仍在被廣泛使用,而且對(duì)這類獨(dú)立使用的傳感器測(cè)量數(shù)據(jù)的不確定性剔除和融合處理方面的研究仍較少[6-8]。最常用的算術(shù)平均法,計(jì)算量少、速度快,但是對(duì)所有樣本采用同樣權(quán)值進(jìn)行運(yùn)算,融合結(jié)果易受到各種不確定性因素的影響。文獻(xiàn)[6]設(shè)計(jì)了一種基于統(tǒng)計(jì)加權(quán)的融合算法,依據(jù)測(cè)量結(jié)果偏離融合結(jié)果的程度賦予不同權(quán)值,能在一定程度上削弱主觀因素對(duì)融合值的影響,但存在迭代計(jì)算量大、收斂速度慢的缺陷。文獻(xiàn)[7]介紹了一種基于最大熵的測(cè)量結(jié)果估計(jì)方法,單選用樣本概率作為數(shù)據(jù)融合權(quán)系數(shù),難以削弱融合結(jié)果對(duì)不確定性因素的敏感程度。文獻(xiàn)[8]提出一種改進(jìn)的分批估計(jì)融合算法,但算法的應(yīng)用必須以傳感器測(cè)量值樣本符合正態(tài)分布特性為前提,存在明顯局限性。因此,研究單傳感器測(cè)量系統(tǒng)數(shù)據(jù)融合方法來(lái)提高測(cè)量數(shù)據(jù)準(zhǔn)確性和可靠性,仍具有十分重要的意義。
本研究在自主研制的HJY1-1型光學(xué)溶解氧傳感器的基礎(chǔ)上[9],從Shannon提出的信息熵概念[10-13]出發(fā),針對(duì)該型溶解氧傳感器標(biāo)定數(shù)據(jù)融合問(wèn)題,提出一種基于信息熵的單傳感器數(shù)據(jù)融合處理方法,力圖解決上述算法在單傳感器測(cè)控系統(tǒng)適用性與測(cè)量數(shù)據(jù)分布局限性方面的不足。在此基礎(chǔ)上,結(jié)合光學(xué)溶解氧傳感器標(biāo)定實(shí)驗(yàn)測(cè)量數(shù)據(jù),對(duì)方法有效性作出評(píng)估。
本方法主要思想是:首先利用最大熵方法(maximum entropy method,MEM)估計(jì)獲得離散傳感器數(shù)據(jù)的概率分布[13],然后根據(jù)求得的標(biāo)定實(shí)驗(yàn)測(cè)量的不確定度確定置信區(qū)間,依托該置信區(qū)間,進(jìn)行粗差辨別和剔除[14-17]。最后,針對(duì)有效標(biāo)定數(shù)據(jù),計(jì)算樣本自信息量與信息比率,根據(jù)定義的融合權(quán)系數(shù)完成數(shù)據(jù)融合處理,得到最終的融合結(jié)果。該方法步驟如流程圖1所示。
最大熵方法是指在僅能獲知局部信息的條件下對(duì)開展系統(tǒng)狀態(tài)估計(jì)時(shí), 所選擇的合理狀態(tài)應(yīng)為信息熵值最大且符合約束條件的那組, 是現(xiàn)有條件下能做出的唯一公正的選擇, 所有選擇的其他狀態(tài)都代表改變了原有假設(shè)或添加了其他約束,無(wú)法做到不偏不倚[14]。因此,對(duì)于單傳感器測(cè)量控制系統(tǒng)而言,如果條件只允許獲得傳感器測(cè)量值樣本數(shù)據(jù),而不能夠根據(jù)已有條件獲得該獨(dú)立傳感器輸出測(cè)量值的概率分布的,就能夠利用該最大熵方法,獲得該獨(dú)立傳感器測(cè)量輸出值最公平的概率分布情況。
對(duì)于光學(xué)溶解氧傳感器標(biāo)定實(shí)驗(yàn),假設(shè)每組濃度梯度處,水體溶解氧含量穩(wěn)定后,待標(biāo)定傳感器對(duì)溶解氧濃度參數(shù)進(jìn)行k次獨(dú)立重復(fù)測(cè)量,獲得的樣本數(shù)據(jù)表示為m1,m2,…,mk。由于實(shí)際標(biāo)定實(shí)驗(yàn)中,對(duì)每組溶解氧濃度梯度處的測(cè)量為有限次,因此,獲得的測(cè)量列是一列離散值。由Shannon信息熵定義,計(jì)算測(cè)量列最大離散熵來(lái)估計(jì)樣本數(shù)據(jù)的概率分布形式。
離散隨機(jī)變量M的最大離散熵為:
(1)
其中,P(mi)為每組溶解氧濃度梯度處的測(cè)量數(shù)據(jù)樣本的概率,其滿足約束條件為:
(2)
其中,〈fn(mi)〉為若干函數(shù)fn(mi)的期望值,N為期望函數(shù)的個(gè)數(shù)。
運(yùn)用拉格朗日乘數(shù)法可計(jì)算該概率分布及對(duì)應(yīng)的最大熵,計(jì)算公式如式(3)、(4)所示。
(3)
(4)
其中,λ0和λn為引入的相應(yīng)拉格朗日乘數(shù),Hmax為所求的最大離散熵。
對(duì)于光學(xué)溶解氧傳感器標(biāo)定實(shí)驗(yàn)這類獨(dú)立傳感器重復(fù)測(cè)量的情形,在獲取溶解氧傳感器測(cè)量示值作為樣本點(diǎn)的基礎(chǔ)上,依據(jù)離散標(biāo)定數(shù)據(jù)列的方差與數(shù)學(xué)期望,構(gòu)造該標(biāo)定實(shí)驗(yàn)數(shù)據(jù)的期望函數(shù),進(jìn)行后續(xù)運(yùn)算處理。
當(dāng)單傳感器獨(dú)立使用時(shí),整個(gè)測(cè)控系統(tǒng)采集的有效監(jiān)測(cè)數(shù)據(jù)不足或采樣頻率不高、次數(shù)較少的情況下,獲得的有效樣本空間的大小將不足以滿足統(tǒng)計(jì)規(guī)律,難以獲得測(cè)量值的概率分布。傳統(tǒng)的、建立在數(shù)理統(tǒng)計(jì)基礎(chǔ)上的粗差判別準(zhǔn)則將很難適用[16]。
在獲得最大離散熵概率分布的基礎(chǔ)上,估計(jì)出測(cè)量列的概率密度函數(shù)為P(mi),故離散測(cè)量列的不確定度為:
(5)
進(jìn)一步地,以此置信區(qū)間為依據(jù),判定不在該區(qū)間范圍內(nèi)的數(shù)據(jù)為粗差,剔除這些粗差后獲得新的純凈數(shù)據(jù)序列,開展后續(xù)融合處理。
由Shannon信息熵定義可知,信息熵是信息量的度量,是衡量不確定性程度的指標(biāo)[11,13]。根據(jù)測(cè)量樣本數(shù)據(jù)的不確定性大小來(lái)分配不同的權(quán)系數(shù),進(jìn)行數(shù)據(jù)融合,能夠有效削弱融合結(jié)果對(duì)不確定性因素的敏感程度[16-17]。因此,基于信息熵的數(shù)據(jù)融合理論,可以用來(lái)進(jìn)行單傳感器測(cè)量數(shù)據(jù)的修正處理。
對(duì)于光學(xué)溶解氧傳感器標(biāo)定實(shí)驗(yàn)這類單傳感器獨(dú)立重復(fù)觀測(cè),需要借助自信息量I(mi)來(lái)表征不同濃度梯度下的每組傳感器測(cè)量樣本mi所攜帶的信息。同時(shí),可以借助信息熵來(lái)表征樣本總體的測(cè)量不確定程度。在此基礎(chǔ)上,通過(guò)定義每個(gè)樣本自身的信息比率來(lái)表征其在樣本總體中的不確定性。顯然,在工程實(shí)際應(yīng)用中,對(duì)于每個(gè)單傳感器輸出測(cè)量值,距離真值越遠(yuǎn),則表示該測(cè)量值產(chǎn)生的概率越低,對(duì)應(yīng)的自信息量越豐富;相反地,測(cè)差值距離真值越近,該測(cè)量值產(chǎn)生的概率越高,對(duì)應(yīng)的自信息量越微弱。由此可知,傳感器測(cè)量數(shù)據(jù)自信息量與融合時(shí)相應(yīng)的權(quán)系數(shù)呈反比關(guān)系。
根據(jù)以上分析,設(shè)計(jì)的適用于光學(xué)溶解氧傳感器標(biāo)定數(shù)據(jù)處理的融合算法步驟如下:
1) 根據(jù)獲得的離散測(cè)量樣本,估計(jì)數(shù)據(jù)的最大熵分布;
2) 求出標(biāo)定實(shí)驗(yàn)中,每種情況下傳感器測(cè)量輸出值的自信息量I(mi);
3) 計(jì)算信息比率ηi,即單個(gè)測(cè)量數(shù)據(jù)在總體測(cè)量數(shù)據(jù)中的不確定性程度,即:
(6)
其中,I(mi)=-logP(mi)。
4) 規(guī)定數(shù)據(jù)融合權(quán)系數(shù),進(jìn)行歸一化處理,有:
(7)
5) 針對(duì)剔除粗差后的有效數(shù)據(jù),進(jìn)行數(shù)據(jù)融合,即:
(8)
圖2 光學(xué)溶解氧傳感器新型標(biāo)定裝置與HJY1-1型光學(xué)溶解氧傳感器
采用如圖2所示的光學(xué)溶解氧傳感器新型標(biāo)定裝置,對(duì)HJY1-1型光學(xué)溶解氧傳感器進(jìn)行標(biāo)定實(shí)驗(yàn)。利用獲取的標(biāo)定實(shí)驗(yàn)數(shù)據(jù),對(duì)本方法的有效性進(jìn)行評(píng)估。
針對(duì)任意設(shè)定溫度下的每一處溶解氧濃度點(diǎn),均可以獲得如表1所示的一組測(cè)量樣本數(shù)據(jù)。表1中數(shù)據(jù)表示用同一款光學(xué)溶解氧傳感器在同一溫度和同一溶解氧濃度條件下,連續(xù)進(jìn)行多次采樣,獲得的8個(gè)溶解氧濃度測(cè)量樣本數(shù)據(jù)。此處設(shè)定的環(huán)境水溫為5 ℃,水體溶解氧含量保持恒定,采用國(guó)標(biāo)碘量法(GB 7489—87)測(cè)得的結(jié)果為8.37 mg·L-1。
表1 光學(xué)溶解氧傳感器在設(shè)定溫度及濃度情況下8個(gè)樣本數(shù)據(jù)
選取測(cè)量樣本數(shù)據(jù)的絕對(duì)誤差和均方誤差作為衡量數(shù)據(jù)融合效果的精度指標(biāo)。表1中,8組測(cè)量數(shù)據(jù)的期望和方差分別為:
離散測(cè)量數(shù)據(jù)樣本概率分布滿足的約束條件有:
運(yùn)用MATLAB軟件,根據(jù)最大熵方法,按照拉格朗日乘數(shù)法計(jì)算得到拉格朗日系數(shù),分別為:-4.69、0.69、5.97,進(jìn)而可得該組離散測(cè)量數(shù)據(jù)概率分布為:
P(mi)=exp[4.69-0.69mi-5.97(mi-9.39)2]。
最大離散熵為:
Hmax=1.819 9。
測(cè)量數(shù)據(jù)自信息量為:
I(mi)=-[4.69-0.69mi-5.97(mi-8.39)2]。
表1中8組測(cè)量數(shù)據(jù)對(duì)應(yīng)的概率和自信息量如表2所列。
表2 本情況下8組溶解氧傳感器測(cè)量輸出值的概率以及對(duì)應(yīng)自信息量
圖3 測(cè)量數(shù)據(jù)的自信息量和概率分布曲線
結(jié)合表2中數(shù)據(jù),可得該組溶解氧濃度條件下全部測(cè)量數(shù)據(jù)的自信息量以及最大熵分布曲線圖,詳見(jiàn)圖3。不難得出下面結(jié)論,若傳感器測(cè)量輸出結(jié)果距離溶解氧含量真值(即國(guó)標(biāo)碘量法測(cè)定溶解氧濃度)越遠(yuǎn),其自信息量越大、概率越??;距離溶解氧含量真值越近,自信息量越小、概率越大。
由測(cè)量數(shù)據(jù)的最大離散熵概率分布,可得測(cè)量的不確定度為:
故可以推定,該組測(cè)量數(shù)據(jù)的有效置信區(qū)間為:
依據(jù)該有效置信區(qū)間,進(jìn)行粗大誤差判別。經(jīng)過(guò)判斷,該組測(cè)量數(shù)據(jù)8個(gè)樣本中,第3、5、7個(gè)樣本包括粗大誤差,必須被剔除出有效測(cè)量序列。在獲得自信息量的基礎(chǔ)上,根據(jù)算法公式(7)融合權(quán)系數(shù)的定義,計(jì)算剩余5個(gè)離散測(cè)量樣本融合權(quán)系數(shù),進(jìn)行測(cè)量數(shù)據(jù)融合運(yùn)算。需要特別說(shuō)明的是,當(dāng)離散的傳感器測(cè)量數(shù)據(jù)列已經(jīng)完成粗差剔除工作后,不同的數(shù)據(jù)組合,不影響后續(xù)的融合權(quán)確定和最終融合結(jié)果的運(yùn)算。綜上所述,該組測(cè)量樣本的數(shù)據(jù)融合結(jié)果為8.36 mg·L-1,具體運(yùn)算數(shù)據(jù)如表3所列。
表3 本組實(shí)驗(yàn)條件下5個(gè)純凈測(cè)量結(jié)果融合權(quán)系數(shù)情況
針對(duì)該組測(cè)量數(shù)據(jù),選取除本算法外的其他多種算法進(jìn)行數(shù)據(jù)融合計(jì)算。統(tǒng)一將國(guó)標(biāo)碘量法的測(cè)點(diǎn)結(jié)果8.37 mg·L-1作為真值,選取絕對(duì)誤差和均方誤差作為判定融合效果的精度指標(biāo),與文獻(xiàn)[6-8]中各種方法及傳統(tǒng)算術(shù)平均法融合結(jié)果對(duì)比如表4所列。
表4 5種算法數(shù)據(jù)融合結(jié)果對(duì)比
從表4可看出,以水體溶解氧濃度測(cè)量的國(guó)標(biāo)碘量法測(cè)量結(jié)果(8.37 mg·L-1)為標(biāo)準(zhǔn),基于信息熵的數(shù)據(jù)融合算法擁有最小的絕對(duì)誤差,并且均方誤差也顯著降低。因此,基于信息熵理論針對(duì)光學(xué)溶解氧傳感器標(biāo)定數(shù)據(jù)融合提出的算法,能夠明顯提高傳感器整體的工作可靠性和測(cè)量數(shù)據(jù)穩(wěn)定性,有效提升標(biāo)定實(shí)驗(yàn)的效果。
針對(duì)光學(xué)溶解氧傳感器標(biāo)定過(guò)程的各濃度梯度處標(biāo)定測(cè)量樣本有效融合的問(wèn)題,提出一種基于標(biāo)定實(shí)驗(yàn)離散測(cè)量數(shù)據(jù)信息熵的數(shù)據(jù)融合算法,解決了國(guó)產(chǎn)光學(xué)溶解氧傳感器標(biāo)定過(guò)程中的單傳感器測(cè)量數(shù)據(jù)處理的難題。該算法從獨(dú)立傳感器測(cè)量數(shù)據(jù)最大離散熵入手,獲得樣本數(shù)據(jù)的概率分布,進(jìn)而計(jì)算離散測(cè)量數(shù)據(jù)的不確定度,并據(jù)此進(jìn)行粗差剔除。在此基礎(chǔ)上,對(duì)置信區(qū)間內(nèi)的有效測(cè)量數(shù)據(jù),通過(guò)自信息量與權(quán)系數(shù)的計(jì)算,進(jìn)行合理數(shù)據(jù)融合。結(jié)合HJY1-1光學(xué)溶解氧傳感器標(biāo)定應(yīng)用實(shí)例,驗(yàn)證了該算法能夠有效避免單傳感器測(cè)量使用情況下的各種不確定、非線性因素對(duì)測(cè)量結(jié)果的影響。對(duì)比其他4種算法,本文算法在多種精度指標(biāo)上均表現(xiàn)出明顯優(yōu)勢(shì),能夠有效提升測(cè)量數(shù)據(jù)的準(zhǔn)確性和可靠性。與此同時(shí),針對(duì)光學(xué)溶解氧傳感器標(biāo)定實(shí)驗(yàn)進(jìn)行的相關(guān)研究,對(duì)于其他各類海洋傳感器的實(shí)驗(yàn)室標(biāo)定校準(zhǔn)工作,均能提供一定的參考和借鑒。不足之處在于,本次實(shí)驗(yàn)覆蓋的溫度區(qū)間有限,獲得的有效算例不夠豐富,在后續(xù)研究工作中,將進(jìn)一步完善充實(shí)。