張新文,林冠英,劉同木,周保成
(1.自然資源部南海調(diào)查中心,廣東 廣州 510300;2.自然資源部海洋環(huán)境探測(cè)技術(shù)與應(yīng)用重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510300)
海洋浮標(biāo)是利用無動(dòng)力漂浮載體獲取海洋環(huán)境信息的自動(dòng)化監(jiān)測(cè)系統(tǒng),具有“海洋上的地球同步衛(wèi)星”和“海上天氣偵察兵”等稱號(hào),是海洋環(huán)境監(jiān)測(cè)、海洋資源調(diào)查評(píng)估和海洋科學(xué)研究的重要平臺(tái)[1-2]。受海洋環(huán)境噪聲、海洋生物附著和傳感器元件老化等因素的影響,浮標(biāo)搭載的傳感器測(cè)量值不可避免地存在環(huán)境噪聲,直接影響數(shù)據(jù)應(yīng)用效果[3]。當(dāng)前,海洋浮標(biāo)受到衛(wèi)星通信帶寬限制,一般在浮標(biāo)端需要對(duì)原始數(shù)據(jù)按照固定時(shí)間將觀測(cè)數(shù)據(jù)融合后回傳。因此,在浮標(biāo)端實(shí)時(shí)開展數(shù)據(jù)異常值檢測(cè)和測(cè)量噪聲預(yù)處理,是提高數(shù)據(jù)融合精度的可靠手段之一。
國內(nèi)外學(xué)者在環(huán)境監(jiān)測(cè)數(shù)據(jù)預(yù)處理方面進(jìn)行了相關(guān)研究,主要分為以下三類預(yù)處理方法:(1)基于數(shù)值統(tǒng)計(jì)規(guī)律的數(shù)據(jù)預(yù)處理方法,該類方法通過計(jì)算數(shù)據(jù)組的分布規(guī)律識(shí)別離散異常值[4-5],但通常閾值設(shè)定需要人工干預(yù),在延時(shí)數(shù)據(jù)預(yù)處理方面應(yīng)用較好[6-7]。(2)基于時(shí)空特征的數(shù)據(jù)預(yù)處理方法,該類方法將觀測(cè)要素的基于時(shí)間/空間的變化特征進(jìn)行相關(guān)性分析,使得預(yù)處理結(jié)果符合時(shí)間/空間變化規(guī)律,主要包括卡爾曼濾波算法[8-10]、自回歸移動(dòng)平均模型(ARMA)[11]、基于時(shí)序相關(guān)性分析方法[12]等。(3)基于人工智能的數(shù)據(jù)預(yù)處理方法,該類方法以大數(shù)據(jù)量的歷史數(shù)據(jù)挖掘分析為主,具有數(shù)據(jù)量大、算法復(fù)雜度高特點(diǎn),適用于監(jiān)測(cè)數(shù)據(jù)的延時(shí)預(yù)處理過程[13-14]。綜上,基于數(shù)值統(tǒng)計(jì)規(guī)律的數(shù)據(jù)預(yù)處理方法在數(shù)據(jù)異常值剔除方面具有良好的表現(xiàn),但不能實(shí)現(xiàn)浮標(biāo)原始數(shù)據(jù)的實(shí)時(shí)去噪聲處理,而浮標(biāo)數(shù)據(jù)采集器的計(jì)算能力無法滿足基于人工智能方法的高復(fù)雜度、大計(jì)算量的需求?;跁r(shí)空特征的數(shù)據(jù)預(yù)處理方法計(jì)算開銷較低且符合浮標(biāo)測(cè)量要素隨時(shí)間序列變化特征,但在工程應(yīng)用上,浮標(biāo)端尚未實(shí)現(xiàn)原始數(shù)據(jù)的自動(dòng)化預(yù)處理,國內(nèi)外的相關(guān)研究也以數(shù)據(jù)異常值檢測(cè)或延時(shí)數(shù)據(jù)的批量質(zhì)控處理為主,對(duì)于在浮標(biāo)端開展原始測(cè)量數(shù)據(jù)實(shí)時(shí)自動(dòng)化預(yù)處理方面的研究較少。因此,本研究結(jié)合海洋浮標(biāo)的數(shù)據(jù)特征,提出一種基于改進(jìn)的自適應(yīng)卡爾曼濾波自動(dòng)化數(shù)據(jù)預(yù)處理方法,該方法采用箱形圖法對(duì)原始數(shù)據(jù)中的異常值進(jìn)行檢測(cè)和修正,以期通過改進(jìn)的卡爾曼濾波方法實(shí)現(xiàn)浮標(biāo)觀測(cè)數(shù)據(jù)的噪聲濾波處理,并在廣東某海域進(jìn)行實(shí)際的海洋工程應(yīng)用實(shí)驗(yàn),以驗(yàn)證該方法的有效性和可行性。
在確定數(shù)據(jù)預(yù)處理方法前,對(duì)海洋浮標(biāo)搭載的傳感器采樣原理、數(shù)據(jù)特征和采樣/融合頻率等進(jìn)行分析,以保證數(shù)據(jù)處理方法的合理應(yīng)用,提高數(shù)據(jù)預(yù)處理效果。
依據(jù)GB/T 14914.3—2021《海洋觀測(cè)規(guī)范 第3部分:浮標(biāo)潛標(biāo)觀測(cè)》[15]和HY/T 147.6—2013《海洋監(jiān)測(cè)技術(shù)規(guī)程第6 部分:海洋水文、氣象與海冰》[16]等海洋環(huán)境監(jiān)測(cè)相關(guān)標(biāo)準(zhǔn),各監(jiān)測(cè)要素在到達(dá)融合和回傳時(shí)間后,浮標(biāo)端將監(jiān)測(cè)期間的原始數(shù)據(jù)進(jìn)行提取并融合成該時(shí)段的測(cè)量值,浮標(biāo)數(shù)據(jù)具有采樣與融合頻率固定、單參數(shù)融合、隨時(shí)間序列演變等特征。因此,必須在融合前對(duì)該時(shí)段內(nèi)所有監(jiān)測(cè)數(shù)據(jù)進(jìn)行統(tǒng)一的去噪聲處理。同時(shí),浮標(biāo)監(jiān)測(cè)參數(shù)在時(shí)間序列上符合環(huán)境變化規(guī)律,在設(shè)計(jì)自動(dòng)化數(shù)據(jù)處理程序時(shí)可以根據(jù)參數(shù)的融合頻率,采用基于預(yù)測(cè)與修正的實(shí)時(shí)濾波去噪方法。
卡爾曼濾波算法是一種具有較強(qiáng)容錯(cuò)能力,以最小均方誤差為準(zhǔn)則的遞推無偏估計(jì)算法,可有效去除系統(tǒng)中的噪聲干擾,在無人導(dǎo)航、電氣控制、傳感器數(shù)據(jù)融合等多個(gè)領(lǐng)域得到廣泛應(yīng)用[17-18]。傳統(tǒng)的卡爾曼濾波是在標(biāo)準(zhǔn)條件下獲得的,但海洋浮標(biāo)是搭載多傳感器的實(shí)時(shí)環(huán)境監(jiān)測(cè)平臺(tái),在工程應(yīng)用中由于噪聲統(tǒng)計(jì)特性不準(zhǔn)確而產(chǎn)生濾波精度降低甚至產(chǎn)生濾波發(fā)散問題。為解決卡爾曼濾波發(fā)散問題,有學(xué)者提出Sage-Husa 自適應(yīng)卡爾曼濾波方法[19],該方法通過時(shí)變?cè)肼暪烙?jì)器,在實(shí)時(shí)處理數(shù)據(jù)過程中,更新系統(tǒng)噪聲和測(cè)量噪聲,從而抑制濾波發(fā)散。其狀態(tài)空間模型如下:
式(1)中,xk為系統(tǒng)k時(shí)刻的n維狀態(tài)量;Φk,k-1為系統(tǒng)從k-1 時(shí)刻到k時(shí)刻的n×n維狀態(tài)轉(zhuǎn)移矩陣;zk為系統(tǒng)k時(shí)刻的m維觀測(cè)量;Hk為系統(tǒng)k時(shí)刻的m×n維測(cè)量矩陣;wk-1為系統(tǒng)k-1 時(shí)刻的過程噪聲;vk為m維測(cè)量噪聲,滿足如下統(tǒng)計(jì)特性:
式(2)中,j,k=1,2,3,...,當(dāng)k=j時(shí),δkj=1,否 則δkj=0;qk和qj為wk和wj的數(shù)學(xué)期望;rk為vk的數(shù)學(xué)期望;Qk和Rk為系統(tǒng)噪聲和測(cè)量噪聲方差矩陣。
Sage-Husa自適應(yīng)卡爾曼濾波算法可描述為
受海洋環(huán)境噪聲、海洋生物附著和傳感器元件老化等因素的影響,浮標(biāo)數(shù)據(jù)不可避免的存在異常測(cè)量值,這些異常值將導(dǎo)致算法在式(3)求狀態(tài)值時(shí)被放大并引入到狀態(tài)估計(jì)中,特別是當(dāng)異常值偏離較大時(shí),殘差無法正確修正,會(huì)嚴(yán)重影響濾波精度,因而在使用卡爾曼濾波器進(jìn)行濾波時(shí),必須對(duì)測(cè)量異常數(shù)據(jù)進(jìn)行剔除并修正。同時(shí),測(cè)量噪聲方差在計(jì)算過程中,當(dāng)初始噪聲設(shè)置過大或?qū)嶋H海洋環(huán)境噪聲與理論建模值相比較小時(shí),卡爾曼濾波算法將出現(xiàn)濾波發(fā)散問題。為提高算法的穩(wěn)定性,需要解決異常值對(duì)濾波的干擾和抑制濾波發(fā)散問題。
1.3.1 異常值修正 基于統(tǒng)計(jì)規(guī)律的方法在異常值檢測(cè)方面應(yīng)用最為廣泛,如拉依達(dá)準(zhǔn)則和狄克遜準(zhǔn)則等基于測(cè)量值正態(tài)分布規(guī)律的方法。但基于正態(tài)分布的疏失誤差檢測(cè)方法是以假定數(shù)據(jù)服從正態(tài)分布為前提的,其判斷異常值的標(biāo)準(zhǔn)是以計(jì)算數(shù)據(jù)組的均值和標(biāo)準(zhǔn)差為基礎(chǔ)的,異常值本身會(huì)對(duì)它們產(chǎn)生較大影響,進(jìn)而導(dǎo)致方法的耐抗性較小。同時(shí),海洋浮標(biāo)數(shù)據(jù)往往難以服從正態(tài)分布規(guī)律,在使用基于正態(tài)分布的異常值檢測(cè)方法時(shí)存在漏剔除和誤剔除現(xiàn)象?;诮y(tǒng)計(jì)規(guī)律的還有箱形圖法,如圖1所示。
圖1 箱形圖結(jié)構(gòu)Fig.1 Box plot Structure
該方法利用數(shù)據(jù)序列中的5個(gè)統(tǒng)計(jì)量:下限、下四分位數(shù)(Q1)、中位數(shù)(Q2)、上四分位數(shù)(Q3)與上限來描述數(shù)據(jù)離散程度的方法。假設(shè)預(yù)處理數(shù)據(jù)集含n個(gè)測(cè)量值,則箱形圖Q1取1×(n+1)/4 位置的數(shù);若n為奇數(shù),則Q2取(n+1)/2 位置的數(shù),否則取n/2 和n/ 2+1 位置數(shù)的均值;Q3取3 × (n+1)/ 4 位置的數(shù)。因此,四分位距IQR 為Q3—Q1,上限Q3+1.5 × IQR 和下限Q1—1.5 × IQR 作為異常值截?cái)帱c(diǎn),測(cè)量值分布在該區(qū)間內(nèi)的判定為有效測(cè)量值,否則判定為異常測(cè)量值。箱形圖判斷異常值的標(biāo)準(zhǔn)以四分位數(shù)和四分位距為基礎(chǔ),具有一定的耐抗性,能夠客觀地識(shí)別數(shù)據(jù)中的異常值。在識(shí)別到異常值后,為使得數(shù)據(jù)維數(shù)保持一致,本研究使用臨近數(shù)據(jù)求取的平均值進(jìn)行插補(bǔ)。
1.3.2 方差受限抑制濾波發(fā)散 為避免初始噪聲設(shè)置過大或?qū)嶋H系統(tǒng)噪聲與理論建模值相比較小,將造成測(cè)量噪聲方差失去正定性而導(dǎo)致濾波發(fā)散問題。本研究設(shè)計(jì)采用方差受限的方法解決測(cè)量噪聲導(dǎo)致的濾波發(fā)散問題,這種改變雖然降低了一定的濾波精度,但提高了濾波的穩(wěn)定性。
式(4)中,βk作為方差加權(quán)系數(shù),其取值為βk=βk-1/(βk-1+b),其中β0=1,β∞=1 -b,b為漸消因子,取值區(qū)間為[0.90,0.99];Rmin為設(shè)置的方差下限,保證為正,Rmax為設(shè)置的方差上限,能夠快速降低測(cè)量值的可信度并判定是否異常,若異常則放棄本次更新。
結(jié)合海洋浮標(biāo)數(shù)據(jù)特征和處理程序,提出基于改進(jìn)擴(kuò)展卡爾曼濾波的自動(dòng)化數(shù)據(jù)處理方法,如圖2所示。
圖2 數(shù)據(jù)預(yù)處理流程Fig.2 Data preprocessing process
在到達(dá)參數(shù)數(shù)據(jù)融合/回傳時(shí)間后,浮標(biāo)端將監(jiān)測(cè)時(shí)段內(nèi)的原始數(shù)據(jù)集提取作為數(shù)據(jù)預(yù)處理方法的輸入,對(duì)數(shù)據(jù)集依次進(jìn)行常規(guī)檢驗(yàn)、箱型圖異常值檢測(cè)以及卡爾曼濾波去噪處理。主要步驟如下:
(1)判斷是否到達(dá)參數(shù)數(shù)據(jù)融合與回傳時(shí)間。若到達(dá)則提取該監(jiān)測(cè)時(shí)段內(nèi)參數(shù)的所有采樣數(shù)據(jù),作為預(yù)處理數(shù)據(jù)集D;若未到達(dá)則繼續(xù)進(jìn)行采樣監(jiān)測(cè)。
(2)數(shù)據(jù)常規(guī)校驗(yàn)。對(duì)數(shù)據(jù)集D內(nèi)的各測(cè)量值進(jìn)行遍歷處理,判斷數(shù)據(jù)是否符合格式要求,對(duì)不符合要求的數(shù)據(jù)進(jìn)行修正或剔除,同時(shí)判斷測(cè)量值是否在理論區(qū)間,對(duì)于超過傳感器理論量程的數(shù)據(jù)予以剔除,輸出數(shù)據(jù)集D1。
(3)異常值檢測(cè)。完成常規(guī)校驗(yàn)后,以數(shù)據(jù)集D1作為箱形圖輸入,統(tǒng)計(jì)該時(shí)段內(nèi)的數(shù)據(jù)分布規(guī)律,對(duì)于異常值進(jìn)行剔除并使用臨近數(shù)據(jù)的平均值進(jìn)行插補(bǔ),保證數(shù)據(jù)序列隨時(shí)間的變化特征,輸出數(shù)據(jù)集D2。
(4)初始化卡爾曼濾波算法的參數(shù)??紤]到浮標(biāo)監(jiān)測(cè)系統(tǒng)噪聲由傳感器元件自身的特性所決定的,如風(fēng)速采樣頻率為3 s,浮標(biāo)觀測(cè)系統(tǒng)相對(duì)穩(wěn)定,相鄰間隔的測(cè)量值變化不大,因此根據(jù)k—1 時(shí)刻的最優(yōu)估計(jì)值來預(yù)測(cè)k時(shí)刻的預(yù)測(cè)值時(shí),我們由經(jīng)驗(yàn)認(rèn)為,測(cè)量噪聲和系統(tǒng)噪聲近似為高斯噪聲,變量Φ和H初始設(shè)置為1,方差初始設(shè)置為q=0.05和r=0.50。
(5)去噪聲處理。采用改進(jìn)的自適應(yīng)卡爾曼濾波方法進(jìn)行去噪聲處理,以數(shù)據(jù)集D2各測(cè)量值按時(shí)間序列作為算法輸入,輸出預(yù)處理后的數(shù)據(jù)集D3。
2021年6月28日至2021年8月16日,本研究數(shù)據(jù)預(yù)處理方法的海洋浮標(biāo)在廣東汕尾海域進(jìn)行實(shí)際工程應(yīng)用,該浮標(biāo)搭載2 臺(tái)風(fēng)速風(fēng)向儀、1 臺(tái)聲學(xué)多普勒流速剖面儀(ADCP)、1 臺(tái)波浪儀進(jìn)行海洋風(fēng)、水溫、海流、波浪的監(jiān)測(cè),實(shí)時(shí)回傳數(shù)據(jù)為廣東某地的系統(tǒng)工程建設(shè)提供數(shù)據(jù)支撐。站點(diǎn)位置與傳感器配置情況詳見表1。
表1 浮標(biāo)系統(tǒng)部署與配置情況Table 1 Deployment and configuration of buoy system
3.2.1 系統(tǒng)運(yùn)行穩(wěn)定性 傳感器完成數(shù)據(jù)采集后實(shí)時(shí)發(fā)送至浮標(biāo)端的數(shù)據(jù)采集與控制系統(tǒng),由該系統(tǒng)按照數(shù)據(jù)融合/回傳時(shí)間,提取原始數(shù)據(jù)進(jìn)行異常值修正和濾波降噪處理,并同步存儲(chǔ)在浮標(biāo)本地。海上實(shí)驗(yàn)結(jié)果表明,在整個(gè)監(jiān)測(cè)周期內(nèi),部署本研究自動(dòng)化數(shù)據(jù)預(yù)處理程序的浮標(biāo)系統(tǒng),數(shù)據(jù)采集率達(dá)100%,云數(shù)據(jù)中心數(shù)據(jù)接收率達(dá)97%。因此,本研究提出的自動(dòng)化數(shù)據(jù)預(yù)處理程序計(jì)算開銷較低且不影響浮標(biāo)系統(tǒng)的正常采集和數(shù)據(jù)融合工作,系統(tǒng)整體運(yùn)行穩(wěn)定。
3.2.2 常規(guī)檢驗(yàn)及異常值檢測(cè)情況 2021 年8 月16日回收浮標(biāo)后,將原始數(shù)據(jù)和處理后的數(shù)據(jù)下載后進(jìn)行統(tǒng)計(jì)分析。2021 年7 月18 日臺(tái)風(fēng)“查帕卡”期間浮標(biāo)監(jiān)測(cè)的風(fēng)、海流流速數(shù)據(jù)異常值檢測(cè)前后對(duì)比情況如圖3所示。
圖3 數(shù)據(jù)異常值檢測(cè)Fig.3 Data outlier detection
圖3 顯示了數(shù)據(jù)異常值的檢測(cè)過程,由圖3(a、c、e)可知,風(fēng)、海流的原始數(shù)據(jù)中存在明顯的異常測(cè)量值,這是由于傳感器受海洋浮標(biāo)搖晃、電信號(hào)不穩(wěn)定及環(huán)境噪聲干擾產(chǎn)生的。由于海洋浮標(biāo)測(cè)量要素具有隨時(shí)間有序變化的特征,如圖3(b、d、f)所示,在到達(dá)數(shù)據(jù)融合時(shí)間后,通過常規(guī)檢驗(yàn)和箱形圖法能夠很好地統(tǒng)計(jì)區(qū)間范圍內(nèi)的數(shù)據(jù)分布情況和識(shí)別離群異常值。2021 年6 月28 日至8 月16 日期間,浮標(biāo)數(shù)據(jù)采集器未檢測(cè)到傳感器測(cè)量值超出理論閾值情況,但識(shí)別出部分?jǐn)?shù)據(jù)存在格式錯(cuò)誤和異常測(cè)量值。如表2 所示,浮標(biāo)數(shù)據(jù)采集器檢測(cè)到各傳感器錯(cuò)誤率均較低,最高的ADCP 錯(cuò)誤率為8.90‰,主要原因是串口通信存在一定的通信誤碼率,而剖面海流的測(cè)量參數(shù)較多且單組數(shù)據(jù)量較大,單個(gè)參數(shù)格式有誤則直接判定為格式錯(cuò)誤。浮標(biāo)數(shù)據(jù)采集器對(duì)格式錯(cuò)誤進(jìn)行初步修正后存儲(chǔ)至本地,并對(duì)箱型圖檢測(cè)出的異常測(cè)量值使用臨近數(shù)據(jù)求取平均值進(jìn)行插補(bǔ)。
表2 常規(guī)檢驗(yàn)及異常值檢測(cè)情況Table 2 Routine inspection and detection of outliers
3.2.3 卡爾曼濾波數(shù)據(jù)預(yù)處理與應(yīng)用分析 在完成常規(guī)校驗(yàn)和異常值檢測(cè)后,浮標(biāo)端將在每個(gè)融合/數(shù)據(jù)回傳時(shí)刻,提取該時(shí)間段內(nèi)的原始數(shù)據(jù)并采用改進(jìn)的自適應(yīng)卡爾曼濾波方法進(jìn)行去噪聲處理。如圖4所示,浮標(biāo)運(yùn)行期間水溫、海流流速和風(fēng)速的原始數(shù)據(jù)經(jīng)過濾波處理前后的對(duì)比。
圖4 原始數(shù)據(jù)與卡爾曼濾波處理結(jié)果對(duì)比Fig.4 Comparison of raw data and Kalman filter processing results
根據(jù)圖4,原始數(shù)據(jù)經(jīng)卡爾曼濾波方法處理后,有效降低了水溫、海流流速和風(fēng)速的數(shù)據(jù)離散度,數(shù)據(jù)曲線更為平滑且符合隨時(shí)間序列變化的規(guī)律,濾波效果良好。由于卡爾曼濾波算法“預(yù)測(cè)+修正”的特征,原始數(shù)據(jù)經(jīng)濾波后,不僅能夠消除測(cè)量噪聲,也過濾了原始測(cè)量數(shù)據(jù)的高頻信號(hào)。但部分海上施工作業(yè)時(shí)甚至只關(guān)注極值、最大值和海流流速等高頻信號(hào)的變化,使得該方法在部分海洋工程領(lǐng)域存在應(yīng)用局限性。因此,各融合時(shí)段的平均風(fēng)速、平均風(fēng)向、水溫、氣壓、氣溫、平均波高等需要數(shù)據(jù)融合的參數(shù),可直接采用濾波后的數(shù)據(jù)進(jìn)行算數(shù)或矢量平均;極大風(fēng)、最大風(fēng)、最大波高等極值統(tǒng)計(jì)參數(shù),則需要結(jié)合原始測(cè)量數(shù)據(jù)進(jìn)行計(jì)算。針對(duì)大剖面、長序列的海流數(shù)據(jù),研究人員一般更關(guān)注高頻信號(hào)的變化以開展中大尺度的海洋動(dòng)力過程研究,如內(nèi)波實(shí)時(shí)監(jiān)測(cè)與預(yù)警,通過計(jì)算原始數(shù)據(jù)與濾波后數(shù)據(jù)的殘差,獲取剖面海流流速的高頻信號(hào),進(jìn)而通過海流高頻變化特征實(shí)現(xiàn)浮標(biāo)端內(nèi)波的自動(dòng)化識(shí)別[20-21]。因此,本研究提出的改進(jìn)的自適應(yīng)卡爾曼方法在有效消除測(cè)量噪聲的同時(shí),也能夠間接應(yīng)用于海流等參數(shù)高頻信號(hào)的提取,驗(yàn)證了本研究方法的可行性。
為進(jìn)一步驗(yàn)證算法的準(zhǔn)確性、可靠性和抑制濾波發(fā)散能力,將本研究算法與標(biāo)準(zhǔn)卡爾曼濾波方法[8]、自適應(yīng)卡爾曼濾波方法[9]和改進(jìn)的Sage-Husa自適應(yīng)卡爾曼濾波方法[22]的數(shù)據(jù)處理效果進(jìn)行對(duì)比分析,運(yùn)行硬件為具有一定計(jì)算能力的低功耗數(shù)據(jù)采集設(shè)備(Raspberry Pi,運(yùn)行內(nèi)存2 GB)。如圖5(a、b)所示,該實(shí)驗(yàn)數(shù)據(jù)采用已知正弦信號(hào)作為模擬的實(shí)測(cè)值,添加高斯噪聲(sigma=0.5)和突變數(shù)據(jù)的正弦信號(hào)作為傳感器的測(cè)量值作為仿真實(shí)驗(yàn)的原始數(shù)據(jù),因?yàn)檎鎸?shí)值已知,通過將預(yù)處理后的數(shù)據(jù)與真實(shí)測(cè)量值進(jìn)行誤差比對(duì)分析,能夠很好地評(píng)價(jià)數(shù)據(jù)預(yù)處理效果和驗(yàn)證算法的穩(wěn)定性。3 種算法的數(shù)據(jù)預(yù)處理效果對(duì)比如圖5(c)所示。
圖5 不同預(yù)處理方法仿真對(duì)比Fig.5 Simulation comparison of different preprocessing methods
通過計(jì)算處理后數(shù)據(jù)與正弦信號(hào)真實(shí)值之間的均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)、相關(guān)系數(shù)(R)及算法運(yùn)行耗時(shí)等指標(biāo),對(duì)比分析不同方法的處理效果。如表3 所示,文獻(xiàn)[8]方法受到數(shù)據(jù)噪聲及突變數(shù)據(jù)的影響,即噪聲過大及噪聲與理論建模值相比較小時(shí),隨著誤差累積出現(xiàn)了濾波發(fā)散現(xiàn)象。文獻(xiàn)[9]、文獻(xiàn)[22]及本研究方法能夠有效的降低異常值對(duì)卡爾曼濾波發(fā)散的影響,濾波處理后的數(shù)據(jù)與真實(shí)數(shù)據(jù)曲線擬合效果較好,且本文方法處理后的數(shù)據(jù)均方根誤差、平均絕對(duì)誤差最低,與原始數(shù)據(jù)集的相關(guān)系數(shù)達(dá)0.98,數(shù)據(jù)預(yù)處理結(jié)果的準(zhǔn)確性最優(yōu)。另外,本研究方法利用箱型圖法處理突變數(shù)據(jù)和限定方差上限,在有效降低異常值對(duì)濾波精度影響的同時(shí),能夠快速降低測(cè)量值的可信度,降低了算法的計(jì)算開銷,其計(jì)算耗時(shí)相比文獻(xiàn)[9]和文獻(xiàn)[22]降低了50%,計(jì)算耗時(shí)最少。
表3 對(duì)添加噪聲及突變數(shù)據(jù)的預(yù)處理效果評(píng)價(jià)對(duì)比Table 3 Comparison of preprocessing performance evaluation on adding noise and mutation data
結(jié)合海洋浮標(biāo)數(shù)據(jù)采集特征,本文提出了基于改進(jìn)自適應(yīng)卡爾曼濾波的自動(dòng)化數(shù)據(jù)預(yù)處理方法,主要結(jié)論如下:
(1)該方法通過箱形圖進(jìn)行異常測(cè)量值的檢測(cè),并采用方差受限的方法解決測(cè)量噪聲導(dǎo)致的濾波發(fā)散問題。
(2)海上工程應(yīng)用結(jié)果表明,浮標(biāo)端常規(guī)數(shù)據(jù)采集器能夠滿足該方法的計(jì)算開銷,數(shù)據(jù)采集及自動(dòng)化數(shù)據(jù)預(yù)處理程序運(yùn)行穩(wěn)定,浮標(biāo)系統(tǒng)有效數(shù)據(jù)接收率達(dá)97%。根據(jù)統(tǒng)計(jì),常規(guī)檢驗(yàn)和箱形圖法能夠有效地識(shí)別格式錯(cuò)誤和離群異常值,且各時(shí)段測(cè)量數(shù)據(jù)經(jīng)過異常值修正和濾波降噪處理后,數(shù)據(jù)曲線更為平滑且符合隨時(shí)間序列變化的規(guī)律,其濾波處理后的數(shù)據(jù)可應(yīng)用于各測(cè)量要素的數(shù)據(jù)融合與高頻信號(hào)的間接提取。
(3)與同類方法的仿真對(duì)比發(fā)現(xiàn),本研究方法能夠有效的降低異常值對(duì)卡爾曼濾波發(fā)散的影響,濾波處理后的數(shù)據(jù)與真實(shí)數(shù)據(jù)曲線擬合效果較好,且計(jì)算耗時(shí)最小。
本研究成果豐富了我國海洋浮標(biāo)數(shù)據(jù)預(yù)處理與質(zhì)控手段,可為其他領(lǐng)域的基于時(shí)間序列變化的數(shù)據(jù)處理提供參考和借鑒。