盧 楠 董元鋒 郭世泰 吳 浩 王曉麗 張 祥
(1.武漢理工大學(xué)資源與環(huán)境工程學(xué)院,湖北武漢430070;2.華中師范大學(xué)城市與環(huán)境科學(xué)學(xué)院,湖北武漢430079;3.臨沂大學(xué)物理與電子工程學(xué)院山東臨沂276005)
由于露天礦山邊坡變形監(jiān)測環(huán)境的復(fù)雜性,監(jiān)測設(shè)備(GPS、測量機器人等)時常受到多種因素的干擾,導(dǎo)致監(jiān)測數(shù)據(jù)序列出現(xiàn)突變的異常值,即粗差[1-3]。為進一步提升變形監(jiān)測精度,有必要對監(jiān)測數(shù)據(jù)序列中的粗差進行有效探測和剔除。目前,常用的粗差探測方法主要有3σ準(zhǔn)則法、狄克遜準(zhǔn)則法、格拉布斯準(zhǔn)則法以及四分位距(inter-quartile range,IQR)準(zhǔn)則法[4]。3σ法以數(shù)據(jù)序列誤差服從正態(tài)分布為前提,分別計算其平均值和標(biāo)準(zhǔn)差,從而構(gòu)建粗差判別式進行粗差識別,應(yīng)用較簡單、方便,但粗差的干擾會造成基于貝塞爾公式估算的標(biāo)準(zhǔn)差偏大,導(dǎo)致粗差探測效果不理想[5];狄克遜準(zhǔn)則法也以數(shù)據(jù)序列誤差服從正態(tài)分布為前提,根據(jù)極差比的大小對粗差進行探測和剔除,對于不同的數(shù)據(jù)序列,一般會選取不同的極差比進行自適應(yīng)性計算[6];格拉布斯準(zhǔn)則法對于粗差的判別原理與3σ法類似,但在判別過程中,增加了對數(shù)據(jù)長度序列的判別因子,計算相對繁瑣,并且該方法與狄克遜準(zhǔn)則法僅適用于小樣本數(shù)據(jù)的粗差探測[7];IQR法對數(shù)據(jù)誤差分布無依賴,是一種穩(wěn)健統(tǒng)計分析方法,其中位值和標(biāo)準(zhǔn)四分位距不易受粗差影響,用兩者分別代替統(tǒng)計方法中的平均值和標(biāo)準(zhǔn)偏差對粗差進行總體估計,再通過穩(wěn)健Z比分數(shù)統(tǒng)計量探測數(shù)據(jù)中的極端異常值(粗差)。IQR法對于偏離假定模型的觀測數(shù)據(jù)具有良好的適應(yīng)性,但對于離散度較大的觀測數(shù)據(jù),其四分位距會隨之變大,使得穩(wěn)健Z比分數(shù)統(tǒng)計量對于偏離度較小的粗差探測效果不理想[8-11]。為有效探測露天礦山邊坡變形監(jiān)測數(shù)據(jù)序列中的粗差,本研究將小波分析、3σ法與IQR法相結(jié)合,對常規(guī)IQR法進行改進,以進一步提高該方法對偏離度較小粗差的探測敏感度。
3σ準(zhǔn)則在實際應(yīng)用中是以監(jiān)測數(shù)據(jù)序列所包含的誤差滿足正態(tài)分布為前提,并且重復(fù)測量次數(shù)也應(yīng)達到一定的數(shù)量級[12]。設(shè)某一數(shù)據(jù)序列為Xn={x1,x2,...,xi,...,xn},其算術(shù)平均值為
當(dāng)|xi->3σ時,則xi為異常值,予以剔除;反之,xi為正常值,予以保留。
對于任意一組離散的觀測數(shù)據(jù)序列,將其由小至大排列后獲得一個新的觀測數(shù)據(jù)序列,可采用中位值M和標(biāo)準(zhǔn)化IQR對新序列數(shù)據(jù)的集中度和離散度進行評價[13]。中位值為新序列的中間值,IQR為低四分位數(shù)和高四分位數(shù)的差值(低四分位數(shù)和高四分位數(shù)分別為新序列第25%和75%的數(shù)值),即:
式中,Q1、Q3分別為低四分位數(shù)和高四分位數(shù)。
IQR法的穩(wěn)健Z比分數(shù)計算公式為
式中,xi為新序列中的第i個數(shù)據(jù);s為標(biāo)準(zhǔn)化處理后的IQR值,s=0.741 3IQR。
當(dāng)統(tǒng)計量 ||Z>3時,可認為xi為粗差值。
本研究采用小波分析法對常規(guī)IQR法進行改進。主要思路是通過小波分解提取低頻系數(shù)[14-17],并對其進行重構(gòu)得到變形趨勢;然后根據(jù)變形趨勢得到監(jiān)測數(shù)據(jù)序列的殘差序列,在殘差序列的基礎(chǔ)上利用常規(guī)IQR法進行粗差探測(圖1)。
試驗首先通過模擬得到一組噪聲標(biāo)準(zhǔn)差為6σ且服從正態(tài)分布的隨機誤差序列,然后將噪聲標(biāo)準(zhǔn)差大于3σ的數(shù)據(jù)加入到不含粗差的原始數(shù)據(jù)中,最終得到含有粗差的變形監(jiān)測數(shù)據(jù)序列。試驗數(shù)據(jù)由MATLAB軟件生成,模擬變形監(jiān)測數(shù)據(jù)序列的采樣間隔為4 h,共1 096個數(shù)據(jù),其中粗差數(shù)據(jù)有80個(圖2)。
分別采用3σ法、IQR法及改進型IQR法(小波分解層數(shù)為6)對圖2所示的數(shù)據(jù)序列進行處理,結(jié)果見圖3。由圖3可知:3σ法可以探測到變形監(jiān)測數(shù)據(jù)序列中的大部分粗差,IQR法僅能探測到少部分粗差,而改進型IQR法幾乎可以探測到所有的粗差點。
在上述試驗的基礎(chǔ)上,分別將變形監(jiān)測數(shù)據(jù)序列長度設(shè)置為548、1 096、1 644、2 191,對應(yīng)的粗差污染率分別為8.94%、7.30%、8.70%、6.62%,3種方法的探測效果見圖4。由圖4可知:3σ法隨著變形監(jiān)測數(shù)據(jù)序列長度的縮短,粗差探測效果有降低趨勢,尤其是在序列長度由1 096縮短至548時,該方法的總體粗差探測率低于80%;IQR法隨著變形監(jiān)測數(shù)據(jù)序列的縮短,粗差探測效果逐步提升,但總體粗差探測率也低于80%;改進型IQR法不易受到變形監(jiān)測數(shù)據(jù)序列長度的影響,總體粗差探測率保持在90%左右。
金堆城露天礦區(qū)周邊植被茂盛,現(xiàn)場高壓電線以及信號基站密布,對變形監(jiān)測信號接收終端造成了較強的干擾,使得獲得的監(jiān)測數(shù)據(jù)序列中含有較多粗差。選取露天礦北部邊坡12個GPS監(jiān)測點中1個監(jiān)測點作為研究對象,該點位數(shù)據(jù)采集時間為2015年2月8日0時至2015年6月20日0時(圖5)。
分別采用3σ法、IQR法及改進型IQR法(小波分解層數(shù)為8)對圖5所示的數(shù)據(jù)序列進行粗差探測,結(jié)果見圖6。由圖6可知:3種方法對于偏離度較大的粗差探測效果均較好,改進型IQR法對于偏離度較小的粗差探測效果明顯優(yōu)于3σ法和IQR法。
采用小波分析法、3σ法對常規(guī)IQR粗差探測方法進行了改進,通過模擬數(shù)據(jù)及金堆城露天礦區(qū)邊坡GPS監(jiān)測數(shù)據(jù)進行試驗分析,認為改進型IQR法的粗差探測效果優(yōu)于3σ法及常規(guī)IQR法,對于提升露天礦山邊坡變形監(jiān)測精度有一定的參考意義。