嚴(yán) 暉
(泰興市環(huán)境監(jiān)測站,泰興 225400)
環(huán)境監(jiān)測數(shù)據(jù)處理與分析
嚴(yán) 暉
(泰興市環(huán)境監(jiān)測站,泰興 225400)
環(huán)境監(jiān)測是保護(hù)環(huán)境的重要手段。隨著科技發(fā)展,監(jiān)測數(shù)據(jù)的處理與分析也有了很大的進(jìn)步,為人類的生活提供了有力的保障。本文從數(shù)據(jù)獲取出發(fā),從多個(gè)角度對(duì)環(huán)境監(jiān)測數(shù)據(jù)處理進(jìn)行分析和研究,同時(shí)探討新型方法在監(jiān)測數(shù)據(jù)領(lǐng)域的應(yīng)用。
環(huán)境監(jiān)測;監(jiān)測數(shù)據(jù);數(shù)據(jù)融合
環(huán)境監(jiān)測是指間斷地或連續(xù)地測定環(huán)境中污染物的濃度,觀察、分析其變化和環(huán)境影響的過程。在此過程中對(duì)影響環(huán)境質(zhì)量的各種因素進(jìn)行實(shí)時(shí)或定期采樣、分析測量以發(fā)現(xiàn)異常的因素,即定期、定點(diǎn)對(duì)環(huán)境組成、因子和環(huán)境中污染物質(zhì)的種類、濃度、分布的變化及影響進(jìn)行監(jiān)測和分析。
環(huán)境監(jiān)測數(shù)據(jù)具有代表性和完整性,即所獲取的檢測數(shù)據(jù)能較全面地描述污染物的空間分布狀態(tài)。同時(shí)還具備準(zhǔn)確性和可比性,即數(shù)據(jù)是經(jīng)過精密儀器采集,并可通過一定的數(shù)據(jù)處理方法進(jìn)行可比性分析驗(yàn)證。
目前監(jiān)測數(shù)據(jù)的獲取方面存在的問題主要有:數(shù)據(jù)采集過程中監(jiān)測人員在數(shù)據(jù)篩選或處理時(shí)出現(xiàn)人為誤差;監(jiān)測點(diǎn)布控沒有及時(shí)根據(jù)附近環(huán)境變化而更新布防監(jiān)控;由于儀器設(shè)備過于陳舊而無法進(jìn)行精密度采集或處理等等。產(chǎn)生以上問題的原因主要有[1]:
(1)主觀原因:監(jiān)測人員本身業(yè)務(wù)素質(zhì)較低,并不能將數(shù)據(jù)進(jìn)行科學(xué)有效的分析和處理,使得部分?jǐn)?shù)據(jù)喪失真實(shí)性,甚至不能用于評(píng)價(jià)工作。
(2)客觀原因:監(jiān)測儀器配置和監(jiān)測站點(diǎn)的布置過于陳舊,并未根據(jù)最新環(huán)境變化情況更新,使得環(huán)境監(jiān)測數(shù)據(jù)不具有代表性,造成評(píng)價(jià)結(jié)果的偏差,無法進(jìn)行科學(xué)的分析和處理。
由于監(jiān)測數(shù)據(jù)與污染物空間分布和持續(xù)時(shí)間等因素有關(guān),故在分析數(shù)據(jù)時(shí)可將數(shù)據(jù)按周期性規(guī)律進(jìn)行統(tǒng)計(jì)分析,從而得出濃度隨時(shí)間變化的大致規(guī)律。同時(shí)再根據(jù)當(dāng)?shù)氐乃臈l件、氣象變化和地形特征等因素進(jìn)行綜合整理,生成更為詳盡的濃度等值線圖,便于數(shù)據(jù)的直觀性統(tǒng)計(jì)與分析[2]。
環(huán)境監(jiān)測數(shù)據(jù)獲取條件較為復(fù)雜,在實(shí)際工作中可能由于監(jiān)測主體或條件變化產(chǎn)生離群值的產(chǎn)生,如何正確區(qū)分離群值產(chǎn)生的原因并科學(xué)有效地去除離群值,是正確進(jìn)行評(píng)價(jià)的重要依據(jù)[2]。
2.1.1 Q檢驗(yàn)法
在同一組數(shù)據(jù)中,判斷最大值或最小值是否為異常值時(shí)采用Q檢驗(yàn)法【Dixon(狄克遜)檢驗(yàn)法】:將數(shù)據(jù)從大到小進(jìn)行排列,根據(jù)測定次數(shù)進(jìn)行計(jì)算Q值:
根據(jù)測定數(shù)據(jù)次數(shù)n和顯著性水平,查Dixon檢驗(yàn)統(tǒng)計(jì)表, 將Q值與臨界值比較, 判斷x1與xn是否為離群值:若Q≤Q0.05,則可疑值為正常值;若Q0.05<Q≤Q0.01,則可疑值為偏離值,可做保留處理;若Q>Q0.01,則可疑值應(yīng)予剔除。但該檢驗(yàn)方法僅將可疑值與相鄰數(shù)據(jù)進(jìn)行比較分析,具有一定的局限性[2]。
2.1.2 T檢驗(yàn)法
對(duì)于各組測定數(shù)據(jù)平均值的一致性檢驗(yàn)可采用( Grubbs)格拉布斯檢驗(yàn)法,即T檢驗(yàn)法:將監(jiān)測數(shù)據(jù)從大到小排列,并計(jì)算其算術(shù)平均值和標(biāo)準(zhǔn)偏差s,計(jì)算T值[2]:
查T檢驗(yàn)臨界表得T的臨界值,若T≥,則可疑數(shù)據(jù)x1或xn為異常值,應(yīng)予剔除;反之則采取保留處理。依次反復(fù)計(jì)算直至無異常數(shù)據(jù)為止。
2.2.1 平均值與標(biāo)準(zhǔn)值的比較
用于檢查監(jiān)測方法或操作過程是否存在較大系統(tǒng)誤差。對(duì)標(biāo)樣進(jìn)行n次監(jiān)測,再利用T檢驗(yàn)法比較監(jiān)測結(jié)果與標(biāo)準(zhǔn)值是否存在顯著性差異[2]。
式中: 為標(biāo)準(zhǔn)值,為監(jiān)測結(jié)果,s為標(biāo)樣測定的標(biāo)準(zhǔn)偏差,n為標(biāo)樣測定的次數(shù)。根據(jù)自由度和置信度P查得T值,與計(jì)算結(jié)果進(jìn)行比較。若計(jì)算值大于T值,則存在系統(tǒng)誤差;若小于則是由偶然誤差引起的。環(huán)境監(jiān)測中置信度一般為95%。
2.2.2 兩組平均值的比較
針對(duì)同一樣品的不同組數(shù)據(jù)產(chǎn)生平均值誤差問題,先假設(shè)兩組數(shù)據(jù)方差無明顯差異(分別為和計(jì)算T值[2]:
式中:s為合并方差,n為測定次數(shù)。用P=95%,=n1+n2-2查表所得T值小于計(jì)算值,則存在顯著性差異;若大于則無。
用于比較兩組數(shù)據(jù)方差s的一致性,又稱F檢驗(yàn):求出兩組數(shù)據(jù)標(biāo)準(zhǔn)方差的平均值和 ,計(jì)算
,與F分布表中查得一定自由度下的F值進(jìn)行比較,若大于計(jì)算值則存在顯著性差異,若無則不存在。
在進(jìn)行F檢驗(yàn)法檢驗(yàn)兩組數(shù)據(jù)的精密度是否有顯著性差異時(shí),應(yīng)先確定其類型:單邊檢驗(yàn)指一組數(shù)據(jù)的方差不可能小于另一組數(shù)據(jù)的方差;而雙邊檢驗(yàn)時(shí),其顯著性水平為單邊檢驗(yàn)時(shí)的2倍,置信度變?yōu)?0%[2]。
對(duì)于n個(gè)監(jiān)測室,用同一標(biāo)準(zhǔn)方法對(duì)同一個(gè)標(biāo)準(zhǔn)樣品作m次監(jiān)測,測定結(jié)果用Cochran最大方差法檢驗(yàn)。設(shè)各自標(biāo)準(zhǔn)偏差分別為s1,s2,…,sn,最大值記為smax,計(jì)算統(tǒng)計(jì)量[2]:
根據(jù)給定的顯著性水平,實(shí)驗(yàn)室個(gè)數(shù)n,測定次數(shù)m,從數(shù)理統(tǒng)計(jì)表得最大方差檢驗(yàn)臨界值Ca:C≤C0.05時(shí)表明各實(shí)驗(yàn)室符合精密度要求;C>C0.01表明具有最大標(biāo)準(zhǔn)偏差的實(shí)驗(yàn)室精密度不符合要求;C0.05<C≤C0.01表明具有最大標(biāo)準(zhǔn)偏差的實(shí)驗(yàn)室精密度具有疑問,需再次考核以確認(rèn)。
2.5.1 標(biāo)準(zhǔn)差分析[2]
(1)對(duì)各組數(shù)據(jù)(x1,y1)分別進(jìn)行求和Ti、求差Di。將和值用于計(jì)算各監(jiān)測實(shí)驗(yàn)室數(shù)據(jù)分布的標(biāo)準(zhǔn)偏差分母除以2是由于和值中包括
兩個(gè)類似樣品的監(jiān)測結(jié)果而含有兩倍的誤差[2]。將差值用于計(jì)算隨機(jī)標(biāo)準(zhǔn)偏差
若s=sr則表明實(shí)驗(yàn)室不存在系統(tǒng)誤差。當(dāng)s>sr時(shí)需進(jìn)行方差分析:計(jì)算根據(jù)顯著性水平(0.05)和自由度查表,若F≤F0.05()時(shí),表明在95%置信水平時(shí),實(shí)驗(yàn)室的系統(tǒng)誤差對(duì)分析結(jié)果的可比性無顯著性影響;若F>F0.05()時(shí),表明實(shí)驗(yàn)室的系統(tǒng)誤差對(duì)分析結(jié)果的可比性具有顯著性影響,應(yīng)及時(shí)采取校正措施[2]。
數(shù)據(jù)融合技術(shù)是指利用計(jì)算機(jī)對(duì)按時(shí)序獲得的若干觀測信息,在一定準(zhǔn)則下加以自動(dòng)分析、綜合,以完成所需的決策和評(píng)估任務(wù)而進(jìn)行的信息處理技術(shù)。
人類通過人體器官感受外部信息,轉(zhuǎn)換成生物電,并通過人的中樞神經(jīng)傳送到大腦進(jìn)行綜合分析處理,然后對(duì)外面環(huán)境進(jìn)行判斷和控制。而多傳感器數(shù)據(jù)融合的基本原理就如同人腦綜合處理所感受的信息:利用多個(gè)傳感器感測外部環(huán)境信息,再把多個(gè)傳感器的數(shù)據(jù)根據(jù)某種準(zhǔn)則進(jìn)行組合,以獲得對(duì)被測對(duì)象的一致性解釋和描述,從而得出更為準(zhǔn)確的可信的結(jié)論。
面對(duì)大量的環(huán)境監(jiān)測任務(wù),如何科學(xué)有效地獲取數(shù)據(jù)信息是最為關(guān)鍵的一步,融合技術(shù)為我們提供了強(qiáng)有力的支持,然而這些數(shù)據(jù)在采集、利用過程中,由于傳感器采集數(shù)據(jù)的特征性差異,造成數(shù)據(jù)存在模糊性、互補(bǔ)性或矛盾性。如何有效并準(zhǔn)確地處理傳感器所采集的數(shù)據(jù)是以后研究的重點(diǎn),而這必將為環(huán)境監(jiān)測數(shù)據(jù)研究帶來重大性突破。
20世紀(jì)80年代,代表性的數(shù)據(jù)融合模型有[3-6]:英國情報(bào)環(huán)模型、美國JDL模型和Boyd控制環(huán)模型。20世紀(jì)90年代提出的“改進(jìn)的JDL模型”[3]在軍事領(lǐng)域應(yīng)用十分廣泛,還有將融合過程劃分成觀測、定位、決策、行動(dòng)及傳感器管理等階段,并組成一個(gè)大循環(huán)的“綜合模型”(Omnibus Model)[6]等。但由于以上模型均未引入自學(xué)習(xí)和多級(jí)反饋機(jī)制,使得其自適應(yīng)性和自我完善功能有待提高。
目前融合算法主要有: Kalman濾波器的改進(jìn)方法[7,8]和“數(shù)值-語言”混雜條件下的“知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘”(KDDM)[7]方法和面向分布式數(shù)據(jù)融合的支持向量機(jī)(SVM)[9]方法等。
由于Kalman 濾波方法是解決最優(yōu)化濾波問題的經(jīng)典方法,故常用于從被噪聲污染的觀測信號(hào)中消除噪聲影響,可將Kalman 濾波方法用于環(huán)境采樣數(shù)據(jù)真實(shí)值的估計(jì),在此我們以大氣監(jiān)測為例,簡單探討Kalman 濾波方法在環(huán)境監(jiān)測方面的應(yīng)用[10]。
(1)建立大氣變化狀態(tài)轉(zhuǎn)移矩陣。根據(jù)環(huán)境科學(xué)相關(guān)領(lǐng)域知識(shí),結(jié)合傳感器采集的大氣參數(shù),建立關(guān)于這些參數(shù)的大氣參數(shù)狀態(tài)轉(zhuǎn)移矩陣。利用該矩陣,研究各項(xiàng)大氣參數(shù)的變化情況。
(2)根據(jù)(1)中得到的觀測目標(biāo)屬性特征,對(duì)來自各傳感器的,反映不同污染現(xiàn)象的觀測數(shù)據(jù)進(jìn)行分析,分解出反映各種不同的污染現(xiàn)象的參數(shù)向量值。
(3)根據(jù)大氣變化狀態(tài)轉(zhuǎn)移矩陣,利用各傳感器采集的大氣參數(shù)觀察值,對(duì)各大氣采樣站點(diǎn)的環(huán)境進(jìn)行最優(yōu)化估計(jì),得到各項(xiàng)參數(shù)的最優(yōu)化估計(jì)值。
(1)對(duì)環(huán)境監(jiān)測數(shù)據(jù)的可疑值判斷和取舍方法進(jìn)行了研究,同時(shí)還探討了監(jiān)測結(jié)果的統(tǒng)計(jì)方法和實(shí)驗(yàn)室監(jiān)測質(zhì)量的統(tǒng)計(jì)方法。
(2)簡單展望了未來數(shù)據(jù)融合技術(shù)在環(huán)境監(jiān)測方面的應(yīng)用,并以大氣監(jiān)測為例進(jìn)行分析。
[1] 葉萍. 淺議環(huán)境監(jiān)測數(shù)據(jù)的審核[J]. 中國環(huán)境管理干部學(xué)院學(xué)報(bào),2010,(2):45-46.
[2] 馬彥峰,張勇. 環(huán)境監(jiān)測數(shù)據(jù)結(jié)果評(píng)價(jià)[J]. 環(huán)境保護(hù)科學(xué),2010,(1):23-25.
[3] Linas J, Bowman C, Rogova G, et al. Revisiting the JDL data fusion model Ⅱ[C]// Proceedings of the Seventh InternationalConference on Information Fusion. Stockholm, Sweden,2004, 2:1218-1230.
[4] Kalandros M K, Trailovic L, Pao L Y, et al. Tutorial on multisensor management and fusion algorithms for target tracking[C]//Proceedings of the 2004 American Control Conference. Boston,Massachusetts, 2004,5:4734-4748.
[5] 何友,王國宏,陸大金等. 多傳感器信息融合及應(yīng)用[M].北京: 電子工業(yè)出版社,2000.
[6] 潘泉,于昕,程詠梅等. 信息融合理論的基本方法與進(jìn)展[J]. 自動(dòng)化學(xué)報(bào),2003,29(4): 599-615.
[7] Gao J B, Harris C J. Some remarks on Kalman filters for the multisensor fusion[J]. Information Fusion,2002,3(3):191-201.
[8] Sun Shuli, Deng Zili. Multi-sensor optimal information fusion Kalman filter[J]. Automatica,2004,40(6): 1017-1023.
[9] Challa S, Palaniswami M, Shilton A. Distributed data fusion using support vector machines[C]//Proceedings of the 5th Intl. Conf. on Information Fusion,2002,2:881-885.
[10] 邵 斌,蔣云良,張建宏. 面向環(huán)境監(jiān)測數(shù)據(jù)的融合方法研究[J]. 心智與計(jì)算,2008,2(1):42-47 .
Processing and analysis on environmental monitoring data
Yan Hui
(Taixing Environmental Monitoring Station,Taixing,225400)
Environmental monitoring is an important means of protecting environment.With the development of science and technology, processing and analysis of monitor in data has been great improved,which prodive a strong protection for human beings. Collecting data was studied in this article,as well as analysis and research on environmental monitoring data on multiple perspectives,and investigated new methods used in the field of monitoring data.
environmental monitoring,monitoring data,data fusion
X708
A
1674-6252(2012)03-0051-04