楊國華, 馮文新, 孟 博
(1.河南地礦職業(yè)學院,鄭州 450070;2.吉林大學 新能源與環(huán)境學院,長春 130021)
地下水中的氮來源廣泛,包括大氣、雨水、污水、土壤、含水層介質、含氮化學物質、糞便等[1-5],且氮在地下水中具有很強的遷移能力[6]。查明地下水氮濃度現(xiàn)狀,了解其成因并提出相應的治理措施是十分重要的。目前地下水氮濃度調查往往通過水井獲取測試樣品,僅能得到有限個離散點的污染物濃度數(shù)據(jù)。要獲得地下水氮濃度的空間分布狀況,則需要通過空間插值手段來實現(xiàn)。ArcGIS軟件的地統(tǒng)計向導功能提供了多種內插方法,可分為確定性方法和地統(tǒng)計方法兩大類。確定性方法包括反距離權重法、徑向基函數(shù)法等;地統(tǒng)計方法包括克里金法、面插值法等[7]。
本文以中國東北某灌區(qū)的地下水氮濃度監(jiān)測數(shù)據(jù)為基礎,分別使用反距離權重法、徑向基函數(shù)插值法、普通克里金法、簡單克里金法、泛克里金法、指示克里金法、析取克里金法及經驗貝葉斯克里金法進行插值得到研究區(qū)的地下水氮濃度分布圖;在此基礎上通過比較交叉驗證方法獲取的插值預測誤差,對比不同插值方法在地下水氮濃度分析中的可行性。
東北某灌區(qū)總面積192.76 km2,整體地勢低平,東部略高,地面坡度1∶1 000~1∶2 000,區(qū)域內高平原的海拔高度為55~65 m,河谷平原的海拔高度為53~54 m,發(fā)育有沼澤濕地。區(qū)內第四紀以來一直處于間歇性下降,沉積了厚度較大(100~150 m)的第四系。地層沉積物顆粒松散,孔隙發(fā)育,為地下水的賦存創(chuàng)造了條件。
含水層由早中更新統(tǒng)至全新統(tǒng)組成。由于不同時代含水層之間沒有分布穩(wěn)定的隔水層,形成了統(tǒng)一的含水巖組,換算成涌水量變化范圍為100~5 000 m3/d。含水層上部大多覆蓋一層厚度為2~5 m的粉質黏土,從高平原向河谷漫灘粉質黏土由厚變薄,地下水類型由承壓水過渡到微承壓水至潛水,水位埋深受地貌控制:沖積河谷平原區(qū)水位埋深1~3 m,沖湖積高平原區(qū)水位埋深3~7 m。區(qū)域內,含水層厚度不均,沖湖積高平原含水層厚度為50~80 m,沖積河谷平原含水層厚度為20~30 m。
大氣降水通過部分表層粉質黏土層較薄的區(qū)域形成的“天窗”補給地下水,河流入滲、農田灌溉的渠系入滲和田間入滲,都對地下水有一定的補給作用。灌區(qū)內地下水的水力坡度為1∶5 000~1∶10 000,地下水徑流運動遲緩,徑流方向基本與地形坡向一致,總體上由南東向北西方向徑流。灌區(qū)地下水主要以側向徑流、蒸發(fā)和人工開采等方式排泄。
2017年8月,在研究區(qū)共采集了35件地下水樣品(圖1、表1),采樣井平均深度34.22 m,取樣層位在第四系巨厚孔隙含水巖組上部,所有樣品均屬于淺層地下水。從表1中可以看出:區(qū)內地下水品質的空間變異性普遍較大。基于這些采樣所獲得的離散點水質信息,需要通過適當?shù)牟逯捣椒ú拍塬@得區(qū)域上的水質分布特征。
圖1 地下水采樣點位置圖Fig.1 Sampling points of groundwater
表1 地下水樣品檢測結果統(tǒng)計特征值Table 1 Statistical characteristic values from detected groundwater samples
若一種插值方法預測的值與采樣位置的測量值相同,則稱之為精確插值器。本文選用的反距離權重法和徑向基函數(shù)插值法均是精確插值器。
反距離權重法基于相近相似性原理,用待估點周圍鄰近采樣點的值貢獻權重與距離成反比對其值進行預測,距預測位置越近的測量值對預測值的影響越大[8]。該方法具有原理易懂、便于計算的優(yōu)點,不要求數(shù)據(jù)具有一定的分布規(guī)律,在氣溫[9]、降雨量[10]的空間插值,大氣[11]、地表水[12]、地下水[5]中的污染物濃度分析等領域中均有廣泛使用。但其插值結果受數(shù)據(jù)中的極值影響很大,往往會圍繞極值點形成“牛眼”使預測結果的準確性降低,常用于進行精確插值前的預插值[8]。
徑向基函數(shù)插值法的基本思路是:插值表面必須通過每一個測得的采樣值,并使用可能己經超出樣本數(shù)據(jù)范圍的觀測值來構建具有漸變趨勢的平滑表面[13]。在土壤重金屬污染的預測中,一些學者的研究顯示應用徑向基函數(shù)插值可以取得良好效果[14-15]。
克里金(Kriging)插值法是應用于地下水模擬、土壤污染模擬、降水量模擬等領域最廣泛的插值方法[16],是一種常用的地質統(tǒng)計格網化方法[2],當數(shù)據(jù)點越多時,得到的內插結果越可信[17-19]。
常用的克里金法包括如下幾類:①當隨機變量x0的數(shù)學期望E(x0)對所有位置都是一個未知常數(shù)時,可采用普通克里金插值方法[19]。②當隨機變量x0的數(shù)學期望E(x0)對所有位置都是一個已知的常數(shù)時,可采用簡單克里金插值方法[18]。③當隨機變量x0的數(shù)學期望E(x0)是非平穩(wěn)、存在漂移時,可采用泛克里金插值法,充分利用數(shù)據(jù)點的空間相關性,并能有效解決數(shù)據(jù)邊界擴展問題[20]。④當區(qū)域化變量不服從正態(tài)或對數(shù)正態(tài)分布時,可采用指示克里金方法,該方法無需對變量的分布形態(tài)做出假設,但要求樣本數(shù)據(jù)滿足強平穩(wěn)性要求[21]。⑤當待插值數(shù)據(jù)不符合正態(tài)分布規(guī)律時,也可使用經驗貝葉斯克里金方法,該方法使用固有的隨機函數(shù)作為克里金模型,可對數(shù)據(jù)的趨勢進行校正,在處理地質層面高程估計方面具有一定的優(yōu)越性[22],但處理速度相對其他克里金法較慢。
在選取的各種插值方法中,反距離權重法和徑向基函數(shù)法作為確定性插值方法,不要求數(shù)據(jù)具有一定的分布規(guī)律,可直接使用污染物濃度測量數(shù)據(jù)進行插值。各種克里金插值法(不包含經驗貝葉斯克里金法)均需要數(shù)據(jù)在一定程度上符合正態(tài)分布的趨勢,因此如果數(shù)據(jù)不呈正態(tài)分布,應對數(shù)據(jù)進行變換使其符合正態(tài)分布。
首先利用地統(tǒng)計向導中的數(shù)據(jù)探索功能對數(shù)據(jù)進行分析,檢驗數(shù)據(jù)分布,找出離群點,防止由于測量和輸入錯誤的離群值的存在影響半變異建模。本文使用的地下水氮濃度測量數(shù)據(jù)存在少量離群值,但均屬真實值,不應去除;數(shù)據(jù)正態(tài)分布情況檢驗結果表明,研究區(qū)的地下水“三氮”污染物中,氨氮濃度較好地滿足正態(tài)分布規(guī)律,硝酸鹽氮和亞硝酸鹽氮濃度在進行了自然對數(shù)變換后更加符合正態(tài)分布規(guī)律(表2)。利用數(shù)學曲面模擬要素在空間上的分布規(guī)律及其變化趨勢,以此在建模中更準確地模擬短程隨機變異。
表2 “三氮”測量數(shù)據(jù)分布偏度、峰度系數(shù)Table 2 Distribution of skewness and kurtosis coefficients of measurement data for three kinds of nitrogen
在誤差檢驗方面,采用交叉驗證的方法,比較不同插值方法的插值預測誤差中的平均值誤差、均方根誤差、標準化平均值誤差、標準均方根誤差和平均標準誤差。具體的評判標準為:當平均值誤差和標準平均值誤差越接近0、標準均方根誤差越接近1、平均標準誤差和均方根誤差數(shù)值相差越小,表明插值結果精度越高。
采用7種插值方法得到了研究區(qū)氨氮濃度預測結果(圖2)。以GB/T 14848-93《地下水質量標準》的5類水中氨氮含量標準作為圖中填充等值線的劃分界限。因區(qū)內地下水氨氮濃度普遍較高,在Ⅴ類水氨氮質量濃度(ρ)>0.5 mg/L的基礎上增加了>2.5 mg/L的等值線來區(qū)分污染的嚴重程度。不同的插值方法得到的插值結果圖大體是相似的,均可看出區(qū)內的地下水氨氮污染狀況十分嚴重,除東部少數(shù)區(qū)域,絕大部分區(qū)域的地下水氨氮質量濃度均高于0.5 mg/L,屬于Ⅴ類水,中南部的條帶狀區(qū)域內氨氮質量濃度可達2.5 mg/L以上。
圖2 研究區(qū)地下水氨氮濃度分布圖Fig.2 Spatial distribution of ammonium concentration in groundwater in the study area
以GB/T 14848-93《地下水質量標準》的5類水中亞硝酸鹽氮含量標準為濃度等級界限,采用不同插值方法得到的研究區(qū)亞硝酸鹽氮濃度預測結果如圖3所示。簡單克里金法和指示克里金法的插值結果顯示區(qū)內亞硝酸鹽氮濃度均基本處于Ⅱ類水標準。其余各種插值方法顯示的插值結果區(qū)別不大,即由西北向東南方向亞硝酸鹽氮濃度逐漸升高,大部分地區(qū)滿足Ⅰ類水標準;東南部地區(qū)由泛克里金法顯示可達Ⅱ類水標準,反距離權重法、徑向基函數(shù)法、普通克里金法和經驗貝葉斯克里金法均顯示污染物濃度僅滿足Ⅳ類水標準。
圖3 研究區(qū)地下水亞硝酸鹽氮濃度分布圖Fig.3 Spatial distribution of nitrite nitrogen concentration in groundwater in study area
以GB/T 14848-93《地下水質量標準》的5類水中亞硝酸鹽氮含量標準為濃度等級界限,采用不同插值方法得到的研究區(qū)硝酸鹽氮濃度預測結果如圖4。區(qū)內地下水硝酸鹽氮濃度普遍符合Ⅰ類水標準;除徑向基函數(shù)法和簡單克里金法,其他插值方法的預測結果均顯示南部少量區(qū)域的硝酸鹽氮濃度處于Ⅱ、Ⅲ類水標準。
圖4 研究區(qū)地下水硝酸鹽氮濃度分布圖Fig.4 Spatial distribution of nitrate nitrogen concentration in groundwater in study area
氨氮濃度各種插值方法的誤差統(tǒng)計值如表3所示。灌區(qū)內地下水氨氮的濃度較好地符合正態(tài)分布規(guī)律,通過交叉檢驗誤差顯示出的插值精度普遍較好。根據(jù)誤差檢驗評判標準:普通克里金法標準平均誤差最接近0,標準均方根誤差最接近1;簡單克里金法平均誤差最接近0;經驗貝葉斯克里金法的均方根誤差與平均標準誤差最為接近。上述3種方法預測結果均顯示插值與測量值之間的差距小,得到了較為理想的插值結果。
表3 氨氮濃度插值檢驗誤差比較Table 3 Statistical error of different interpolation methods (ammonium)
亞硝酸鹽氮濃度各種插值方法的誤差統(tǒng)計值如表4。比較不同插值方法的檢驗誤差可以得出,普通克里金法和經驗貝葉斯克里金法的平均誤差均很接近0;普通克里金法的標準平均誤差更接近0;經驗貝葉斯克里金法的標準均方根誤差更接近1,且其平均標準誤差與均方根誤差最為接近。經驗貝葉斯克里金法是通過估計基礎半變異函數(shù)來說明所引入的誤差;而其他克里金方法通過已知的數(shù)據(jù)位置計算半變異函數(shù),由于不考慮半變異函數(shù)估計的不確定性,其他克里金方法都低估了預測的標準誤差??紤]到以上情況,綜合判斷通過經驗貝葉斯克里金法得到的亞硝酸鹽氮濃度插值結果精度最佳。
表4 亞硝酸鹽氮濃度插值檢驗誤差比較Table 4 Statistical error of different interpolation methods (nitrite)
硝酸鹽氮濃度各種插值方法的誤差統(tǒng)計值如表5。由表2可知硝酸鹽氮濃度測量數(shù)據(jù)分布不夠符合正態(tài)分布規(guī)律,在經過對數(shù)變換后有所改善,但偏度系數(shù)仍然達到1.712。硝酸鹽氮的插值結果相比于氨氮、亞硝酸鹽氮,誤差相對較大。比較不同插值方法的檢驗誤差,可見經驗貝葉斯克里金法的平均誤差較小、平均標準誤差最小、標準化均方根誤差最接近1、平均標準誤差與均方根誤差最為接近,與其他插值方法相比,經驗貝葉斯克里金法插值精度更高。
表5 硝酸鹽氮濃度插值檢驗誤差比較Table 5 Statistical error of different interpolation methods (nitrate)
本文應用ArcGIS軟件提供的插值方法對地下水氮濃度分布狀態(tài)進行分析,比較不同插值方法的檢驗誤差,可見當?shù)叵滤獫舛葴y量數(shù)據(jù)較好地符合正態(tài)分布規(guī)律時,各種空間插值方法的預測精度均較高;當數(shù)據(jù)空間變異性較大、不符合正態(tài)分布規(guī)律時,經驗貝葉斯克里金法得到的插值結果往往優(yōu)于確定性插值方法和其他克里金插值方法。因此,在實際研究區(qū)域中,地下水污染物濃度的空間插值方法應結合實測數(shù)據(jù)的特點進行選擇:污染物濃度的測量數(shù)據(jù)較好地符合正態(tài)分布規(guī)律時,考慮選擇操作簡便、運算速度快的插值方法即可;當數(shù)據(jù)空間變異性較大、正態(tài)分布規(guī)律不顯著時,可優(yōu)先考慮選用經驗貝葉斯克里金法,以提高結果的可靠性。
數(shù)據(jù)獲取不充分,在地學領域是普遍存在的問題[22],基于數(shù)據(jù)規(guī)律選擇適宜的空間插值方法只是解決問題的一種技術手段;加深對地下水污染成因與演化規(guī)律的理解和認識,才是保障空間插值結果科學性的根本保障。下一步工作將研究如何把地下水污染形成與演化的主要控制因素(地質條件、水文地質條件等)納入空間插值體系中,以進一步提高插值結果的可靠性。