国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向土壤環(huán)境質(zhì)量等級(jí)劃分的統(tǒng)計(jì)推斷與加密采樣優(yōu)化方法研究綜述

2021-05-25 06:30高秉博郝朝展李發(fā)東胡茂桂李曉嵐郜允兵潘瑜春
關(guān)鍵詞:樣點(diǎn)土壤環(huán)境環(huán)境質(zhì)量

高秉博,郝朝展,李發(fā)東,胡茂桂,李曉嵐,郜允兵,潘瑜春

(1.中國(guó)農(nóng)業(yè)大學(xué)土地科學(xué)與技術(shù)學(xué)院,北京100083;2.農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)災(zāi)害遙感重點(diǎn)實(shí)驗(yàn)室,北京100083;3.中國(guó)科學(xué)院地理科學(xué)與資源研究所,北京100011;4.國(guó)家農(nóng)業(yè)信息化工程技術(shù)研究中心,北京100097)

嚴(yán)格精準(zhǔn)的環(huán)境管理與治理是實(shí)現(xiàn)生態(tài)文明與可持續(xù)發(fā)展戰(zhàn)略的必由之路。為了加強(qiáng)生態(tài)環(huán)境保護(hù),我國(guó)陸續(xù)發(fā)布了《大氣污染防治行動(dòng)計(jì)劃》《土壤污染防治行動(dòng)計(jì)劃》和《水污染防治行動(dòng)計(jì)劃》,部署了環(huán)境管理治理任務(wù)與目標(biāo)。將環(huán)境按照污染程度劃分為不同等級(jí)以實(shí)施差別化管理與治理是我國(guó)環(huán)境管控的基本策略,同時(shí)不同污染等級(jí)的面積變化監(jiān)測(cè)也是考核責(zé)任主體的主要手段。因此,環(huán)境質(zhì)量等級(jí)劃分是環(huán)境管理與治理的一項(xiàng)基本需求[1]。

在土壤環(huán)境質(zhì)量調(diào)查和監(jiān)測(cè)中,空間采樣是目前最主要的手段。統(tǒng)計(jì)推斷是采樣的目的,決定采樣點(diǎn)布局優(yōu)化方法的選擇。土壤環(huán)境質(zhì)量等級(jí)劃分是不同于均值估計(jì)、空間插值和熱點(diǎn)探測(cè)的一種特殊的統(tǒng)計(jì)推斷,其目的是準(zhǔn)確估計(jì)未采樣單元處污染物濃度與等級(jí)劃分閾值之間的關(guān)系。由于空間相關(guān)性的存在,土壤環(huán)境質(zhì)量等級(jí)在空間上的分布具有連續(xù)性,因此土壤環(huán)境質(zhì)量等級(jí)劃分的目的可以轉(zhuǎn)化為確定不同環(huán)境質(zhì)量等級(jí)間的邊界。由于常規(guī)調(diào)查監(jiān)測(cè)一般服務(wù)于多個(gè)目標(biāo)且樣點(diǎn)分布較為稀疏,為了提高土壤環(huán)境質(zhì)量等級(jí)邊界劃分的準(zhǔn)確性,通常需要在等級(jí)錯(cuò)誤劃分發(fā)生概率較大的地區(qū)進(jìn)一步開展專項(xiàng)加密采樣。但是由于其目標(biāo)的特殊性,土壤環(huán)境質(zhì)量等級(jí)劃分需要具有針對(duì)性的統(tǒng)計(jì)推斷與加密采樣布局優(yōu)化方法,以提高采樣效率與等級(jí)劃分精度[2]。

本文梳理了土壤環(huán)境質(zhì)量等級(jí)劃分統(tǒng)計(jì)推斷與加密采樣布局優(yōu)化方法的研究進(jìn)展,對(duì)比了理論方法的優(yōu)勢(shì)與不足,歸納了以等級(jí)劃分為目的的統(tǒng)計(jì)推斷方法與加密采樣布局優(yōu)化方法體系,并探討了下一步研究的方向。

1 空間采樣布局優(yōu)化與統(tǒng)計(jì)推斷之間的關(guān)系

采樣,也稱為抽樣,通常指從研究對(duì)象全體中抽取一部分進(jìn)行試驗(yàn)和觀察,并獲取試驗(yàn)數(shù)據(jù)的工作[3-4]。為了獲得精度更高的土壤環(huán)境質(zhì)量等級(jí)劃分圖(即獲得研究區(qū)域中每個(gè)空間單元上污染物的環(huán)境質(zhì)量等級(jí)),空間采樣和統(tǒng)計(jì)推斷仍然是目前最重要的方法。統(tǒng)計(jì)推斷是采樣的目的,指基于樣本數(shù)據(jù)對(duì)產(chǎn)生樣本總體的某些性質(zhì)以概率的形式進(jìn)行推斷,從而獲得對(duì)總體的認(rèn)知??臻g采樣是土壤環(huán)境調(diào)查和監(jiān)測(cè)的常用手段[5-8]。De Gruijter 等[9]認(rèn)為,一個(gè)空間采樣方案由樣本布設(shè)和統(tǒng)計(jì)推斷兩部分組成,并將這些方法分為基于設(shè)計(jì)的方法和基于模型的方法兩大類?;谠O(shè)計(jì)的方法由概率采樣和基于設(shè)計(jì)的統(tǒng)計(jì)推斷方法組成,適用于獲得總體參數(shù)的估計(jì),如均值、標(biāo)準(zhǔn)差等全局變量;基于模型的方法由目的性采樣和基于模型的統(tǒng)計(jì)推斷組成,適合估計(jì)與具體位置相關(guān)的污染物濃度,如空間插值、熱點(diǎn)探測(cè)和等級(jí)劃分等[10-11]。而空間采樣與統(tǒng)計(jì)推斷三一準(zhǔn)則(Trinity principle of spatial sampling and statistical inference)認(rèn)為,調(diào)查精度由總體特征、樣本布設(shè)方式、統(tǒng)計(jì)推斷模型,以及三者之間的匹配關(guān)系所決定[12-13],不同的組合方法有不同的效率。因此,在具體土壤環(huán)境等級(jí)劃分中,需要根據(jù)具體的統(tǒng)計(jì)推斷目標(biāo)、樣本布設(shè)方式和研究區(qū)域變量特征制定合適的采樣設(shè)計(jì)方法。本文依據(jù)空間采樣與統(tǒng)計(jì)推斷三一準(zhǔn)則分析歸納面向土壤環(huán)境質(zhì)量等級(jí)劃分的統(tǒng)計(jì)推斷與加密采樣布局優(yōu)化方法。

2 土壤環(huán)境質(zhì)量等級(jí)劃分統(tǒng)計(jì)推斷方法

2.1 方法體系

環(huán)境質(zhì)量等級(jí)劃分方法可以按照等級(jí)劃分依據(jù)分為物理閾值法和概率閾值法兩類,如表1 所示。物理閾值方法首先對(duì)研究區(qū)域中每個(gè)空間單元的污染物濃度進(jìn)行估計(jì),然后通過對(duì)比估計(jì)值與物理閾值的大小確定待估計(jì)單元的環(huán)境質(zhì)量等級(jí)。概率閾值方法則首先估計(jì)每個(gè)單元不超過物理閾值的概率,然后將所估計(jì)概率值與設(shè)定的概率閾值對(duì)比確定待估計(jì)單元的環(huán)境質(zhì)量等級(jí)。物理閾值法和概率閾值法都需要對(duì)研究區(qū)域的每個(gè)空間單元進(jìn)行估計(jì)。物理閾值法主要包括確定性方法、地統(tǒng)計(jì)方法、模糊數(shù)學(xué)方法和機(jī)器學(xué)習(xí)法。地統(tǒng)計(jì)方法按照估計(jì)的方式可以進(jìn)一步分為物理值估計(jì)方法和不確定性估計(jì)方法[14-15]。物理值估計(jì)方法主要目標(biāo)是根據(jù)樣點(diǎn)估計(jì)環(huán)境變量在待估計(jì)單元的取值及其估計(jì)誤差,如普通克里金、回歸克里金和協(xié)同克里金等方法[16-20]。關(guān)于土壤環(huán)境物理值估計(jì)方法更全面的綜述,請(qǐng)參見Goovaerts[21]、Li等[17-18]和史文嬌等[22-23]的文章。不確定性估計(jì)的目標(biāo)主要是構(gòu)建待估計(jì)單元處污染物濃度的概率分布,該類方法可進(jìn)一步分為參數(shù)法和非參數(shù)法兩類。參數(shù)法通過假設(shè)待估計(jì)單元處污染物濃度的概率分布模型,并使用樣本計(jì)算概率分布的關(guān)鍵參數(shù)如期望方差等,構(gòu)建待估計(jì)單元處隨機(jī)變量的概率分布。最常用的方法為multi-Gaussian 模型,它假設(shè)環(huán)境變量服從正態(tài)分布,并使用簡(jiǎn)單克里金的估計(jì)值和估計(jì)誤差作為正態(tài)分布的期望和方差[21,24]。非參數(shù)方法并不預(yù)先假設(shè)待估計(jì)單元處環(huán)境變量分布的形式,只估計(jì)一些關(guān)鍵閾值所對(duì)應(yīng)的累積概率,必要時(shí)使用內(nèi)插和外插方法生成完整的累積概率分布函數(shù)[25]。模糊數(shù)學(xué)方法采用模糊隸屬函數(shù)量化采樣點(diǎn)與待估計(jì)單元之間環(huán)境相似程度,并據(jù)此進(jìn)行土壤屬性插值,是一種基于地理環(huán)境相似性的非監(jiān)督學(xué)習(xí)方法。構(gòu)建模糊隸屬函數(shù)需要兩種知識(shí)[26]:第一種類型稱為Ⅰ型知識(shí),定義特定土壤屬性的典型環(huán)境條件;第二種類型稱為Ⅱ型知識(shí),定義了環(huán)境條件偏差帶來的土壤屬性變化,具體可參見Zhu等[26]、Yang等[27]、謝軍等[28]的文章。機(jī)器學(xué)習(xí)法即統(tǒng)計(jì)模型的算法化,采用各種不同形式的基函數(shù)開展監(jiān)督學(xué)習(xí),并權(quán)衡訓(xùn)練樣本擬合精度與模型泛化能力,如隨機(jī)森林、提升樹、人工神經(jīng)元網(wǎng)絡(luò)模型等,通過學(xué)習(xí)訓(xùn)練建立相關(guān)輔助變量與環(huán)境變量之間的關(guān)系以估算污染物濃度的空間分布[29-31]。

2.2 方法對(duì)比分析

環(huán)境質(zhì)量等級(jí)劃分方法比較分析如表2 所示??傮w而言,物理閾值法由于需要首先估計(jì)未采樣單元處污染物濃度,而不是直接估計(jì)環(huán)境質(zhì)量等級(jí),因此會(huì)引入額外的步驟與誤差;而概率閾值可以直接判定未采樣單元處污染物濃度與等級(jí)劃分閾值之間的關(guān)系。在物理閾值法中,確定性方法雖然易于理解、參數(shù)較少且魯棒性較強(qiáng),但是用于環(huán)境質(zhì)量等級(jí)劃分和加密采樣空間布局優(yōu)化時(shí)存在明顯不足。由于在土壤環(huán)境中經(jīng)常面臨研究對(duì)象知識(shí)掌握不全面且數(shù)據(jù)不足的情況,難以建立準(zhǔn)確的確定性模型進(jìn)行估計(jì),因此每個(gè)估計(jì)結(jié)果都存在誤差。而確定性方法不能給出計(jì)算結(jié)果的不確定性程度,同時(shí)也不能依據(jù)區(qū)域空間變異進(jìn)行計(jì)算參數(shù)的自適應(yīng)調(diào)整,因此不能有效指導(dǎo)土壤環(huán)境管理[32]。地統(tǒng)計(jì)方法能夠?qū)崿F(xiàn)插值參數(shù)的自適應(yīng)調(diào)整,給出插值結(jié)果及其不確定性,而且其中的協(xié)同克里金、回歸克里金等方法還能利用輔助變量信息提高插值精度。但是其中的物理值估計(jì)方法在用于指導(dǎo)土壤環(huán)境質(zhì)量等級(jí)劃分時(shí)也存在明顯不足:一方面,由于其估計(jì)值存在平滑效應(yīng),在處理較大或較小閾值的等級(jí)劃分時(shí)存在較大誤差,甚至?xí)斐蓜澐纸Y(jié)果中等級(jí)的丟失;另一方面,其估計(jì)誤差假設(shè)為正態(tài)分布,且假設(shè)誤差只與樣點(diǎn)位置有關(guān),難以符合實(shí)際情況,不能準(zhǔn)確反映估計(jì)結(jié)果與閾值關(guān)系的不確定性[33]。而其中的不確定性估計(jì)方法用于估計(jì)空間單元污染物濃度時(shí),需要首先計(jì)算獲得其概率分布,然后基于概率分布估計(jì)污染物濃度,如使用期望估計(jì)(E-type estimate)、中位數(shù)估計(jì)(Median esti?mates)和百分位數(shù)估計(jì)(Quantile estimates)等損失函數(shù)(Loss function)對(duì)污染物濃度進(jìn)行優(yōu)化估計(jì)[21,34]。在優(yōu)化估計(jì)過程中需要完整的累積概率分布模型,而參數(shù)法由于其較強(qiáng)的分布假設(shè)難以獲得較好的結(jié)果,非參數(shù)法則會(huì)因需要概率內(nèi)插和外插而引入較大的誤差。模糊數(shù)學(xué)方法能夠充分利用先驗(yàn)知識(shí)和土壤環(huán)境相關(guān)輔助數(shù)據(jù)提高土壤屬性的插值精度,同時(shí)也能給出對(duì)插值結(jié)果的不確定性估計(jì),但是該方法通常過分依賴先驗(yàn)知識(shí),沒有進(jìn)行樣本的監(jiān)督訓(xùn)練,而且對(duì)空間位置關(guān)系的考慮不足。機(jī)器學(xué)習(xí)法的優(yōu)勢(shì)在于有效處理多維多類型輔助變量,能充分挖掘利用輔助變量與環(huán)境變量之間的相關(guān)關(guān)系提高插值精度,部分方法還能給出插值結(jié)果的不確定性,目前已經(jīng)成為數(shù)字土壤制圖的主流方法。不足之處在于目前的機(jī)器學(xué)習(xí)方法需要較大樣本量進(jìn)行模型訓(xùn)練,目前尚不能有效融合空間相關(guān)性與異質(zhì)性解決稀疏樣點(diǎn)條件下的插值精度問題[35-36]。

表1 環(huán)境質(zhì)量等級(jí)劃分方法體系Table 1 Environmental quality classification method system

表2 土壤環(huán)境質(zhì)量等級(jí)劃分方法比較分析Table 2 Comparison of soil environmental quality classification methods

概率閾值法由于需要獲得關(guān)于物理閾值的概率,只能與不確定性估計(jì)方法結(jié)合進(jìn)行環(huán)境質(zhì)量等級(jí)劃分。其中非參數(shù)方法由于沒有較強(qiáng)的分布假設(shè),同時(shí)在等級(jí)劃分時(shí)只需要閾值所對(duì)應(yīng)的累積概率,因此更適 合 用 于 環(huán) 境 質(zhì) 量 等 級(jí) 劃 分[32,37]。Antunes 等[38]和Chica-Olmo 等[39]探討了基于概率閾值方法的空間等級(jí)劃分,但是這些研究?jī)H止步于將環(huán)境質(zhì)量等級(jí)劃分問題轉(zhuǎn)化為基于概率閾值的等級(jí)劃分問題,而對(duì)于如何確定概率閾值并沒有給出有效的解決方案。高秉博[40]提出了基于指示克里金估計(jì)概率及其不確定性的土壤環(huán)境等級(jí)錯(cuò)誤劃分方法,建議概率閾值以0.5為基礎(chǔ),依據(jù)實(shí)際需求進(jìn)行調(diào)整,但未給出定量的確定方法。Gao等[41]在此基礎(chǔ)上提出了基于交叉檢驗(yàn)的自適應(yīng)概率閾值確定方法,如圖1 所示,通過設(shè)定不同的概率閾值并進(jìn)行交叉檢驗(yàn),獲得研究區(qū)域環(huán)境質(zhì)量等級(jí)劃分的第一類錯(cuò)誤、第二類錯(cuò)誤和總錯(cuò)誤隨概率閾值變化的曲線,并依據(jù)曲線的特征點(diǎn)確定概率閾值,如總錯(cuò)誤曲線最低點(diǎn)、第一類錯(cuò)誤曲線與第二類錯(cuò)誤曲線交叉點(diǎn)等。該方法能夠適應(yīng)不同區(qū)域數(shù)據(jù)分布的特點(diǎn),提供了一種定量確定概率預(yù)知的方法。李曉嵐等[42]將該方法拓展到時(shí)空維,基于時(shí)空克里金統(tǒng)計(jì)推斷結(jié)果與概率閾值自適應(yīng)確定方法,完成了北京市農(nóng)田土壤重金屬含量的等級(jí)劃分。

3 土壤環(huán)境質(zhì)量等級(jí)劃分加密采樣布局優(yōu)化方法

3.1 方法體系

當(dāng)多階段采樣或補(bǔ)充調(diào)查需要額外的加密樣本時(shí),采樣布局優(yōu)化尤其重要。為了提高土壤環(huán)境質(zhì)量等級(jí)劃分的精確性,應(yīng)優(yōu)化采樣布局,使用更少的樣點(diǎn)獲得更高的等級(jí)劃分精度。采樣方法是否適合取決于采樣的目標(biāo),當(dāng)以土壤環(huán)境質(zhì)量等級(jí)劃分作為統(tǒng)計(jì)推斷目標(biāo)時(shí),不需要強(qiáng)調(diào)每個(gè)空間單元的污染物濃度或全局平均濃度的估計(jì)精度,而需要精確估計(jì)未采樣單元上污染物濃度與等級(jí)劃分閾值之間的大小關(guān)系,以實(shí)現(xiàn)對(duì)土壤環(huán)境質(zhì)量等級(jí)的準(zhǔn)確劃分。由于土壤環(huán)境變量的空間自相關(guān)性,土壤環(huán)境質(zhì)量等級(jí)在地理空間上具有連續(xù)性,因此加密采樣時(shí)應(yīng)該將更多樣點(diǎn)布設(shè)在等級(jí)過渡地帶[32]。按照加密采樣布局優(yōu)化目標(biāo)設(shè)定的依據(jù),可以將環(huán)境質(zhì)量等級(jí)劃分加密采樣布局優(yōu)化方法分為估計(jì)值準(zhǔn)確度和等級(jí)劃分精確度兩類,具體如表3所示。

依據(jù)估計(jì)值準(zhǔn)確度加密采樣布局優(yōu)化方法包括隨機(jī)采樣和目的性采樣。隨機(jī)采樣中分層隨機(jī)抽樣在實(shí)際中應(yīng)用比較廣泛,它基于先驗(yàn)知識(shí)、歷史調(diào)查數(shù)據(jù)或輔助數(shù)據(jù),首先將研究區(qū)劃分為內(nèi)部方差較小的若干個(gè)較為均質(zhì)的子區(qū)域,然后為每個(gè)子區(qū)域分配樣本量并分別布設(shè)樣點(diǎn)。目的性采樣方法主要通過設(shè)定優(yōu)化目標(biāo)函數(shù)并使用優(yōu)化求解方法生成采樣布局方案[43]。常見方法可以分為統(tǒng)計(jì)推斷誤差最小優(yōu)化方法、地理空間分布優(yōu)化方法、特征空間分布優(yōu)化方法、地理空間與特征空間分布同步優(yōu)化方法四類[44]。統(tǒng)計(jì)推斷誤差最小優(yōu)化方法一般以最小、最大或者平均統(tǒng)計(jì)推斷誤差作為優(yōu)化目標(biāo)函數(shù)進(jìn)行優(yōu)化布樣,如普通克里金誤差[45-47]、協(xié)同克里金誤差[48]、泛克里金插值誤差[5,49]、泛協(xié)克里金誤差[7]和非均質(zhì)表面估計(jì)模型誤差(Mean of Surface with Nonhomogene?ity,MSN)[2]等。地理空間分布優(yōu)化方法通過設(shè)計(jì)候選樣點(diǎn)與待估計(jì)點(diǎn)之間的距離函數(shù)并將距離函數(shù)作為優(yōu)化目標(biāo),常見的目標(biāo)函數(shù)包括平均最短距離最?。∕inimization of the Mean of the Shortest Distances,MMSD)[50]、加權(quán)平均最短距離最?。╓eighted Mean of the Shortest Distances,WMSD)[51]、均方距離準(zhǔn)則(Mean squared distance to sides,vertices,and boundaries)[52],還包括同時(shí)優(yōu)化插值制圖精度與半變異函數(shù)精度的組合方法,如Simbahan 等[53]提出結(jié)合MMSD 與WM準(zhǔn)則(Warrick-Myers criterion)[54]的樣點(diǎn)空間分布優(yōu)化方法。特征空間分布優(yōu)化方法主要優(yōu)化樣點(diǎn)在輔助變量組成的特征空間中的分布,如按照輔助變量分布比例分層的等間距分層設(shè)計(jì)(Equal Range Stratification design,ER design)[55],特征空間等概率間距分層與優(yōu)化覆蓋的拉丁超立方體方法(Latin Hypercube Sampling,LHS)[56]及條件拉丁超立方體方法(Conditioned Latin Hypercube Sampling,cLHS)[57]。地理空間與特征空間分布同步優(yōu)化方法同時(shí)優(yōu)化樣點(diǎn)在地理空間與特征空間的分布,解決空間非平穩(wěn)區(qū)域變量插值的采樣優(yōu)化問題,包括基于輔助變量的方差四叉樹分步優(yōu)化方法(Variance Quad-tree)[58]和地理空間與特征空間同步優(yōu)化的空間條件拉超立方體方法(Spatial Conditioned Latin Hypercube Sampling method,SCLHS)[2]等。

表3 土壤環(huán)境質(zhì)量等級(jí)劃分加密采樣布局優(yōu)化方法體系Table 3 Soil environment quality grade with additional sampling layout optimization method system

等級(jí)劃分精確度加密采樣布局優(yōu)化方法直接以等級(jí)劃分精確度為采樣優(yōu)化目標(biāo),主要分為基于等級(jí)估計(jì)結(jié)果的布樣方法和基于等級(jí)估計(jì)結(jié)果及其不確定性的布樣方法。前者使用前階段獲取的樣本數(shù)據(jù)估計(jì)未采樣單元屬于某一環(huán)境質(zhì)量等級(jí)的概率,并基于該概率指導(dǎo)加密樣點(diǎn)布設(shè)。如Garcia 等[59]認(rèn)為,在使用非參數(shù)估計(jì)方法指導(dǎo)布樣時(shí),概率值低于0.2、高于0.8 的位置不大可能出現(xiàn)等級(jí)錯(cuò)劃的情況,因此需要重點(diǎn)在概率值介于0.2~0.8 之間的區(qū)域進(jìn)行采樣。該類方法忽略了等級(jí)概率估計(jì)本身的不確定性,同時(shí)劃定的采樣范圍較大,效率不高。后者綜合考慮等級(jí)估計(jì)結(jié)果及其不確定性指導(dǎo)樣點(diǎn)布設(shè)。如Van Meir?venne 等[32]提出的基于條件模擬的加密采樣方法,該方法首先基于前期樣本數(shù)據(jù)產(chǎn)生大量的模擬數(shù)據(jù),以模擬值與閾值差異的(累積概率的)標(biāo)準(zhǔn)差和期望之比來衡量等級(jí)劃分的不確定性,用于指導(dǎo)加密采樣布局優(yōu)化。該方法在估計(jì)中需要進(jìn)行大量的條件模擬計(jì)算,同時(shí)還需要完整的累積概率分布函數(shù),會(huì)引入累積概率分布函數(shù)內(nèi)插和外插的誤差。Juang 等[60]基于階次地統(tǒng)計(jì)提出了包含等級(jí)劃分中第一類和第二類錯(cuò)誤的錯(cuò)劃指數(shù),高效地綜合了等級(jí)估計(jì)結(jié)果及其不確定性。但是在該方法中物理閾值需被轉(zhuǎn)化為標(biāo)準(zhǔn)階次并在標(biāo)準(zhǔn)階次中進(jìn)行計(jì)算分析,在將物理閾值轉(zhuǎn)化為標(biāo)準(zhǔn)階次時(shí)會(huì)帶來較大誤差,如果樣本在特征空間的代表性較差,則會(huì)從根本上影響該方法的準(zhǔn)確性[61]。另外,該方法固定以估計(jì)值上下3 倍的標(biāo)準(zhǔn)差作為兩類錯(cuò)誤的置信區(qū)間,不能基于具體需求調(diào)整對(duì)兩類錯(cuò)誤的偏好。Gao等[62]基于多高斯模型提出了針對(duì)正態(tài)分布(或能夠轉(zhuǎn)化為正態(tài)分布)數(shù)據(jù)的等級(jí)劃分錯(cuò)誤指數(shù),基于克里插值結(jié)果、誤差方差和物理閾值量化發(fā)生等級(jí)劃分錯(cuò)誤的概率,如公式(1)所示。

Index=G(threshold,z?0,δ2)/G(z?0,z?0,δ2) (1)式中:G為高斯分布函數(shù);threshold為等級(jí)劃分的概率閾值;z?0為克里金插值結(jié)果;δ2插值的誤差方差。

如圖2 所示,其中藍(lán)色與綠色曲線為由待估計(jì)點(diǎn)的插值結(jié)果和估計(jì)方差確定的歸一化高斯分布,紅色豎線為等級(jí)劃分物理閾值(90 mg·kg-1),其中圖2(a)為估計(jì)結(jié)果相同但估計(jì)誤差不同的兩點(diǎn)的等級(jí)劃分錯(cuò)誤指數(shù),圖2(b)為估計(jì)誤差相同但估計(jì)結(jié)果不同的兩點(diǎn)的等級(jí)劃分錯(cuò)誤指數(shù),由圖可知,估計(jì)結(jié)果越接近閾值且估計(jì)誤差越大,越容易發(fā)生等級(jí)劃分錯(cuò)誤。Gao等[62]定義了基于該指數(shù)的等級(jí)劃分加密采樣優(yōu)化目標(biāo)函數(shù),并基于空間模擬退火方法(Spatial Simulated Annealing,SSA)實(shí)現(xiàn)了加密樣點(diǎn)位置優(yōu)化布設(shè)。

由于土壤環(huán)境數(shù)據(jù)經(jīng)常不符合正態(tài)分布并且難以轉(zhuǎn)化為正態(tài)分布,Gao 等[41]基于指示克里金估計(jì)結(jié)果及其不確定性構(gòu)建了等級(jí)劃分錯(cuò)誤指數(shù),如公式(2)所示,它由閾值錯(cuò)劃指數(shù)和誤差錯(cuò)劃指數(shù)兩部分組成,閾值錯(cuò)劃指數(shù)反映了累積概率估計(jì)值與閾值的接近程度,如圖3(a);誤差錯(cuò)劃指數(shù)反映了累積概率估計(jì)值的不確定性,如圖3(b);由于概率分布的分布為均勻分布,因此使用線性相加的方式組合閾值錯(cuò)劃指數(shù)與誤差錯(cuò)劃指數(shù)形成綜合錯(cuò)劃指數(shù),如圖3(c)。

Gao 等[41]進(jìn)一步推薦采用平均錯(cuò)劃指數(shù)最小、最大錯(cuò)劃指數(shù)最小等作為優(yōu)化目標(biāo)函數(shù),采用圖1 的自適應(yīng)方法確定概率閾值,并基于優(yōu)化算法進(jìn)行土壤等級(jí)劃分加密采樣布局優(yōu)化?;诙喔咚鼓P偷牡燃?jí)劃分錯(cuò)誤指數(shù)和基于指示克里金的等級(jí)劃分錯(cuò)誤指數(shù)分別針對(duì)正態(tài)分布數(shù)據(jù)和非正態(tài)分布數(shù)據(jù),通過簡(jiǎn)單的數(shù)學(xué)變換綜合考慮估計(jì)結(jié)果與閾值關(guān)系的不確定性,能夠刻畫出土壤環(huán)境質(zhì)量等級(jí)可能的邊界,可在多階段采樣或補(bǔ)充調(diào)查的加密采樣布局優(yōu)化中選用。

3.2 方法對(duì)比分析

環(huán)境質(zhì)量等級(jí)劃分方法比較分析如表4 所示。分層隨機(jī)抽樣能夠考慮環(huán)境變量的分層異質(zhì)性,提高樣本代表性,但是關(guān)注樣點(diǎn)對(duì)整個(gè)區(qū)域的代表性,不能重點(diǎn)關(guān)注等級(jí)過渡地帶,因此適用于均值估計(jì),而不適用于等級(jí)劃分。在目的性抽樣方法中,統(tǒng)計(jì)推斷誤差最小優(yōu)化方法能夠充分利用統(tǒng)計(jì)推斷模型及參數(shù)直接提高樣點(diǎn)布設(shè)效率;地理空間分布優(yōu)化方法基于空間自相關(guān)性指導(dǎo)樣點(diǎn)布設(shè),不需要先驗(yàn)知識(shí)和輔助數(shù)據(jù);特征空間分布優(yōu)化方法能夠充分利用相關(guān)輔助變量指導(dǎo)樣點(diǎn)布設(shè),提高樣本對(duì)環(huán)境變量變化特征的代表性;而地理空間與特征空間分布同步優(yōu)化方法則兼顧了地理空間與特征空間分布,能夠同時(shí)提高樣本對(duì)地理空間和變量變化特征的代表性。但是總體而言,依據(jù)估計(jì)值準(zhǔn)確度加密采樣布局優(yōu)化方法沒有考慮土壤環(huán)境質(zhì)量等級(jí)劃分加密采樣優(yōu)化的特殊性,不能重點(diǎn)關(guān)注等級(jí)過渡地帶。而在土壤環(huán)境質(zhì)量等級(jí)劃分加密采樣布局設(shè)計(jì)中,由于空間自相關(guān)性的存在,空間單元的質(zhì)量等級(jí)具有空間連續(xù)性,在等級(jí)過渡地帶(即在值域上接近閾值的區(qū)域)更容易發(fā)生等級(jí)錯(cuò)劃,應(yīng)加密樣點(diǎn);而在遠(yuǎn)離過渡地帶(即在值域上遠(yuǎn)小于或大于閾值)的區(qū)域,增加過多的樣點(diǎn)無益于等級(jí)劃分準(zhǔn)確性的提高[32]。因此,依據(jù)估計(jì)值準(zhǔn)確度的加密采樣方法效率較低,適用于土壤環(huán)境質(zhì)量空間插值,而不適用于土壤環(huán)境質(zhì)量等級(jí)劃分。

依據(jù)等級(jí)劃分精確度的加密采樣布局優(yōu)化方法直接以等級(jí)劃分精確度為采樣優(yōu)化目標(biāo),將樣點(diǎn)布設(shè)在容易發(fā)生等級(jí)錯(cuò)誤劃分的區(qū)域[2]。其中基于等級(jí)估計(jì)結(jié)果的加密采樣布局優(yōu)化方法,使用前階段采樣數(shù)據(jù)估計(jì)每個(gè)空間單元等級(jí)概率并據(jù)此進(jìn)行加密樣點(diǎn)布設(shè),側(cè)重于在等級(jí)過渡地帶進(jìn)行加密布點(diǎn)。但是由于前階段采樣的樣本量不足,導(dǎo)致對(duì)等級(jí)概率的估計(jì)存在不確定性,而該類方法忽略了等級(jí)概率估計(jì)本身的不確定性,會(huì)導(dǎo)致等級(jí)過渡帶劃分不夠精細(xì)和準(zhǔn)確?;诘燃?jí)估計(jì)結(jié)果及其不確定性估計(jì)的加密采樣布局優(yōu)化方法,在劃定不同環(huán)境質(zhì)量等級(jí)過渡帶時(shí)綜合考慮了等級(jí)概率估計(jì)結(jié)果及其不確定性,能夠獲得較合理的等級(jí)錯(cuò)誤劃分概率,進(jìn)而提高加密采樣的布設(shè)效率。目前該類方法不足之處在于未充分利用多維輔助變量信息,提高加密樣點(diǎn)布設(shè)效率。

表4 環(huán)境質(zhì)量等級(jí)劃分加密采樣布局優(yōu)化方法體系Table 4 Soil environment quality grade with additional sampling layout optimization method system

4 結(jié)論與展望

4.1 結(jié)論

目前,土壤環(huán)境質(zhì)量等級(jí)劃分統(tǒng)計(jì)推斷與加密采樣布局優(yōu)化研究已經(jīng)取得了較大進(jìn)展。環(huán)境質(zhì)量等級(jí)劃分統(tǒng)計(jì)推斷方法可以分為物理閾值法和概率閾值法,兩類方法各有優(yōu)缺點(diǎn)。其中物理閾值法由于需要首先精確估計(jì)未采樣點(diǎn)的含量,而不是直接估計(jì)環(huán)境質(zhì)量等級(jí),因此會(huì)引入額外的步驟與誤差。而概率閾值法直接以環(huán)境質(zhì)量等級(jí)估計(jì)為目標(biāo),其中非參數(shù)估計(jì)不需要完整的概率分布,只需要估計(jì)與等級(jí)劃分閾值大小關(guān)系的概率,更加適合土壤環(huán)境質(zhì)量等級(jí)劃分。對(duì)應(yīng)于兩類環(huán)境質(zhì)量等級(jí)劃分統(tǒng)計(jì)推斷方法,加密采樣布局優(yōu)化也可以分為依據(jù)估計(jì)值準(zhǔn)確度和等級(jí)劃分精確度的兩類方法。前者以研究區(qū)域各個(gè)空間單元處污染物濃度精確估計(jì)為目標(biāo),對(duì)整個(gè)研究區(qū)域同等對(duì)待,未針對(duì)等級(jí)邊界,采樣效率較低。后者以降低等級(jí)劃分錯(cuò)誤為目標(biāo),重點(diǎn)將樣點(diǎn)布設(shè)在等級(jí)邊界過渡地帶,具有更好的采樣效率。其中基于等級(jí)估計(jì)結(jié)果的布樣方法僅采用候選樣點(diǎn)屬于某一環(huán)境質(zhì)量等級(jí)的估計(jì)概率指導(dǎo)加密樣點(diǎn)布設(shè),未考慮估計(jì)概率的不確定性。而基于等級(jí)估計(jì)結(jié)果及其不確定性估計(jì)的布樣方法,綜合考慮了具有不確定性參數(shù)的估計(jì)值與等級(jí)劃分閾值的關(guān)系,能夠刻畫出土壤環(huán)境質(zhì)量等級(jí)之間可能的邊界帶,為多階段采樣或補(bǔ)充調(diào)查的加密樣調(diào)查提供加密采樣布局優(yōu)化方案。

4.2 展望

雖然土壤環(huán)境質(zhì)量等級(jí)劃分統(tǒng)計(jì)推斷與加密采樣布局優(yōu)化方法已經(jīng)初步形成一套理論方法體系,但是土壤環(huán)境質(zhì)量空間格局復(fù)雜,影響因素多樣,為了能進(jìn)一步滿足土壤環(huán)境質(zhì)量等級(jí)劃分實(shí)際工作需求,作者認(rèn)為還需要進(jìn)一步研究解決以下三方面的問題:

(1)土壤環(huán)境相關(guān)輔助數(shù)據(jù)使用問題:隨著土壤環(huán)境相關(guān)數(shù)據(jù)的積累,如何在土壤環(huán)境質(zhì)量等級(jí)劃分的加密采樣布局優(yōu)化和統(tǒng)計(jì)推斷中充分應(yīng)用輔助數(shù)據(jù),以提高采樣效率和等級(jí)劃分精度。

(2)樣本量的確定:如何根據(jù)具體的應(yīng)用需求(如劃分修復(fù)區(qū)邊界、劃分農(nóng)用地環(huán)境質(zhì)量類別等),確定環(huán)境質(zhì)量等級(jí)劃分的等級(jí)屬性精確度與等級(jí)邊界空間的精確度參數(shù),進(jìn)而結(jié)合這些參數(shù)確定加密調(diào)查所需樣本量。

(3)如何進(jìn)行多階段協(xié)同采樣優(yōu)化:目前統(tǒng)計(jì)土壤環(huán)境質(zhì)量等級(jí)劃分加密采樣優(yōu)化大都針對(duì)后續(xù)加密調(diào)查階段的布樣優(yōu)化,對(duì)于沒有歷史調(diào)查數(shù)據(jù)的區(qū)域(如確定廢棄工礦區(qū)的污染修復(fù)邊界),如何綜合考慮采樣成本與等級(jí)劃分精度,劃分調(diào)查階段,在階段間分配樣本量并制定各階段的樣點(diǎn)優(yōu)化布局方案。

隨著土壤污染防治法的實(shí)施,我國(guó)土壤環(huán)境質(zhì)量等級(jí)劃分需求將不斷增加。目前即將完成全國(guó)農(nóng)用地土壤環(huán)境質(zhì)量類別劃分,下一步將開展農(nóng)用地土壤環(huán)境質(zhì)量類別動(dòng)態(tài)調(diào)整和安全利用工作,需要開展大量的土壤環(huán)境質(zhì)量等級(jí)劃分與加密采樣工作,由于我國(guó)已經(jīng)積累了大量農(nóng)用地土壤污染采樣數(shù)據(jù),建議后續(xù)工作中采用具有針對(duì)性的土壤環(huán)境質(zhì)量等級(jí)劃分加密采樣布局優(yōu)化和統(tǒng)計(jì)推斷方法(如概率閾值法),基于等級(jí)劃分精確度的加密采樣布局優(yōu)化方法或者具有針對(duì)性的其他先進(jìn)方法。隨著我國(guó)土壤污染修復(fù)行業(yè)不斷發(fā)展壯大,在劃定修復(fù)區(qū)時(shí),建議采用先進(jìn)的土壤環(huán)境質(zhì)量等級(jí)劃分采樣布局優(yōu)化和統(tǒng)計(jì)推斷方法,在污染修復(fù)區(qū)范圍劃定中同時(shí)考慮修復(fù)成本與健康風(fēng)險(xiǎn),實(shí)現(xiàn)科學(xué)決策。

猜你喜歡
樣點(diǎn)土壤環(huán)境環(huán)境質(zhì)量
“優(yōu)標(biāo)”水稻體系對(duì)稻田土壤環(huán)境的影響
論提升縣域環(huán)境質(zhì)量的現(xiàn)狀及治理思路
我國(guó)土壤環(huán)境質(zhì)量監(jiān)測(cè)存在的問題及建議分析
汾河源頭水生甲蟲物種多樣性及其生態(tài)分布類型
林業(yè)“犟牛人”
談?wù)動(dòng)衩状筇餃y(cè)產(chǎn)方法及應(yīng)用
土地整理后樣方田坎與二調(diào)樣方田坎比較研究