国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

農(nóng)業(yè)用地土壤重金屬樣本點(diǎn)數(shù)據(jù)精化方法
——以北京市順義區(qū)為例

2020-11-11 02:55唐柜彪朱慶偉董士偉高秉博潘瑜春王怡蓉郜允兵
關(guān)鍵詞:插值樣本因子

唐柜彪,朱慶偉,董士偉,高秉博,潘瑜春,王怡蓉,郜允兵

(1.西安科技大學(xué)測(cè)繪科學(xué)與技術(shù)學(xué)院,西安710054;2.北京農(nóng)業(yè)信息技術(shù)研究中心,北京100097;3.國(guó)家農(nóng)業(yè)信息化工程技術(shù)研究中心,北京100097;4.中國(guó)農(nóng)業(yè)大學(xué)土地科學(xué)與技術(shù)學(xué)院,北京100193)

中國(guó)工農(nóng)業(yè)的快速發(fā)展導(dǎo)致土壤重金屬在污染水平、污染范圍和持續(xù)時(shí)間方面都呈現(xiàn)出日益嚴(yán)重的趨勢(shì)。為了應(yīng)對(duì)這種趨勢(shì),國(guó)家發(fā)布一系列措施,比如,《全國(guó)農(nóng)業(yè)可持續(xù)發(fā)展(2015—2030)》要求圍繞農(nóng)業(yè)污染防治和農(nóng)村環(huán)境治理,開(kāi)展水土資源保護(hù)重大工程建設(shè);《土壤污染防治行動(dòng)計(jì)劃》(土十條)提出開(kāi)展土壤污染調(diào)查,實(shí)施農(nóng)用地分類(lèi)管理,加強(qiáng)農(nóng)業(yè)污染源監(jiān)管。面對(duì)農(nóng)業(yè)土壤重金屬污染監(jiān)測(cè)調(diào)查、分級(jí)分類(lèi)防治、污染監(jiān)管的新要求,研究農(nóng)業(yè)用地土壤重金屬樣本點(diǎn)的空間分布特征和相應(yīng)數(shù)據(jù)去冗精化方法非常關(guān)鍵。

土壤采樣是調(diào)查土壤屬性空間變異性及其統(tǒng)計(jì)參數(shù)的重要方式[1-3],精確研究土壤空間信息分布和變異性必須以土壤采樣點(diǎn)在空間均勻性及代表性為依托。因此,用樣本點(diǎn)數(shù)據(jù)分析前必須先對(duì)樣本集中樣本點(diǎn)進(jìn)行均勻性檢測(cè)和冗余數(shù)據(jù)處理,空間樣本點(diǎn)數(shù)據(jù)的均勻分布及代表性不僅是檢測(cè)評(píng)價(jià)的關(guān)鍵因素,也是判斷分析結(jié)果是否準(zhǔn)確的重要依據(jù)。針對(duì)空間樣本點(diǎn)數(shù)據(jù)的均勻性及代表性問(wèn)題,國(guó)內(nèi)外學(xué)者開(kāi)展了大量的研究,許多學(xué)者采用隨機(jī)選擇樣本點(diǎn)研究土壤重金屬污染及評(píng)價(jià)[4]和預(yù)測(cè)土壤重金屬空間信息變化[5-8],在一定程度上提高了土壤空間信息分布的預(yù)測(cè)結(jié)果精度,但未充分考慮樣本點(diǎn)在地理空間均勻性和特征空間代表性,忽略了土壤空間信息相關(guān)性。 基于格網(wǎng)采樣方式進(jìn)行土壤重金屬污染評(píng)價(jià)[9-11],考慮了樣本點(diǎn)在地理空間的均勻性,但忽視其在特征空間的代表性。同時(shí),有研究基于歷史采樣點(diǎn)預(yù)測(cè)土壤有機(jī)質(zhì)含量[12-13],基于插值方法驗(yàn)證樣本點(diǎn)在特征空間代表性,但沒(méi)有耦合樣本點(diǎn)地理空間均勻性。除此之外,還有其他不少學(xué)者也從不同的角度分析,分別對(duì)不同的采樣數(shù)量和布局研究樣本點(diǎn)在土壤空間的均勻性及代表性問(wèn)題[14-20]??傮w分析對(duì)于空間樣本點(diǎn)數(shù)據(jù)在地理空間分布不均和特征空間的代表性問(wèn)題,更多是將地理空間樣本點(diǎn)的均勻性和特征空間的代表性剝離計(jì)算,未耦合兩者對(duì)空間數(shù)據(jù)精化提供具體方法及理論支撐。

綜合分析國(guó)內(nèi)外相關(guān)研究后發(fā)現(xiàn)主要存在兩大問(wèn)題:一是沒(méi)有進(jìn)行樣本點(diǎn)的均勻性檢測(cè)及非均勻樣本點(diǎn)的去冗精化。這種數(shù)據(jù)處理模式可能會(huì)出現(xiàn)樣本點(diǎn)代表性差的情景,增加采樣點(diǎn)數(shù)據(jù)分析過(guò)程中的不確定性,進(jìn)而影響采樣點(diǎn)數(shù)據(jù)分析結(jié)果的精度和準(zhǔn)確度;二是構(gòu)建的樣本點(diǎn)分布均勻性檢測(cè)指標(biāo)體系比較單一、缺乏系統(tǒng)性,致使檢測(cè)結(jié)果容易出現(xiàn)偏差,也無(wú)法體現(xiàn)采樣點(diǎn)數(shù)據(jù)局部均勻細(xì)節(jié),不利于采樣點(diǎn)數(shù)據(jù)的去冗精化和挖掘分析。具體在重金屬樣本點(diǎn)方面,以隨機(jī)布點(diǎn)法、格網(wǎng)布點(diǎn)法和分區(qū)布點(diǎn)法為主的重金屬樣本點(diǎn)布設(shè)結(jié)果也存在上述兩大問(wèn)題,尤其缺乏重金屬樣本點(diǎn)分布非均勻時(shí)的數(shù)據(jù)精化處理方法?;诖耍疚奶峁┮环N農(nóng)業(yè)用地土壤重金屬樣本點(diǎn)數(shù)據(jù)精化方法,構(gòu)建區(qū)域農(nóng)業(yè)重金屬樣本點(diǎn)分布均勻性檢測(cè)指標(biāo)體系進(jìn)行均勻性檢測(cè),并綜合集成樣本點(diǎn)分布非均勻化去冗精化方法。該方法可以為區(qū)域樣本點(diǎn)數(shù)據(jù)質(zhì)量評(píng)價(jià)和數(shù)據(jù)去冗精化提供一種新的技術(shù)方法,可直接服務(wù)于土壤污染防治行動(dòng)計(jì)劃(土十條)、土壤污染狀況詳查等,對(duì)提升農(nóng)業(yè)環(huán)境監(jiān)測(cè)體系和監(jiān)管信息化水平具有指導(dǎo)作用。

1 材料與方法

1.1 研究區(qū)概況及數(shù)據(jù)來(lái)源

順義區(qū)位于北京市城區(qū)東北方向,城區(qū)距市區(qū)中心30 km,順義區(qū)地勢(shì)北高南低,地理位置40°00′ ~40°18′ N,116°28′ ~116°58′ E,境域東西長(zhǎng)45 km,南北寬30 km,總面積1 021 km2。土壤為河流洪水?dāng)y帶沉積物質(zhì)造成,表面堆積物主要是砂、亞砂土,北部山地最高點(diǎn)海拔為637 m,境內(nèi)最低點(diǎn)海拔為24 m。本文研究該區(qū)域內(nèi)的4 個(gè)鄉(xiāng)鎮(zhèn),分別是高麗營(yíng)鎮(zhèn)、趙全營(yíng)鎮(zhèn)、牛欄山地區(qū)和北石槽鎮(zhèn),農(nóng)業(yè)用地面積為114.379 km2,農(nóng)業(yè)用地主要是菜地、水澆地、苗圃等。

土壤重金屬樣本點(diǎn)數(shù)據(jù)來(lái)源于北京市農(nóng)林科學(xué)院農(nóng)產(chǎn)品質(zhì)量安全管理平臺(tái)。為了分析北京市農(nóng)田環(huán)境和農(nóng)產(chǎn)品質(zhì)量情況,北京市農(nóng)林科學(xué)院定期組織下屬單位開(kāi)展北京市土壤樣品采集。本研究數(shù)據(jù)采集于2009 年春季,樣本點(diǎn)的布局和數(shù)量根據(jù)田塊的利用方式和面積進(jìn)行確定,采用GPS定位記錄樣點(diǎn)中心位置,采樣點(diǎn)主要分布于糧田、菜地、果園等農(nóng)業(yè)用地。原始采樣中,每個(gè)樣本點(diǎn)在10 m×10 m 格網(wǎng)范圍內(nèi)選擇5 個(gè)0~20 cm 耕層土壤混合,按四分法選取分析樣品1.0 kg。所有土樣在室內(nèi)自然風(fēng)干,碾壓磨碎后,過(guò)100 目尼龍網(wǎng)篩,按照國(guó)家標(biāo)準(zhǔn)分析測(cè)定各重金屬元素(Cu、Zn、Pb、Cd、As、Hg)。土壤樣品測(cè)定采用20% 樣品平行樣,并加入國(guó)家標(biāo)準(zhǔn)土壤樣品(GSS-1和GSS-4)作為質(zhì)量控制樣品,質(zhì)控樣品相對(duì)誤差小于10%。本研究區(qū)域內(nèi)農(nóng)業(yè)用地共分布95 個(gè)樣本點(diǎn)(圖1),選擇以重金屬Cu為例進(jìn)行數(shù)據(jù)精化研究。

圖1 研究區(qū)域Figure 1 Study area

1.2 研究方法

空間樣本點(diǎn)數(shù)據(jù)精化主要通過(guò)對(duì)樣本點(diǎn)的均勻性檢測(cè),找出其中存在的冗余數(shù)據(jù),將其劃分為聚集樣本點(diǎn)和稀疏樣本點(diǎn)。針對(duì)不同類(lèi)型的樣本點(diǎn)數(shù)據(jù)進(jìn)行處理,從而改善其在地理空間分布均勻性以及特征空間的代表性,最終實(shí)現(xiàn)空間數(shù)據(jù)精化目的。

農(nóng)業(yè)用地土壤重金屬樣本點(diǎn)數(shù)據(jù)精化方法主要包括3 個(gè)部分:一是樣本點(diǎn)數(shù)據(jù)均勻性表征方法;二是樣本點(diǎn)數(shù)據(jù)去冗精化方法;三是樣本點(diǎn)數(shù)據(jù)去冗精化效果評(píng)價(jià)方法。

1.2.1 樣本點(diǎn)數(shù)據(jù)均勻性表征方法

根據(jù)樣本點(diǎn)在空間分布方式的不同,樣本點(diǎn)的均勻性表征方法一般分為:地理空間樣本點(diǎn)均勻性表征方法,特征空間樣本點(diǎn)均勻性表征方法,耦合地理空間和特征空間樣本點(diǎn)均勻性表征方法。地理空間數(shù)據(jù)的均勻性一般主要考慮地理空間采樣位置均勻而忽視其在特征空間中屬性分布的代表性,比較常用的方法為基于格網(wǎng)采樣法[21]、電荷排斥模擬法[22]、空間模擬退火算法[23]等;特征空間樣本點(diǎn)均勻性表征方法一般主要考慮特征空間屬性分布均勻而忽視樣本點(diǎn)在地理空間位置的均勻性,比較常用的是目的性選擇的方法[4]。針對(duì)空間樣本點(diǎn)的均勻性和代表性問(wèn)題,全局代表性高的樣本點(diǎn)不但在數(shù)值空間內(nèi)很好地囊括了目標(biāo)區(qū)域土壤特性的典型值,而且在地理空間和特征空間也可以極大限度地反映土壤屬性的空間變異[24]。因此耦合地理空間和特征空間樣本點(diǎn)均勻性表征方法是理想選擇,盡管許多學(xué)者耦合兩個(gè)空間的采樣布設(shè)嘗試,比如超拉丁立方體采樣方法[25],但該方法很難操作??紤]樣本點(diǎn)在地理空間的均勻性,又結(jié)合樣本點(diǎn)在特征空間分布的代表性,現(xiàn)階段很難找到統(tǒng)一的指標(biāo)來(lái)衡量地理空間的均勻性和特征空間的代表性問(wèn)題,而且還考慮各方面環(huán)境因素,又因?yàn)闃颖军c(diǎn)在地理空間的均勻性和特征空間分布的代表性可能存在一定的矛盾,所以現(xiàn)階段要實(shí)現(xiàn)該表征方法異常困難。

本文研究土壤重金屬樣本點(diǎn)數(shù)據(jù)均勻性檢測(cè)和去冗精化局限在地理空間,但樣本點(diǎn)數(shù)據(jù)去冗精化效果從地理空間和特征空間分別構(gòu)建指標(biāo)進(jìn)行共同評(píng)價(jià)。地理空間樣本點(diǎn)均勻性表征方法主要涉及兩個(gè)重要指標(biāo):一是樣本點(diǎn)的均勻因子,二是樣本集的均勻變異指數(shù);通過(guò)繪制均勻因子離散圖,檢測(cè)其存在的冗余數(shù)據(jù)。

(1)樣本點(diǎn)均勻因子

均勻因子表示樣本點(diǎn)所在研究區(qū)域生成的泰森多邊形面積與平均采樣面積的比值,計(jì)算公式見(jiàn)式(1)。

式中:S0為平均采樣面積,km2;Si為第i 個(gè)樣本點(diǎn)所在泰森多邊形面積,km2;Vi為第i個(gè)樣本點(diǎn)的均勻因子。均勻因子表示單個(gè)樣本點(diǎn)的均勻因子與標(biāo)準(zhǔn)值1 的局部偏離程度,偏離程度越小表示樣本點(diǎn)所在區(qū)域存在冗余采樣點(diǎn)數(shù)量越少。當(dāng)均勻因子大于1 時(shí),表明樣本點(diǎn)在所在區(qū)域比較稀疏,即稀疏樣本點(diǎn);當(dāng)均勻因子等于1 時(shí),不需改善樣本點(diǎn)在地理空間數(shù)據(jù)的均勻性,即均勻樣本點(diǎn);當(dāng)均勻因子小于1 時(shí),表示在該區(qū)域采集的樣本點(diǎn)處于聚集分布,即聚集樣本點(diǎn)。

(2)均勻變異指數(shù)

均勻變異指數(shù)表征樣本集中全部樣本點(diǎn)的整體均勻程度,可由公式(2)表達(dá):

式中:Ev為所有樣本點(diǎn)的均勻變異指數(shù);N 為采樣區(qū)域中的樣本點(diǎn)的個(gè)數(shù);Vi為第i個(gè)樣本點(diǎn)的均勻因子。均勻變異指數(shù)越小,表示樣本點(diǎn)在地理空間的分布越均勻。反之,樣本點(diǎn)分布越趨向于聚集和稀疏。

1.2.2 樣本點(diǎn)去冗精化方法

樣本點(diǎn)數(shù)據(jù)去冗精化方法分為三種不同類(lèi)型的場(chǎng)景:均勻樣本點(diǎn)去冗精化、聚集樣本點(diǎn)去冗精化和稀疏樣本點(diǎn)去冗精化。

(1)均勻樣本點(diǎn)去冗精化

計(jì)算樣本點(diǎn)的均勻因子,當(dāng)均勻因子都等于1時(shí),即采集的樣本點(diǎn)在空間分布均勻,表示樣本集中沒(méi)有冗余數(shù)據(jù),無(wú)需進(jìn)行樣本點(diǎn)冗余數(shù)據(jù)分析與處理。

(2)聚集樣本點(diǎn)去冗精化

計(jì)算樣本點(diǎn)的均勻因子,當(dāng)樣本點(diǎn)均勻因子小于1 時(shí),表示樣本點(diǎn)局部聚集。一般設(shè)置小于1 的閾值或根據(jù)跳躍性來(lái)判斷,當(dāng)離散圖中均勻因子小于閾值時(shí)或產(chǎn)生跳躍,就判斷該樣本點(diǎn)在樣本集中為聚集樣本點(diǎn),處理方法為刪除該樣本點(diǎn)或樣本點(diǎn)權(quán)重調(diào)整。然而,刪除地理空間的聚集樣本點(diǎn)時(shí),還應(yīng)該兼顧特征空間的特征點(diǎn)情景:①有先驗(yàn)知識(shí)或人為設(shè)置特征點(diǎn)情景,若聚集樣本點(diǎn)不是特征空間的特征點(diǎn),則刪除該樣本點(diǎn);反之,則不能刪除,可以采用樣本點(diǎn)權(quán)重調(diào)整方法,減少該樣本點(diǎn)的權(quán)重值;②沒(méi)有先驗(yàn)知識(shí)或人為設(shè)置特征點(diǎn)情景,為防止誤刪特征點(diǎn),在特征空間中引入局部Moran′s I 系數(shù)[26]將土壤重金屬含量的空間格局可視化,進(jìn)一步研究其空間分布規(guī)律。Moran′s I 散點(diǎn)圖可以描述局部空間自相關(guān)性,將土壤重金屬含量空間分布劃分為5 種類(lèi)型:高值聚集(HH)、高值被低值包圍(HL)、低值被高值包圍(LH)、低值聚集(LL)和不顯著。當(dāng)聚集樣本點(diǎn)屬于高值被低值包圍(HL)或低值被高值包圍(LH)時(shí),表示該聚集樣本點(diǎn)在特征空間的空間差異程度顯著較大,可以剔除;若聚集樣本點(diǎn)不屬于HL 或LH,則需要根據(jù)其他輔助數(shù)據(jù)和信息進(jìn)行判斷。

(3)稀疏樣本點(diǎn)去冗精化

計(jì)算樣本點(diǎn)的均勻因子,當(dāng)樣本點(diǎn)的均勻因子大于1 時(shí),應(yīng)該根據(jù)均勻因子離散圖設(shè)置一個(gè)大于1 的閾值或根據(jù)其跳躍性來(lái)判斷。當(dāng)超出閾值或產(chǎn)生跳躍時(shí),即可判斷對(duì)應(yīng)的樣本點(diǎn)在樣本集中屬于稀疏樣本點(diǎn)。針對(duì)稀疏樣本點(diǎn)數(shù)據(jù)處理有兩種方法:樣本點(diǎn)權(quán)重值調(diào)整方法和樣本點(diǎn)添加方法。

樣本點(diǎn)權(quán)重調(diào)整方法不需添加和刪除樣本點(diǎn),只需對(duì)樣本點(diǎn)的權(quán)重進(jìn)行調(diào)整。樣本點(diǎn)比較稀疏的區(qū)域,根據(jù)樣本點(diǎn)影響的范圍增加其權(quán)重值,樣本點(diǎn)比較聚集的區(qū)域,減少其權(quán)重值。例如,可以選擇樣本點(diǎn)所在區(qū)域泰森多邊形面積與該區(qū)域所有參與調(diào)整的樣點(diǎn)泰森多邊形面積總和的比值作為樣本點(diǎn)調(diào)整權(quán)重。

樣本點(diǎn)添加方法可分為3 種模式,一是基于歷史樣本點(diǎn)添加方法,該方法對(duì)時(shí)間要求比較苛刻,目標(biāo)樣本點(diǎn)附近的歷史樣本點(diǎn)需要在一定時(shí)間間隔內(nèi)采集,比如規(guī)定時(shí)間間隔為一年。否則,時(shí)間間隔太長(zhǎng),樣本點(diǎn)的屬性特征值會(huì)隨之發(fā)生改變。二是現(xiàn)場(chǎng)補(bǔ)測(cè)方法,該方法適用于樣本點(diǎn)近期采集作業(yè),根據(jù)樣本點(diǎn)數(shù)據(jù)處理結(jié)果或研究目的進(jìn)行野外現(xiàn)場(chǎng)補(bǔ)測(cè),時(shí)間間隔要求比歷史樣本點(diǎn)添加方法更短。三是基于樣本點(diǎn)模型優(yōu)化方法,耦合樣本點(diǎn)地理空間分布和特征屬性嘗試建立添加樣本點(diǎn)目標(biāo)函數(shù)和優(yōu)化方法,確定添加樣本點(diǎn)的最佳位置。

上述不同方法具有各自的優(yōu)缺點(diǎn),適用不同的應(yīng)用場(chǎng)景。而稀疏區(qū)域添加樣本點(diǎn)數(shù)量確定方法,根據(jù)樣本點(diǎn)在區(qū)域內(nèi)生成的泰森多邊形面積與平均采樣面積比較確定添加樣本點(diǎn)的個(gè)數(shù),如公式(3)。

式中:S0為平均采樣面積,km2;Si為第i 個(gè)樣本點(diǎn)所在泰森多邊形面積,km2;Ni四舍五入取整即為增加的樣本點(diǎn)數(shù)。

1.2.3 樣本點(diǎn)數(shù)據(jù)去冗精化效果評(píng)價(jià)

樣本點(diǎn)數(shù)據(jù)去冗精化效果評(píng)價(jià)方法從地理空間和特征空間構(gòu)建指標(biāo)共同評(píng)價(jià)。以空間數(shù)據(jù)為研究對(duì)象對(duì)其均勻性檢測(cè),對(duì)存在的冗余數(shù)據(jù)處理結(jié)果進(jìn)行評(píng)價(jià),其中包含均勻變異指數(shù)、均勻變異指數(shù)變化率、特征空間偏離指數(shù)和屬性值的插值誤差。以原始樣本點(diǎn)計(jì)算結(jié)果為參考標(biāo)準(zhǔn),驗(yàn)證處理后的樣本點(diǎn)在地理空間的均勻性和特征空間的代表性。綜合分析數(shù)據(jù)處理之后的均勻因子、均勻變異指數(shù)、偏離指數(shù)和空間插值誤差,比較土壤樣本點(diǎn)數(shù)據(jù)精化的結(jié)果對(duì)樣本點(diǎn)的均勻性及代表性的改善程度進(jìn)行綜合評(píng)價(jià)。

(1)地理空間評(píng)價(jià)指標(biāo):均勻變異指數(shù)變化率

通過(guò)樣本點(diǎn)的均勻因子計(jì)算其均勻變異指數(shù),均勻變異指數(shù)越小,表示樣本點(diǎn)在地理空間的分布越均勻。均勻變異指數(shù)變化率計(jì)算公式見(jiàn)式(4)。

式中:V為均勻變異指數(shù)變化率;Ev為原始樣本集的均勻變異指數(shù);Ev′為新樣本集的均勻變異指數(shù)。刪除聚集樣本點(diǎn)和加密稀疏樣本點(diǎn)后,均勻變異指數(shù)變化率越大,表示樣本點(diǎn)數(shù)據(jù)精化效果越好。反之,表示去冗精化效果不佳。

(2)特征空間評(píng)價(jià)指標(biāo):偏離指數(shù)

P-P 圖(Probability-probability plot)和Q-Q 圖(Quantile-quantile plot)通過(guò)繪制樣本點(diǎn)及相應(yīng)總體的概率/分位數(shù)散點(diǎn)圖來(lái)比較樣本點(diǎn)及其總體的特征分布。為了量化樣本的代表性,反映樣本點(diǎn)在特征空間的偏離程度,定義特征空間偏離指數(shù)(Deviation index,DI)為以P-P 圖或Q-Q 圖中y=x線為基準(zhǔn)的標(biāo)準(zhǔn)殘差[27],計(jì)算公式見(jiàn)式(5)。

式中:DI是偏離指數(shù);qi是第i個(gè)樣本點(diǎn)屬性值的分位數(shù)/概率;Qi是相應(yīng)的總體分位數(shù)/概率;N是樣本點(diǎn)個(gè)數(shù)。偏離指數(shù)越小,表征樣本點(diǎn)在特征空間中的分布代表性越好。

(3)插值誤差

樣本點(diǎn)數(shù)據(jù)主要用途之一是空間制圖,基于農(nóng)業(yè)土壤重金屬屬性空間插值誤差大小來(lái)定量表征去冗精化對(duì)樣本點(diǎn)數(shù)據(jù)空間制圖的影響。選擇常用的均方根誤差(Root Mean Square Error,RMSE),計(jì)算公式為:

式中:RMSE是均方根誤差;Pi是第i個(gè)樣本點(diǎn)的預(yù)測(cè)值,mg·kg-1;Oi是第i個(gè)樣本點(diǎn)的觀測(cè)值,mg·kg-1;N是樣本點(diǎn)個(gè)數(shù)。空間插值方法主要推薦克里格插值,它是以變異函數(shù)理論和結(jié)構(gòu)分析為基礎(chǔ),利用區(qū)域化變量的原始數(shù)據(jù)和變異函數(shù)的結(jié)構(gòu)特點(diǎn),對(duì)未知樣本點(diǎn)進(jìn)行線性無(wú)偏、最優(yōu)估計(jì)。首先對(duì)原始樣本集屬性空間插值計(jì)算插值誤差;其次數(shù)據(jù)去冗精化后,計(jì)算去冗精化樣本集的空間插值誤差,并與原始樣本集的空間插值誤差比較。當(dāng)計(jì)算出的樣本點(diǎn)數(shù)據(jù)屬性值的插值誤差大于原始樣本集屬性值的插值誤差,說(shuō)明樣本點(diǎn)的代表性更差;等于原始樣本集屬性值插值誤差,則樣本集數(shù)據(jù)精化對(duì)樣本點(diǎn)的均勻性沒(méi)有影響;小于原始樣本集屬性值的插值誤差,說(shuō)明樣本集中的樣本點(diǎn)在土壤特征空間信息更具代表性;插值誤差越小表示樣本點(diǎn)的代表性越好。反之,代表性越差。

2 結(jié)果與分析

2.1 樣本點(diǎn)數(shù)據(jù)處理結(jié)果及分析

計(jì)算原始樣本集樣本點(diǎn)的均勻因子并繪制均勻因子離散圖(圖2),圖中均勻因子是按照從小到大的順序排列,計(jì)算樣本點(diǎn)的均勻變異指數(shù)為0.429?;贏rcGIS 10.1 軟件平臺(tái),以樣本集中重金屬Cu 為目標(biāo)變量,利用地統(tǒng)計(jì)中探索性數(shù)據(jù)分析工具Normal QQPlot和普通克里格插值方法,分別計(jì)算樣本點(diǎn)屬性Cu 的特征空間偏離指數(shù)為0.327 和插值誤差為6.538。通過(guò)結(jié)果分析,當(dāng)均勻因子為0.349,即最低點(diǎn),與下一點(diǎn)均勻因子相比發(fā)生很大的跳躍,所以判斷該均勻因子對(duì)應(yīng)的樣本點(diǎn)為聚集樣本點(diǎn)。當(dāng)均勻因子為2.744,即最高點(diǎn),與上一點(diǎn)均勻因子相比也發(fā)生很大跳躍,所以判斷該均勻因子對(duì)應(yīng)的樣本點(diǎn)為稀疏樣本點(diǎn)。

2.2 樣本點(diǎn)精化區(qū)域劃定

圖2 均勻因子離散圖Figure 2 Discrete graph of even factor

根據(jù)數(shù)據(jù)處理結(jié)果及分析可知,樣本集中存在1個(gè)聚集樣本點(diǎn)和1 個(gè)稀疏樣本點(diǎn)。針對(duì)地理空間的聚集樣本點(diǎn),研究區(qū)內(nèi)沒(méi)有先驗(yàn)知識(shí)或人為設(shè)置特征點(diǎn),為防止誤刪特征點(diǎn),基于ArcGIS 10.1 軟件的Spatial Autocorrelation工具計(jì)算原始樣本集的Moran′sI系數(shù),參數(shù)設(shè)置反距離進(jìn)行空間關(guān)系的概念化,并繪制Moran′ sI散點(diǎn)圖如圖(3)所示,一個(gè)聚集樣本點(diǎn)(圖4)在特征空間屬于低值被高值包圍(LH),對(duì)該樣本點(diǎn)進(jìn)行刪除。針對(duì)稀疏樣本點(diǎn),需要在稀疏樣本點(diǎn)影響范圍內(nèi)加密樣本點(diǎn)。通過(guò)計(jì)算添加樣本點(diǎn)數(shù)量的結(jié)果可知,稀疏區(qū)域需要增加1個(gè)樣本點(diǎn)。

本研究采用數(shù)據(jù)其樣本采樣時(shí)間為2009 年,無(wú)法選取現(xiàn)場(chǎng)補(bǔ)測(cè)方法,而研究區(qū)存在2008 年歷史樣本點(diǎn)數(shù)據(jù),因此本研究采用基于歷史樣本點(diǎn)數(shù)據(jù)添加方法。在稀疏區(qū)域內(nèi)共有3個(gè)2008年歷史樣本點(diǎn)(圖4),分別記為1、2、3 號(hào),數(shù)據(jù)精化前已消除由于時(shí)間不一致帶來(lái)的系統(tǒng)誤差。

2.3 數(shù)據(jù)去冗精化結(jié)果及分析

通過(guò)對(duì)原始樣本點(diǎn)的均勻性檢測(cè)結(jié)果,剔除聚集樣本點(diǎn)和添加不同歷史樣本點(diǎn)共分為3 種不同方案:a 方案具體內(nèi)容為刪除1 個(gè)聚集點(diǎn),添加1 號(hào)樣本點(diǎn);b 方案具體內(nèi)容為刪除1 個(gè)聚集點(diǎn),添加2 號(hào)樣本點(diǎn);c 方案具體內(nèi)容為刪除1 個(gè)聚集點(diǎn),添加3 號(hào)樣本點(diǎn)。不同處理方案的均勻因子離散圖和均勻變異指數(shù)計(jì)算結(jié)果分別如圖5 和表1 所示。結(jié)果表明,均勻變異指數(shù)下降明顯,說(shuō)明剔除聚集樣本點(diǎn)和添加歷史樣本點(diǎn)能有效去除原始樣本集中的冗余數(shù)據(jù)。

圖3 樣本點(diǎn)的Moran′s I散點(diǎn)圖Figure 3 Moran′s I scatter diagram of sampling sites

計(jì)算添加不同位置樣本點(diǎn)處理結(jié)果,a 方案均勻變異指數(shù)由0.429下降到0.416,樣本點(diǎn)均勻性整體得到改善,但該方案最小泰森多邊形面積由0.349 km2下降到0.330 km2,重新生成1個(gè)聚集樣本點(diǎn)(圖5a);b方案和c 方案與原始方案相比,都降低了樣本點(diǎn)所在泰森多邊形的最大面積,增大了最小面積,去冗精化后沒(méi)有發(fā)現(xiàn)聚集樣本點(diǎn)和稀疏樣本點(diǎn),改善了樣本點(diǎn)整體均勻性。由于b 方案的均勻變異指數(shù)0.406 小于c方案的0.412,即不同方案樣本點(diǎn)的均勻變異指數(shù)大小為:原始樣本點(diǎn)>a 方案>c 方案>b 方案。故b 方案是研究區(qū)去冗精化的最優(yōu)方案,即刪除1 個(gè)聚集樣本點(diǎn)和添加2號(hào)歷史樣本點(diǎn)。

2.4 樣本點(diǎn)數(shù)據(jù)精化評(píng)價(jià)

本文中聚集和稀疏樣本點(diǎn)為數(shù)據(jù)集中均勻因子離散圖兩端的極值,根據(jù)地理空間均勻變異指數(shù)變化率、特征空間偏離指數(shù)和屬性插值誤差來(lái)共同評(píng)價(jià)樣本點(diǎn)數(shù)據(jù)去冗精化效果。通過(guò)計(jì)算原始樣本點(diǎn)均勻變異指數(shù)為0.429。刪除聚集樣本點(diǎn)和稀疏樣本點(diǎn)添加歷史樣本點(diǎn)數(shù)據(jù)之后均勻性檢測(cè)的效果進(jìn)行分析比較,結(jié)果如表2所示,a均勻變化率最小,則a方案樣本點(diǎn)在地理空間均勻性改善效果最差。針對(duì)b 方案和c 方案比較分析,根據(jù)圖5 可知,添加2 號(hào)和3 號(hào)歷史樣本點(diǎn)未重新造成樣本點(diǎn)冗余等情況。根據(jù)表2可知,不同方案樣本點(diǎn)的均勻變異指數(shù)變化率比較:b方案>c 方案>a 方案。表明b 方案在地理空間的均勻性最好,故添加2 號(hào)歷史樣本點(diǎn)改善樣本點(diǎn)的均勻性效果最佳。結(jié)果表明本研究數(shù)據(jù)精化方案在地理空間有效。

表1 不同數(shù)據(jù)精化方案Table 1 Different data refinement schemes

圖4 不同類(lèi)型樣本點(diǎn)Figure 4 Different types of sampling sites

圖5 不同數(shù)據(jù)精化方案的離散圖Figure 5 Discrete graphs of different data refinement schemes

表2 均勻變異指數(shù)變化率Table 2 Change rate of even variation index

原始樣本點(diǎn)與不同數(shù)據(jù)精化方案中,以土壤重金屬Cu 元素為目標(biāo)變量,用Normal QQPlot 分析工具分別計(jì)算該屬性的特征空間偏離指數(shù),如表3 所示,不同方案的偏離指數(shù)大小為:原始樣本點(diǎn)>c 方案>a 方案>b 方案,表明經(jīng)過(guò)冗余數(shù)據(jù)處理之后,各方案樣本點(diǎn)的屬性值特征空間偏離指數(shù)都在微弱減小,各方案都在一定程度上提高了樣本點(diǎn)在特征空間的代表性。其中b 方案偏離指數(shù)最小,表明在特征空間中的代表性最好。

用普通克里格空間插值方法分別計(jì)算Cu元素的插值誤差,結(jié)果如表3 所示,不同方案的插值誤差大小為:原始樣本點(diǎn)>a方案>c方案>b方案,表明經(jīng)過(guò)冗余數(shù)據(jù)處理之后,各方案樣本點(diǎn)屬性值的插值誤差都在明顯減小,表明各方案都在一定程度上提高了樣本點(diǎn)的代表性,其中b 方案的效果最佳,與地理空間和特征空間評(píng)價(jià)結(jié)果一致。

綜上所述,通過(guò)不同方案比較,b 方案數(shù)據(jù)精化效果最好,提高了地理空間樣本點(diǎn)的均勻性和特征空間的代表性。

表3 Cu特征空間偏離指數(shù)和插值誤差Table 3 The feature space deviation index and interpolation error of Cu

3 討論

3.1 樣本點(diǎn)數(shù)據(jù)精化方法與相關(guān)研究的對(duì)比分析

對(duì)比分析本研究樣本點(diǎn)數(shù)據(jù)精化方法與相關(guān)研究成果,可以歸納為3 種類(lèi)型:(1)樣本點(diǎn)數(shù)據(jù)沒(méi)有進(jìn)行均勻性檢測(cè)或進(jìn)行了均勻性檢測(cè)但沒(méi)有進(jìn)行相應(yīng)的數(shù)據(jù)精化處理,例如,韓宗偉等[13]不同采樣尺度的土壤有機(jī)質(zhì)數(shù)據(jù)分析;(2)非均勻化樣本點(diǎn)數(shù)據(jù)進(jìn)行了簡(jiǎn)單數(shù)據(jù)精化處理,但沒(méi)有系統(tǒng)評(píng)價(jià)數(shù)據(jù)精化效果,例如,吳丹等[28]對(duì)農(nóng)用機(jī)井的加密優(yōu)化;(3)系統(tǒng)構(gòu)建樣本點(diǎn)分布均勻性檢測(cè)指標(biāo)體系進(jìn)行均勻性檢測(cè),并綜合集成樣本點(diǎn)分布非均勻化去冗精化方法,例如,本研究土壤重金屬樣本點(diǎn)的數(shù)據(jù)精化。

3.2 樣本點(diǎn)數(shù)據(jù)精化方法的不確定性分析

研發(fā)的樣本點(diǎn)數(shù)據(jù)精化方法提高了樣本點(diǎn)的均勻性和代表性,但研究過(guò)程中存在一定的不確定性。(1)地理空間極大值點(diǎn)(稀疏樣本點(diǎn))和極小值點(diǎn)(聚集樣本點(diǎn))不同于特征空間的特征點(diǎn),二者之間沒(méi)有明顯的對(duì)應(yīng)關(guān)系。由于缺乏數(shù)據(jù)進(jìn)行真實(shí)性檢驗(yàn),本研究可以基于局部Moran′s I 系數(shù)進(jìn)行判斷,但對(duì)于其他應(yīng)用場(chǎng)景,則需要根據(jù)其他輔助數(shù)據(jù)和信息進(jìn)行判斷;(2)添加歷史采集的樣本點(diǎn)方法存在局限性,在稀疏區(qū)域添加樣本點(diǎn)的空間位置只是較優(yōu)位置,并不一定是最佳位置,該目標(biāo)函數(shù)和優(yōu)化方法是個(gè)研究難點(diǎn),正在考慮結(jié)合深度學(xué)習(xí)算法來(lái)進(jìn)一步嘗試;(3)本研究的數(shù)據(jù)精化處理過(guò)程中,聚集樣本點(diǎn)數(shù)量和稀疏樣本點(diǎn)數(shù)量恰好相等,使得不同數(shù)據(jù)精化方案和原始樣本集中樣本點(diǎn)總數(shù)相等。針對(duì)其他樣本集,若出現(xiàn)數(shù)量不相等的情景,如何設(shè)置閾值準(zhǔn)確判斷和優(yōu)化聚集樣本點(diǎn)和稀疏樣本點(diǎn)非常關(guān)鍵。此外,隨著樣本數(shù)、間距和分布格局不同,變異函數(shù)的理論模型可能會(huì)發(fā)生變化,影響去冗精化效果評(píng)估。

針對(duì)精化方法目前存在的不確定性,未來(lái)將進(jìn)一步研究耦合地理空間和特征空間樣本點(diǎn)去冗精化方法、不同樣本點(diǎn)數(shù)量下的數(shù)據(jù)精化方案、樣本點(diǎn)權(quán)重調(diào)整方法、樣本點(diǎn)優(yōu)化模型布設(shè)最佳加密點(diǎn)、目標(biāo)變量空間非平穩(wěn)情況下的去冗精化方法等。

3.3 樣本點(diǎn)數(shù)據(jù)精化方法的應(yīng)用推廣

研發(fā)的農(nóng)業(yè)用地土壤重金屬樣本點(diǎn)數(shù)據(jù)精化方法,以其兼顧樣本點(diǎn)地理空間均勻性和特征空間代表性的優(yōu)勢(shì),可以應(yīng)用在面源與重金屬污染、場(chǎng)地污染監(jiān)測(cè)、耕地質(zhì)量評(píng)價(jià)、氣象和環(huán)境評(píng)估、海洋環(huán)境預(yù)警等樣本點(diǎn)、監(jiān)測(cè)點(diǎn)或監(jiān)測(cè)站的優(yōu)化布局,減少數(shù)據(jù)冗余,提高點(diǎn)位的代表性,具有很好的應(yīng)用前景。

4 結(jié)論

(1)根據(jù)不同類(lèi)型樣本點(diǎn)去冗精化的結(jié)果評(píng)價(jià),顯示b 方案(刪除1 個(gè)聚集點(diǎn),添加2 號(hào)歷史樣本點(diǎn))的均勻變異指數(shù)變化率最大,特征空間偏離指數(shù)和插值誤差最小,提高了地理空間樣本點(diǎn)的均勻性和特征空間的代表性,數(shù)據(jù)精化效果最佳。

(2)本研究數(shù)據(jù)精化方法在一定程度上可以兼顧樣本點(diǎn)地理空間的均勻性及特征空間代表性,不僅為大數(shù)據(jù)去冗精化提供一種參考方法,而且可以用于樣本點(diǎn)布設(shè)方案設(shè)計(jì),在土壤污染防治行動(dòng)計(jì)劃(土十條)、土壤污染狀況詳查以及其他行業(yè)的點(diǎn)位優(yōu)化布局中具有很好的應(yīng)用潛力。

(3)在數(shù)據(jù)特征點(diǎn)判斷、去冗精化方法選擇和閾值設(shè)置方面存在一定的不確定性,未來(lái)將進(jìn)一步研究不同適用條件下耦合地理空間和特征空間的樣本點(diǎn)去冗精化方法。

猜你喜歡
插值樣本因子
我刊2021年影響因子年報(bào)
滑動(dòng)式Lagrange與Chebyshev插值方法對(duì)BDS精密星歷內(nèi)插及其精度分析
一些關(guān)于無(wú)窮多個(gè)素因子的問(wèn)題
山藥被稱“長(zhǎng)壽因子”
基于pade逼近的重心有理混合插值新方法
規(guī)劃·樣本
混合重疊網(wǎng)格插值方法的改進(jìn)及應(yīng)用
隨機(jī)微分方程的樣本Lyapunov二次型估計(jì)
扮靚愛(ài)車(chē)拒絕潛伏危險(xiǎn)因子
基于混合并行的Kriging插值算法研究