牟力言,劉春湘,陳敏,秦莉*,林大松,Batsaikhan Bayartungalag
(1.農(nóng)業(yè)農(nóng)村部環(huán)境保護(hù)科研監(jiān)測(cè)所,天津 300191;2.農(nóng)業(yè)農(nóng)村部環(huán)境保護(hù)科研監(jiān)測(cè)所湘潭綜合實(shí)驗(yàn)站,湖南 湘潭 411100;3.蒙古科學(xué)院地理與生態(tài)地質(zhì)研究所,烏蘭巴托 1568683)
土壤重金屬污染是影響當(dāng)下我國(guó)經(jīng)濟(jì)發(fā)展和生態(tài)安全的首要問題之一[1-2]。2014 年《全國(guó)土壤調(diào)查公報(bào)》指出,國(guó)內(nèi)土壤污染超標(biāo)率為16.1%,無機(jī)型污染類別占比82.8%;其中,Cd、As超標(biāo)率遠(yuǎn)高于其他無機(jī)污染物,分別占比7%、2.7%,并在農(nóng)業(yè)型土壤中更高。由土壤-稻米作物系統(tǒng)呈現(xiàn)的超標(biāo)Cd、As遷移轉(zhuǎn)化規(guī)律及其影響推動(dòng)人們對(duì)污染效應(yīng)與健康關(guān)系問題的認(rèn)識(shí)[3-4],尤其是食物鏈傳遞形式轉(zhuǎn)移帶來的Cd、As 污染問題廣泛存在[5-6]。大量的研究表明,土壤理化性質(zhì)[7]、土壤類型[8]、土地利用方式[9]、作物種類及其農(nóng)藝措施[10]、土壤重金屬形態(tài)及含量[11]等都是影響稻米Cd、As等重金屬污染效應(yīng)的關(guān)鍵因子。因此,不得不考慮以主控因子搭建模型來預(yù)測(cè)Cd、As 在作物中的傳遞,如將土壤pH 和SOM 作為胡蘿卜(Daucus carotaL.)Cd 吸收主控因子構(gòu)建的土壤Cd 預(yù)測(cè)模型[12]。中微量元素(Ca、Mg、Cu、Fe、Mn 和Zn 等)由于其作為水稻生長(zhǎng)過程中必需的有益營(yíng)養(yǎng)元素而凸顯其重要性。這些元素的缺乏和過量都有可能對(duì)稻米Cd、As 的富集產(chǎn)生促進(jìn)或抑制,包括Ca、Zn、Si、Se 等元素帶來的影響[13-17]。然而,這些文獻(xiàn)并未提供有關(guān)中微量元素與稻米對(duì)Cd、As 富集關(guān)聯(lián)的生物有效性或毒性的充足證據(jù)。因此,利用中微量元素來探索與稻米Cd、As富集的濃度分配關(guān)系是必要的,尤其對(duì)在大尺度地域水平上稻米Cd、As 富集差異之間的聯(lián)系具有現(xiàn)實(shí)意義。
機(jī)器學(xué)習(xí)(ML)算法,如決策樹算法(CART)[18]、隨機(jī)森林(RF)[19]和人工神經(jīng)網(wǎng)絡(luò)(ANN)[20]等,已成為揭示多元因子間隱藏關(guān)系的強(qiáng)大工具。它們?cè)谖廴疚锒拘燥L(fēng)險(xiǎn)預(yù)測(cè)[21]、污染修復(fù)預(yù)測(cè)[22]和材料合成設(shè)計(jì)[23]等問題上引起了廣泛關(guān)注并得到認(rèn)可。該算法可以通過中微量元素輸入學(xué)習(xí)和模擬來預(yù)測(cè)稻米Cd、As 富集是否超標(biāo),進(jìn)而探討稻米Cd、As 污染與中微量元素貢獻(xiàn)之間的空間錯(cuò)配關(guān)系。同時(shí),利用該模型可以預(yù)測(cè)土壤中的重金屬吸附,并繪制基于土壤重金屬吸附能力的全球分布[24];也可通過植被、海拔、土壤質(zhì)地和氣候等表觀數(shù)據(jù)計(jì)算出生態(tài)區(qū)域重金屬濃度,用以評(píng)估區(qū)域內(nèi)重金屬的生物積累[25]。盡管它們被認(rèn)為是黑箱模型,但該模型的可解釋性使我們能夠同時(shí)分析多種因素對(duì)于目標(biāo)的貢獻(xiàn),并探究其聯(lián)系[22]。決策樹和隨機(jī)森林均屬于基于信息論的分類器,十分適合離散特征的處理。而對(duì)于離散特征,其他很多模型都需要對(duì)其進(jìn)行編碼,得到很稀疏的編碼向量再進(jìn)行模型擬合。并且,決策樹和隨機(jī)森林實(shí)現(xiàn)起來較為簡(jiǎn)單,易于理解和可視化,規(guī)則也易于表達(dá),在當(dāng)前的相關(guān)研究中應(yīng)用廣泛,方法成熟。考慮到環(huán)境的多元復(fù)雜性,基于機(jī)器學(xué)習(xí)可提取土壤-稻米體系Cd、As污染空間關(guān)系的特定識(shí)別規(guī)則并繪制結(jié)果,可以為重金屬污染的準(zhǔn)確風(fēng)險(xiǎn)評(píng)估和有針對(duì)性的防治措施提供有價(jià)值的參考。
目前基于機(jī)器學(xué)習(xí)手段的中微量元素識(shí)別稻米Cd、As 富集規(guī)律研究較少。為了探究全國(guó)不同區(qū)域以中微量元素預(yù)測(cè)的稻米Cd、As富集及其規(guī)律,做出以下假設(shè):中微量元素(Ca、Mg、Cu、Fe、Mn、Zn)與稻米Cd、稻米無機(jī)As 的富集存在關(guān)聯(lián),并對(duì)其積累過程產(chǎn)生正向貢獻(xiàn)。為驗(yàn)證該假設(shè),本研究基于全國(guó)點(diǎn)對(duì)點(diǎn)監(jiān)測(cè)數(shù)據(jù)和多采樣點(diǎn)數(shù)據(jù),通過建立和優(yōu)化CART、RF和土壤-稻米生物有效性模型,以期為區(qū)域稻米Cd、As 含量預(yù)測(cè)及土壤Cd、As 的生態(tài)安全閾值的國(guó)家標(biāo)準(zhǔn)制定提供可靠的數(shù)據(jù)參考。
本研究數(shù)據(jù)來源于農(nóng)業(yè)農(nóng)村部環(huán)境監(jiān)測(cè)總站對(duì)全國(guó)25個(gè)省份的土壤和稻米的2020—2021年間的例行監(jiān)測(cè)數(shù)據(jù),以及湖南湘潭、云南祿豐、江西新余、浙江大田試驗(yàn)監(jiān)測(cè)站的采樣數(shù)據(jù)。數(shù)據(jù)范圍涵蓋全國(guó)七大片區(qū)(華東、華北、華中、華南、西南、西北和東北片區(qū))的土壤和稻米Cd、As 數(shù)據(jù);被考察的中微量元素有土壤交換性Ca、土壤交換性鎂(Mg)、土壤有效銅(Cu)、土壤有效Fe、土壤有效錳(Mn)、土壤有效Zn;土壤性質(zhì)參數(shù)有:pH、SOM、陽離子交換量(CEC)。共9 515組數(shù)據(jù),用于CART的預(yù)測(cè)模型訓(xùn)練、RF對(duì)稻米Cd、As 主控因子篩選、以及土壤-稻米體系有效性模型分析,具體的數(shù)據(jù)篩選原則如下:①數(shù)據(jù)必須來自于土壤和稻米的點(diǎn)對(duì)點(diǎn)協(xié)同監(jiān)測(cè);②數(shù)據(jù)必須有本研究考察的中微量元素指標(biāo)和土壤性質(zhì)參數(shù);③選擇的數(shù)據(jù)在每個(gè)分區(qū)覆蓋的樣本量足夠,具體為:華東2 650 組、華北1 462 組、華中1 310 組、華南1 365 組、西南1 420組、西北488組、東北820組。
本研究中所涉及的土壤理化性質(zhì)和中微量元素,以及土壤稻米Cd、As 的測(cè)定方法參照國(guó)家現(xiàn)行標(biāo)準(zhǔn)執(zhí)行。指標(biāo)及其對(duì)應(yīng)的標(biāo)準(zhǔn)編號(hào)如下:
土壤pH:NY/T 1121.2—2006;SOM:NY/T 1121.6—2006;CEC:LY/T 1243—1999;土壤總Cd:HJ 766—2015;稻米Cd:GB 5009.268—2016;稻米As:GB 5009.268—2016;土壤總As:GB/T 22105.2—2008;土壤交換性Ca:NY/T 1121.13—2006;土壤交換性Mg:NY/T 1121.13—2006;土壤有效銅、鐵、錳、鋅:HJ 804—2016。
1.3.1 土壤-稻米體系中稻米Cd、As 遷移的影響因素確定
先前的研究中,關(guān)于土壤-稻米體系中Cd、As 遷移的影響因素在土壤理化性質(zhì)、金屬形態(tài)及含量、稻米基因型以及其他農(nóng)藝措施等方面進(jìn)行了更多的探討[26-28]。另外,土壤pH、SOM 和CEC 在產(chǎn)地稻米Cd、As 富集過程中的重要性影響在我們先前的研究中也進(jìn)行了研究[29]。目前,中微量元素在土壤和作物中的分布遷移被廣泛關(guān)注[30-31],尤其是其他中微量元素對(duì)Cd、As 富集可能帶來的影響[32]。通過文獻(xiàn)調(diào)查,我們做出進(jìn)一步假設(shè):中微量元素(Ca、Mg、Cu、Fe、Mn、Zn)與稻米Cd、As 的富集存在一定的關(guān)聯(lián),并對(duì)其積累過程產(chǎn)生正向貢獻(xiàn)。因此,有必要構(gòu)建模型來預(yù)測(cè)和驗(yàn)證中微量元素在識(shí)別稻米Cd、As 超標(biāo)富集規(guī)律中的重要性。
1.3.2 決策樹模型
CART是一種分類與回歸模型[33]。它是一棵二叉樹,即每個(gè)節(jié)點(diǎn)下面包含兩個(gè)子節(jié)點(diǎn)。在CART 的生成過程中,根節(jié)點(diǎn)包含所有樣本,然后按照分裂準(zhǔn)則,根節(jié)點(diǎn)又被分為兩個(gè)子節(jié)點(diǎn),重復(fù)執(zhí)行這個(gè)過程,直至節(jié)點(diǎn)不可再分為止。即基于特征對(duì)實(shí)例的分類,通過樣本學(xué)習(xí),最終達(dá)到關(guān)聯(lián)關(guān)系預(yù)測(cè)的效果[18]。根據(jù)先前研究中CART構(gòu)建步驟,其通常包括3個(gè)步驟:特征選擇、決策樹的生成和決策樹的修剪。
1.3.3 隨機(jī)森林
RF 是通過引入隨機(jī)屬性加入到CART 算法,從而構(gòu)建bagging 與CART 相結(jié)合的模型算法[34],并通過多顆決策樹中每顆樹的投票結(jié)果獲取得到最優(yōu)結(jié)果[35]。為了確定全國(guó)七大片區(qū)稻米產(chǎn)地土壤Cd、As污染的主控因子,我們建立了RF模型。具體地,通過調(diào)用RF 算法,設(shè)置最大特征數(shù)、最大深度、CART 樹數(shù)量等參數(shù);然后輸入最優(yōu)的mtry 和ntree,將中微量元素因子指標(biāo)(Ca、Mg、Cu、Fe、Mn、Zn)與土壤理化指標(biāo)(pH、CEC、SOM)作為輸入變量;將重金屬Cd、As的BCF(生物富集系數(shù))作為輸出變量;建立回歸模型并對(duì)各因子實(shí)現(xiàn)重要性分析。具體的計(jì)算公式如下:
式中:m,n,t分別是基礎(chǔ)指標(biāo)因子總數(shù)、分類樹和單顆樹節(jié)點(diǎn)數(shù);DGkhj為第k個(gè)指標(biāo)因子在第h顆樹的第j個(gè)節(jié)點(diǎn)上基尼指數(shù)減少值;Pk為第k個(gè)基礎(chǔ)指標(biāo)因子的重要性。
RMSE(Root Mean Square Error)均方根誤差和回歸系數(shù)(R2)用以評(píng)價(jià)模型準(zhǔn)確性的指標(biāo),即以預(yù)測(cè)值與真實(shí)值偏差的平方與觀測(cè)次數(shù)n比值的平方根。本研究以此衡量預(yù)測(cè)值與真實(shí)值之間的偏差,并對(duì)異常值作出敏感性判斷[35]。
式中:n表示觀測(cè)次數(shù),Yi表示預(yù)測(cè)值,f(xi)表示真實(shí)值。RMSE取值[0,+∞),當(dāng)預(yù)測(cè)值與真實(shí)值的誤差為0 時(shí),RMSE為0,即完美模型;誤差越大,RMSE越大。實(shí)際過程中,RMSE值在0.2~0.5 之間,即可認(rèn)為預(yù)測(cè)效果較好。
R2表征依變數(shù)Y的變異中有多少百分比可由控制的自變數(shù)X來解釋[35]。其意義在于判斷自變量對(duì)因變量的解釋程度,即擬合優(yōu)度,其擬合優(yōu)度越大,自變量對(duì)因變量的解釋程度就越高,自變量引起的變動(dòng)占總變動(dòng)的百分比就越高。其取值范圍通常為[0,1]。
1.3.4 生物有效性模型
BCF 通常以污染物在生物體內(nèi)濃度與其生存土壤環(huán)境中濃度的比值計(jì)算得到[29],公式如下:
式中:Crice為稻米中Cd/As 含量(mg·kg-1);Csoil為土壤中的總Cd/As含量(mg·kg-1)。
通過多元線性回歸分析,構(gòu)建生物有效性模型,其基本形式如下:
式中:BCF為生物富集系數(shù);pH為土壤pH;SOM為土壤有機(jī)質(zhì),g·kg-1;CEC為土壤陽離子交換量cmol·kg-1;Ca、Mg、Cu、Fe、Mn和Zn分別表示土壤交換性Ca、土壤交換性Mg、土壤有效Cu、土壤有效Fe、土壤有效Mn和土壤有效Zn含量,mg·kg-1;a~i均為無量綱參數(shù),表示土壤理化性質(zhì)對(duì)生物富集系數(shù)的影響程度;k為方程的截距,表示稻米富集重金屬Cd的固有敏感性。
本研究中采用Excel 對(duì)數(shù)據(jù)進(jìn)行整理分析;采用SPSS 22.0 進(jìn)行中微量元素、土壤理化性質(zhì)與稻米Cd/As 的BCF進(jìn)行多元回歸分析;使用Python 3.7 進(jìn)行CART 與RF 模型的歸一化、標(biāo)準(zhǔn)化處理,并實(shí)現(xiàn)模型的構(gòu)建與優(yōu)化。
我們延伸大量文獻(xiàn)集中pH、SOM 和CEC 等土壤理化性質(zhì)對(duì)稻米Cd、As超標(biāo)影響貢獻(xiàn)的研究思路,嘗試建立了少有研究的中微量元素對(duì)稻米Cd、As 超標(biāo)的影響預(yù)測(cè)模型。中微量元素驅(qū)動(dòng)的稻米Cd、As 的吸附、溶解和共沉淀等過程可能是稻米Cd、As加速富集的原因之一[32]。參照CART原理[33,36],將6種中微量元素(Ca、Mg、Cu、Fe、Mn 和Zn 元素豐缺指數(shù)結(jié)果)為特征輸入(X),Cd 和As 的超標(biāo)情況為結(jié)果輸出(Y),帶入到CART算法中進(jìn)行訓(xùn)練。隨機(jī)選擇70%的原始數(shù)據(jù)作為訓(xùn)練樣本集,隨機(jī)選取30%的原始數(shù)據(jù)作為測(cè)試樣本集,進(jìn)行100次交叉循環(huán)驗(yàn)證,利用訓(xùn)練樣本集訓(xùn)練CART模型,當(dāng)測(cè)試樣本集的準(zhǔn)確率最高時(shí),輸出該CART 樹。CART 樹構(gòu)建完成后以預(yù)測(cè)樣本遍歷所構(gòu)建的CART 模型,將模型預(yù)測(cè)結(jié)果與樣本實(shí)際結(jié)果進(jìn)行比較,從而得到?jīng)Q策樹預(yù)測(cè)精度。
依據(jù)《土壤環(huán)境質(zhì)量農(nóng)用地土壤污染風(fēng)險(xiǎn)管控標(biāo)準(zhǔn)(試行)》GB 15618—2018 和《食品中污染物限量》GB 2762—2022,并結(jié)合實(shí)際情況以樣本Cd 含量超過0.2 mg·kg-1、As 含量超過0.35 mg·kg-1被認(rèn)定為超標(biāo)。通過訓(xùn)練CART 模型,Cd、As 超標(biāo)模型的預(yù)測(cè)準(zhǔn)確率最低分別為82.13%、85.57%,最高分別為95.55%、97.55%;其平均準(zhǔn)確率分別為88.10%、90.34%。足夠高的預(yù)測(cè)準(zhǔn)確率表明中微量元素是影響稻米Cd、As超標(biāo)情況的重要判別指標(biāo),也表明土壤中微量元素(Ca、Mg、Cu、Fe、Mn 和Zn)與稻米Cd、As富集有著顯著的相關(guān)性。
通過進(jìn)一步量化,我們?cè)u(píng)估了基于RF 的全國(guó)七大片區(qū)稻米Cd、As污染主控因子分析模型的準(zhǔn)確性。如表1 所示,不同片區(qū)的Cd 和As 模型對(duì)應(yīng)的RMSE分別在0.11~0.44和0.18~0.48之間;不同片區(qū)的Cd和As 模型對(duì)應(yīng)的R2分別在0.60~0.86 和0.54~0.83 之間。表明全國(guó)七大片區(qū)稻米Cd、As 污染主控因子的分析模型具有較高的精確度。這同時(shí)支持了我們對(duì)全國(guó)七大片區(qū)稻米Cd、As 超標(biāo)富集主控因子貢獻(xiàn)率的分析結(jié)果。
表1 全國(guó)七大片區(qū)稻米產(chǎn)地土壤重金屬Cd、As污染主控因子分析模型評(píng)估指標(biāo)Table 1 Assessment parameters of the main control factor analysis model for heavy metal Cd and As pollution in the soils of rice production areas in seven major regions in China
為了探究全國(guó)七大片區(qū)Cd富集究竟由哪種環(huán)境因子主導(dǎo),我們進(jìn)行了不同區(qū)域和不同主控因子對(duì)Cd富集的貢獻(xiàn)率比對(duì)分析(圖1)。整體上,不同區(qū)域主控的富集驅(qū)動(dòng)因子存在明顯差異,以及同一主控因子在不同區(qū)域提供的稻米Cd 富集之間存在明顯差異。由單一因子主要驅(qū)動(dòng)的Cd富集在不同區(qū)域上具體表現(xiàn)為:華東片區(qū)pH 的貢獻(xiàn)占主導(dǎo)、華南片區(qū)的Ca 元素和東北片區(qū)的SOM 分別占主導(dǎo)貢獻(xiàn);以及由兩個(gè)或三個(gè)因子主要驅(qū)動(dòng)的稻米Cd富集表現(xiàn)在不同區(qū)域上呈現(xiàn)為:華北片區(qū)的Fe 和pH 貢獻(xiàn)占主導(dǎo),西北片區(qū)的Mn 和CEC 貢獻(xiàn)占主導(dǎo),華中片區(qū)的Fe、Zn和CEC 貢獻(xiàn)占主導(dǎo);對(duì)于西南片區(qū),其不同因子之間的貢獻(xiàn)水平表現(xiàn)出較小差別的梯度減小貢獻(xiàn),依次為Zn>CEC>Mn>pH>Fe>SOM>Ca>Cu>Mg,但均表現(xiàn)出對(duì)稻米Cd 富集影響的相當(dāng)貢獻(xiàn)(圖1a)。同樣地,同一主控因子在不同區(qū)域的貢獻(xiàn)率也表現(xiàn)出明顯差異(圖1b)。這種由地域差異引起的環(huán)境因子驅(qū)動(dòng)的Cd富集結(jié)果可見,Ca元素在華南片區(qū)、Fe元素在華北和華南片區(qū)、SOM 在東北片區(qū)以及pH 在華東和華北片區(qū)的貢獻(xiàn)相比其他區(qū)域明顯較高。
圖1 全國(guó)七大地理片區(qū)Cd主控因子貢獻(xiàn)率Figure 1 Contribution rate of Cd main control factors in China′s seven major geographical regions
區(qū)域水平上考察不同環(huán)境因子對(duì)稻米Cd富集是識(shí)別主控因子準(zhǔn)確性的重要支持。先前的研究表明,土壤Cd 含量與土壤pH、土壤交換性Ca、土壤有效Zn呈現(xiàn)出顯著的相關(guān)性關(guān)系,并且對(duì)耕作手段、地域特征等因素帶來的土壤理化性質(zhì)、中微量元素對(duì)稻米Cd 富集可能的影響做出推斷,如CEC、Zn 和Ca 等[37]。和君強(qiáng)等[38]通過模型構(gòu)建了湖南長(zhǎng)沙地區(qū)稻米Cd 污染土壤中pH和SOM與Cd富集之間的顯著關(guān)聯(lián);基于隨機(jī)森林回歸的主控因子識(shí)別模型,其Ca、pH、Mn 等也是影響湖南某縣稻米Cd 富集的主要影響因素[39]。東北片區(qū)特有的土壤類型中豐富的SOM 對(duì)稻米Cd富集的貢獻(xiàn)顯而易見[40]。受土壤質(zhì)地和類型的影響,華北和華中片區(qū)中土壤Fe 可能通過其有效性形態(tài)的變化來改變水稻根際Fe 膜對(duì)Cd 的吸附固定量,進(jìn)而影響對(duì)稻米Cd的富集[41]。同時(shí),土壤中Ca對(duì)土壤pH的調(diào)控作用,可能是華南片區(qū)稻米Cd 過度富集的原因之一??傊容^分析發(fā)現(xiàn)全國(guó)七大片區(qū)稻米Cd富集的主控因子存在區(qū)域差異,也存在主控因子貢獻(xiàn)率上的差異。這種差異基于區(qū)域元素化學(xué)循環(huán),也可能與中微量元素和土壤中Cd 之間的拮抗作用有關(guān),也可以是基于對(duì)土壤理化性質(zhì)如pH的調(diào)控進(jìn)而對(duì)稻米Cd的富集產(chǎn)生調(diào)控[39,42-43]。
綜上,9個(gè)環(huán)境因子在七大地理片區(qū)中對(duì)稻米Cd的富集貢獻(xiàn)和影響存在明顯的地域差異,這也說明影響稻米Cd富集的土壤環(huán)境因子的地域差異性。中微量元素指標(biāo)因子對(duì)各大地理片區(qū)稻米Cd的富集影響顯著,除了與地域母質(zhì),區(qū)域施肥、耕作制度差異等相關(guān)外,可能還與不同地理片區(qū)的特異的大氣沉降條件等有關(guān)[42]。因此,在華東片區(qū),應(yīng)重點(diǎn)監(jiān)控pH、SOM等土壤理化指標(biāo)的變化情況;華北和華中片區(qū)應(yīng)重點(diǎn)監(jiān)控Fe 指標(biāo)與土壤pH 的變化情況;華南片區(qū)應(yīng)重點(diǎn)監(jiān)控Ca 指標(biāo)、pH、CEC 等土壤理化指標(biāo);而西南、西北、東北等片區(qū)應(yīng)重點(diǎn)監(jiān)控Zn、Mn 元素指標(biāo)、CEC、SOM等土壤理化指標(biāo)。
與Cd 的分析過程類似。通過比較發(fā)現(xiàn),全國(guó)七大片區(qū)稻米As主控富集驅(qū)動(dòng)因子在區(qū)域尺度上同樣存在一定差異,同區(qū)域不同因子的貢獻(xiàn)率明顯不同(圖2)。由單一因子主要驅(qū)動(dòng)的As 富集在不同區(qū)域上具體表現(xiàn)為:Fe 元素在華東、華南和西南片區(qū)的貢獻(xiàn)相比于其他因子尤為突出,Zn 在華北片區(qū)的因子貢獻(xiàn)中占據(jù)主導(dǎo)地位,包括西北片區(qū)的Mn 和東北片區(qū)的Mg;另外,華中片區(qū)的Cu、Zn和Fe同時(shí)具有較高的貢獻(xiàn)。與Cd 不同的是,在因子水平上Fe 表現(xiàn)出對(duì)稻米As 富集明顯的特異性貢獻(xiàn),除了華北片區(qū)。而其他因子在不同區(qū)域也表現(xiàn)出相當(dāng)?shù)呢暙I(xiàn)水平。
圖2 全國(guó)七大地理片區(qū)As主控因子貢獻(xiàn)率Figure 2 Contribution rate of As main control factors in China′s seven major geographical regions
土壤Fe 含量和形態(tài)依賴于稻米土壤淹水和排水條件而變化[44],進(jìn)而對(duì)土壤有效態(tài)As 的含量和形態(tài)產(chǎn)生調(diào)節(jié)作用。主要表現(xiàn)為Fe氧化物和As(Ⅴ)的協(xié)同還原過程,加速溶解產(chǎn)生的As(Ⅲ)造成稻米As 的吸收風(fēng)險(xiǎn)[44-46]。這解釋了多片區(qū)Fe 元素對(duì)稻米As 富集的主要貢獻(xiàn),尤其是土壤Fe 含量較高、雨水較廣的華東、華南和西南片區(qū)等地。另外,Zn 元素可促進(jìn)水稻土壤中As 的甲基化和脫甲基化過程,并影響水稻根系對(duì)As的吸收和運(yùn)輸;Mg元素與土壤中As(Ⅲ)或有機(jī)甲基As 的協(xié)同作用可加速稻米As 富集并影響其在水稻不同部位的分配;而Mn 氧化物在土壤中的吸附與As 有關(guān)[47-49]??傊?,不同片區(qū)稻米As 富集可能依賴于這些中微量元素在土壤中的形態(tài)過程,從而表現(xiàn)出明顯差異。這可能是華北、西北和東北地區(qū)的Zn、Mn、Mg主控稻米As富集的潛在原因。
不同區(qū)域的土壤中As主控因子貢獻(xiàn)率存在明顯差異,其中Fe、Zn、Mn、Mg 等元素對(duì)稻米中As 的富集影響最為顯著。Fe 元素在華東、華南、西南、東北片區(qū)對(duì)稻米中As 的富集影響顯著,推斷Fe 元素是影響我國(guó)水稻產(chǎn)區(qū)As 富集的重要因素,這與前人的研究結(jié)論一致。As 污染的水稻土壤中Fe 與As 是普遍存在的,并且Fe 的一系列氧化還原反應(yīng)是導(dǎo)致As 遷移的主要原因[50]。Zhao 等[6]建議旱作、干濕交替可減少水稻As 吸收和在籽粒中的積累,但是會(huì)增加重金屬Cd 的吸收。這進(jìn)一步說明土壤質(zhì)地、金屬形態(tài)和管理模式等對(duì)稻米富集無機(jī)金屬As的影響。有效的人為監(jiān)測(cè)管控措施可能極大減小稻米對(duì)As的富集。例如,對(duì)于華東、華南和西南片區(qū),應(yīng)加強(qiáng)監(jiān)測(cè)土壤Fe含量和形態(tài),及時(shí)排水以減少Fe 氧化物還原釋放五價(jià)無機(jī)As;對(duì)于華北和華中片區(qū),應(yīng)加強(qiáng)監(jiān)測(cè)土壤Zn含量,并施用適量Zn 肥以保證足夠Zn 供給;同時(shí)應(yīng)施用適量生物質(zhì)肥料以增加土壤微生物活性并提高土壤pH值。
基于隨機(jī)森林算法分析得到全國(guó)七大地理片區(qū)Cd、As 主控因子貢獻(xiàn)率的統(tǒng)計(jì)結(jié)果,進(jìn)一步提取了Cd、As污染基于上述指標(biāo)空間關(guān)系的特定識(shí)別規(guī)則,并構(gòu)建了Cd、As 的土壤-稻米體系生物有效性模型(表2、表3)。量化結(jié)果顯示,9 個(gè)因子與稻米Cd、As的BCF呈顯著相關(guān)(P<0.05)。我們逐步引入上述因子考察基于土壤-稻米體系生物有效性模型的解釋能力。在不考慮區(qū)域差異與重金屬本身特性的情況下,引入基于pH、SOM 和CEC 的三因子量化模型,不同片區(qū)Cd 對(duì)應(yīng)的決定系數(shù)在0.303~0.400 之間(表2,P<0.05),不同片區(qū)As對(duì)應(yīng)的決定系數(shù)在0.300~0.340之間(表3,P<0.05)。在考慮區(qū)域差異與重金屬本身特性的情況下,對(duì)所考察因子進(jìn)行重要性排序,構(gòu)建基于Top5 的五因子量化模型,不同片區(qū)Cd 對(duì)應(yīng)的決定系數(shù)在0.450~0.583 之間(表2,P<0.05),不同片區(qū)As 對(duì)應(yīng)的決定系數(shù)在0.450~0.634 之間(表3,P<0.01),表明五因子量化的結(jié)果能很好地解釋其對(duì)稻米Cd、As富集的影響。
表3 七大片區(qū)As土壤-稻米體系聯(lián)合量化預(yù)測(cè)模型Table 3 Joint quantitative prediction equation of As soil-crop system in seven large areas
為了進(jìn)一步得出更優(yōu)結(jié)果,我們將以上因子全部引入模型,結(jié)果不同片區(qū)Cd 和As 對(duì)應(yīng)的決定系數(shù)最大可達(dá)0.680和0.664(表2,表3,P<0.05),較高的確定系數(shù)表明九因子模型能顯著解釋pH、SOM、CEC、Ca、Mg、Cu、Fe、Mn 和Zn 對(duì)稻米Cd、As 富集的影響。然而,環(huán)境差異會(huì)引起土壤理化性質(zhì)、微生物群落以及稻米自身的一系列變化,進(jìn)而會(huì)導(dǎo)致模型決定系數(shù)的降低[29],具體表現(xiàn)在本研究上的區(qū)域空間跨度大、土壤類型和水稻品種的顯著差異,以及田間環(huán)境中其他土壤理化因子對(duì)稻米富集Cd、As的影響,如氧化還原電位、電導(dǎo)率、土壤機(jī)械組成等。在實(shí)際生產(chǎn)過程中,因子數(shù)量帶來的資源成本問題,同時(shí)可以選擇基于Top5因子模型結(jié)果來做一些綜合評(píng)估。
受地域差異、土壤背景、農(nóng)業(yè)過程等綜合因素的影響,九因子對(duì)稻米中重金屬Cd、As富集的貢獻(xiàn)率呈現(xiàn)出差異,這種差異反映了由環(huán)境復(fù)雜性導(dǎo)致的土壤和稻米中重金屬污染的空間分布規(guī)律?;谕寥?稻米的生物有效性模型,進(jìn)一步確立了本模型對(duì)大尺度范圍篩查土壤和水稻中Cd、As 超標(biāo)識(shí)別的重要性地位,以及中微量元素對(duì)土壤和稻米中Cd、As富集的影響。尤其是如Fe 對(duì)As 富集在華東、華南和西南等片區(qū)的區(qū)域型特異性影響,應(yīng)該進(jìn)一步被廣泛關(guān)注,并采取有效的管控措施。
(1)基于決策樹算法建立的全國(guó)七大片區(qū)的中微量元素稻米Cd、As 超標(biāo)高精度判別模型證實(shí)了中微量元素與稻米Cd、As超標(biāo)富集之間的重要相關(guān)性。
(2)基于隨機(jī)森林算法構(gòu)建的全國(guó)七大片區(qū)稻米Cd、As污染的主控因子分析模型可以很好的解釋Cd、As 污染主控因子的區(qū)域差異,尤其是Fe 元素對(duì)As 富集的區(qū)域特異性貢獻(xiàn)。
(3)基于土壤理化性質(zhì)(pH、SOM、CEC)和中微量元素(Ca、Mg、Cu、Fe、Mn、Zn)的稻米Cd、As 富集生物有效性模型量化了不同因子數(shù)量對(duì)產(chǎn)地稻米Cd、As富集規(guī)律的解釋力度。
(4)本研究機(jī)器學(xué)習(xí)模型在我國(guó)稻米Cd、As重金屬污染預(yù)測(cè)判別研究中的應(yīng)用,為我國(guó)大尺度區(qū)域稻米Cd、As 重金屬污染防控和環(huán)境管理提供了科學(xué)依據(jù)和決策支撐。