国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

水培到土培體系植物根系PFAS吸收風(fēng)險(xiǎn)的遷移機(jī)器學(xué)習(xí)研究

2024-12-30 00:00:00錢一凡裴晨浩呂陳吳同亮劉存王玉軍
關(guān)鍵詞:遷移學(xué)習(xí)機(jī)器學(xué)習(xí)

摘要:為實(shí)現(xiàn)植物根系對(duì)全氟與多氟化合物(Per- and polyfluoroalkyl substances,PFAS)的吸收和積累的精準(zhǔn)預(yù)測(cè),本研究基于涵蓋了19種PFAS的水培或土培體系文獻(xiàn)數(shù)據(jù),共計(jì)668條數(shù)據(jù)點(diǎn),利用分子描述符、實(shí)驗(yàn)條件以及作物屬性等作為特征變量,構(gòu)建4種機(jī)器學(xué)習(xí)模型分別預(yù)測(cè)了水培體系和土壤體系的根系富集因子(RCF),效果最佳的均是極端梯度提升樹(XGB)模型,測(cè)試集決定系數(shù)(R2)分別為0.69和0.83,均方根誤差(RMSE)分別為0.51和0.28。水培體系中PFAS的吸收、積累更容易研究,因此搭建了從水培體系到土壤體系的遷移學(xué)習(xí)模型,通過知識(shí)共享來提升RCF 預(yù)測(cè)的準(zhǔn)確度。最優(yōu)的遷移模型的測(cè)試集R2達(dá)到了0.86,RMSE為0.25,準(zhǔn)確性有顯著提升。Shapley加性解釋(SHAP)特征重要性分析結(jié)果顯示,暴露時(shí)間、土壤pH和PFAS濃度是影響土壤根系吸收積累最主要的3個(gè)因素。本研究通過構(gòu)建機(jī)器學(xué)習(xí)和遷移學(xué)習(xí)模型來預(yù)測(cè)土壤中植物根系PFAS的吸收積累,實(shí)現(xiàn)了簡(jiǎn)單水-植物根表體系向土-水-植物多個(gè)界面復(fù)雜體系的遷移,為評(píng)估土壤PFAS生態(tài)環(huán)境風(fēng)險(xiǎn)提供了新的視角。

關(guān)鍵詞:全氟與多氟化合物;植物根系吸收積累;機(jī)器學(xué)習(xí);遷移學(xué)習(xí)

中圖分類號(hào):X53 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1672-2043(2024)11-2516-09 doi:10.11654/jaes.2024-0854

全氟與多氟化合物(Per- and polyfluoroalkyl sub?stances,PFAS)是一類人工合成的高度氟取代的有機(jī)氟化物,因具有出色的表面活性和化學(xué)穩(wěn)定性而被廣泛應(yīng)用于工業(yè)和日常生活中,從而也導(dǎo)致其在不同環(huán)境介質(zhì)中普遍存在且不斷積累[1]。PFAS種類繁多,除了傳統(tǒng)型全氟辛酸(PFOA)和全氟辛烷磺酸(PFOS),大量新型PFAS 替代品,如六氟環(huán)氧丙烷-二聚酸(GenX)、6∶2氟調(diào)聚物磺酸(6∶2 FTSA)等仍在不斷開發(fā)和應(yīng)用中。土壤是PFAS重要的歸趨場(chǎng)所,不同深度土壤、滲流帶以及地下水中都檢測(cè)到PFAS 的存在[2]。研究表明,土壤PFAS可被植物根部吸收,富集于植物組織中,并通過食物鏈的傳遞對(duì)生態(tài)環(huán)境和人體健康構(gòu)成風(fēng)險(xiǎn)[3]。因此,植物對(duì)土壤PFAS 的吸收和富集受到越來越多的關(guān)注,亟需對(duì)其吸收機(jī)制、生態(tài)風(fēng)險(xiǎn)進(jìn)行深入評(píng)估。

植物根系對(duì)PFAS的吸收和積累過程包括土壤顆粒吸附的PFAS解吸進(jìn)入土壤溶液,再被植物根表吸收并在植物體內(nèi)轉(zhuǎn)運(yùn),涉及到土壤、土壤溶液和根表三相界面過程,受多種因素影響,包括PFAS的物理化學(xué)性質(zhì)、植物種類、土壤條件等[4]。例如,PFAS的鏈長(zhǎng)在植物根系的吸收和富集中起著重要作用,疏水性更強(qiáng)的長(zhǎng)鏈PFAS在根中表現(xiàn)出更多的積累[5]。有機(jī)污染物從土壤到作物根系的轉(zhuǎn)移通常通過根系富集因子(RCF)來評(píng)估[6]。大量PFAS的植物吸收和毒性研究采用了水培體系,而土壤體系復(fù)雜,土壤性質(zhì)千差萬別,且上述研究選擇的植物種類差別很大,如何融合水培和土培實(shí)驗(yàn)來探究不同PFAS在不同植物根系中的吸收及積累機(jī)制具有挑戰(zhàn)性。

機(jī)器學(xué)習(xí)模型已成為環(huán)境科學(xué)研究的重要工具,在污染物毒性預(yù)測(cè)、催化劑設(shè)計(jì)、環(huán)境風(fēng)險(xiǎn)評(píng)估等領(lǐng)域得到廣泛應(yīng)用,尤其在整合大量復(fù)雜數(shù)據(jù)對(duì)新污染物屬性行為預(yù)測(cè)方面的應(yīng)用不斷拓展,為評(píng)估新化學(xué)物質(zhì)的環(huán)境和健康風(fēng)險(xiǎn)提供了新方法[7]?;谶@一優(yōu)勢(shì),可以通過綜合水培和土培體系PFAS根吸收實(shí)驗(yàn)數(shù)據(jù),搭建機(jī)器學(xué)習(xí)模型來預(yù)測(cè)土壤復(fù)雜體系的植物根系RCF 及吸收機(jī)制。

前人研究主要集中于單一體系,即水培或土培體系的植物PFAS吸收和積累分析,這些體系在環(huán)境復(fù)雜性、PFAS種類、植物種類等方面差異較大,模型的泛化能力和可遷移性不確定,難以全面理解和預(yù)測(cè)PFAS在實(shí)際土壤中的行為[8-9]。水培體系由于缺少土壤中復(fù)雜的交互影響,模型能夠描述PFAS分子與植物根系的直接相互作用,借助遷移學(xué)習(xí),將這一知識(shí)遷移至土培體系后,新機(jī)器模型土壤數(shù)據(jù)集測(cè)試集的決定系數(shù)(R2)從0.83提升至0.86,新模型融合了不同體系中的數(shù)據(jù)集,驗(yàn)證了模型泛化能力和可遷移性。同時(shí),基于SHAP值的特征重要性分析,可識(shí)別影響PFAS吸收和積累的關(guān)鍵因素,并結(jié)合水培和土培的數(shù)據(jù),探討PFAS在復(fù)雜土壤環(huán)境中的吸收和富集過程。本研究側(cè)重點(diǎn)在于提高RCF 預(yù)測(cè)的準(zhǔn)確性和穩(wěn)健性,因此在目標(biāo)上更關(guān)注結(jié)果的量化與模型性能,但通過特征重要性分析能夠初步揭示影響吸收和積累的機(jī)制和關(guān)鍵因素。更為重要的是,通過遷移學(xué)習(xí)融合了水-植物根體系和土-水-植物多界面復(fù)雜體系PFAS 的植物吸收,為深入理解PFAS 在復(fù)雜環(huán)境下的吸收和富集機(jī)制提供了新的思路。

1 材料與方法

1.1 數(shù)據(jù)收集

從經(jīng)同行評(píng)議的研究文章中分別提取了378條水培[8]和290條土壤[9]植物根系PFAS吸收積累的數(shù)據(jù)點(diǎn),具體如表1和表2所示。這兩項(xiàng)研究分別描述了水培和土培生長(zhǎng)條件下PFAS 在植物根系的積累情況,通過從這些研究中獲取和提取數(shù)據(jù),本研究構(gòu)建了關(guān)于PFAS遷移的水培數(shù)據(jù)集及土培數(shù)據(jù)集。RCF作為輸出用于衡量PFAS 在植物根系中的吸收和積累,計(jì)算公式如下:

RCF=Croot/Cmedia (1)

式中:Croot表示PFAS 在植物根系中的含量,mg·kg-1;Cmedia表示PFAS在生長(zhǎng)介質(zhì)中的濃度,mg·L-1(水培)或mg·kg-1(土培)。

本研究首先基于水培和土培數(shù)據(jù)集中共同的輸入特征,對(duì)水培數(shù)據(jù)進(jìn)行訓(xùn)練,學(xué)習(xí)與PFAS吸收積累的相關(guān)信息。隨后,將訓(xùn)練的最優(yōu)模型應(yīng)用于土培數(shù)據(jù)預(yù)測(cè)相應(yīng)的RCF。將RCF 預(yù)測(cè)值作為新的特征加入到土培數(shù)據(jù)集中,對(duì)整體土培數(shù)據(jù)構(gòu)建遷移學(xué)習(xí)模型,實(shí)現(xiàn)知識(shí)遷移。

1.2 特征提取和特征選擇

水培數(shù)據(jù)作為基礎(chǔ)模型的訓(xùn)練,所以在訓(xùn)練時(shí)選用和土培數(shù)據(jù)相同的特征作為輸入,包括污染物分子量、pKa、lg Kow、暴露時(shí)間、植物根系蛋白含量、根系脂質(zhì)含量和污染物的分子描述符,lg RCF 作為輸出。其中分子描述符使用Python包(PaDELPy)生成,共1 444個(gè),植物根系蛋白和脂質(zhì)含量從不同文獻(xiàn)中搜集得到[10-11]。為了優(yōu)化基礎(chǔ)模型和遷移模型效果,先初步訓(xùn)練水培基礎(chǔ)模型,將最優(yōu)模型中重要性為0的特征刪去,然后基于隨機(jī)森林的遞歸特征消除(RFECV)方法來進(jìn)一步簡(jiǎn)化特征個(gè)數(shù)。

在單獨(dú)訓(xùn)練土壤數(shù)據(jù)時(shí),選取栽培條件(植物種類、盆栽和大田實(shí)驗(yàn)2種培養(yǎng)模式、PFAS濃度、暴露時(shí)間)、土壤理化性質(zhì)(有機(jī)碳含量、土壤pH值)、植物理化性質(zhì)(根系蛋白含量、根系脂質(zhì)含量)以及污染物的1 444個(gè)分子描述符作為輸入特征。遷移學(xué)習(xí)預(yù)測(cè)土壤體系下的RCF 時(shí),用水培篩選后的相同特征作為輸入。

1.3 數(shù)據(jù)預(yù)處理

水培數(shù)據(jù)中部分植物缺少脂質(zhì)含量,而土培數(shù)據(jù)中部分污染物缺少pKa 和lg Kow,因此在構(gòu)建模型時(shí)分別刪除了14條和10條數(shù)據(jù),最終分別留下了378條和290條數(shù)據(jù)。

1.4 機(jī)器學(xué)習(xí)模型及效果評(píng)估

研究中選擇了隨機(jī)森林(RF)、極端梯度提升樹(XGB)、多元線性回歸(MLR)和支持向量機(jī)(SVM)4種機(jī)器學(xué)習(xí)模型來訓(xùn)練水培和土培數(shù)據(jù)集。采用8∶2隨機(jī)劃分分割數(shù)據(jù)集,五折交叉驗(yàn)證訓(xùn)練模型,貝葉斯優(yōu)化調(diào)整超參數(shù)。R2和均方根誤差(RMSE)是模型的評(píng)估指標(biāo),用于解釋數(shù)據(jù)方差及其預(yù)測(cè)的準(zhǔn)確性。SHAP 特征重要性解釋基于最佳的遷移學(xué)習(xí)模型進(jìn)行機(jī)制探討。

2 結(jié)果和討論

2.1 PFAS種類和lg RCF 分布

在水培與土培數(shù)據(jù)集中,PFAS種類和數(shù)量存在一定的差異。如圖1(a)所示,PFOA為8.99%,PFNA、PF?DA、PFHpA 和PFHeA 為7.94%,占據(jù)較大比例,其他PFAS化合物的分布相對(duì)均勻。圖1(b)表明土培數(shù)據(jù)集中,PFOS的比例顯著高于其他化合物,占27.68%,PFOA占13.15%,其次是PFHpA占8.65%,其余PFAS化合物的比例相對(duì)較小,基本在1.04%~8.30%之間。圖1(c)顯示了PFAS化合物的lg RCF 的分布情況,水培數(shù)據(jù)集中的lg RCF 中位數(shù)較高,數(shù)據(jù)離散性較大,這可能與其化學(xué)性質(zhì)、溶解性或與植物根系的相互作用相關(guān)。相比之下,土壤數(shù)據(jù)集中l(wèi)g RCF 中位數(shù)較低,數(shù)據(jù)分布更為集中,這可能與PFAS種類較少、植物品種以小麥為主有關(guān)。此外,土壤顆粒界面對(duì)PFAS的吸附作用,使得不同PFAS的行為趨于一致[12]。這些分析表明,土-水-植物多個(gè)界面過程對(duì)PFAS的行為和富集特性都有重要影響,可能需要進(jìn)一步研究不同環(huán)境條件下的遷移和積累機(jī)制。

2.2 水培體系最優(yōu)模型和特征篩選

為了獲得最優(yōu)的lg RCF 預(yù)測(cè)模型,基于R2 和RMSE值對(duì)4種廣泛使用的機(jī)器學(xué)習(xí)模型(XGB、RF、MLR和SVR)進(jìn)行了評(píng)估。如圖2所示,XGB模型的效果最佳,測(cè)試集R2=0.69,RMSE=0.51,RF模型次之,R2=0.66,RMSE=0.54。盡管SVR 在訓(xùn)練集上的表現(xiàn)相對(duì)較好,但其在測(cè)試集上的表現(xiàn)較差,這表明SVR模型存在過擬合的趨勢(shì),泛化能力不足。此外,MLR模型在訓(xùn)練集和測(cè)試集上的擬合效果均較差,表明MLR無法充分捕捉數(shù)據(jù)之間的復(fù)雜關(guān)系。從模型類型來看,XGB 和RF 都是基于決策樹的模型。相比RF,XGB通過梯度提升機(jī)制能夠逐步減少預(yù)測(cè)誤差,每一步都能針對(duì)前一步的誤差進(jìn)行補(bǔ)償。因此,XGB在處理不平衡數(shù)據(jù)集時(shí)表現(xiàn)出色,能夠更好地捕捉復(fù)雜的特征關(guān)系,并優(yōu)化預(yù)測(cè)結(jié)果。而SVR 則受限于其對(duì)輸入特征數(shù)量的處理能力,難以應(yīng)對(duì)本研究中大量輸入特征之間的復(fù)雜非線性關(guān)系,導(dǎo)致其容易過擬合[13]。此外,MLR模型的簡(jiǎn)單線性假設(shè)限制了其對(duì)數(shù)據(jù)復(fù)雜性的描述能力,無法有效捕捉特征間的非線性關(guān)系?;谀P偷谋憩F(xiàn),本研究選擇XGB模型進(jìn)行下一步特征篩選。通過使用XGB 模型對(duì)重要特征進(jìn)行篩選后,進(jìn)一步利用XGB模型進(jìn)行水培條件下的知識(shí)遷移,提升模型的泛化能力,并為土培體系下lg RCF 的精準(zhǔn)預(yù)測(cè)提供支持。

圖3(a)展示了不同特征數(shù)量下模型性能的變化趨勢(shì)。通過RFECV逐步調(diào)整特征個(gè)數(shù)并訓(xùn)練模型,最終選取了驗(yàn)證集R2最優(yōu)的特征子集,共保留了8個(gè)特征(ATS3m、暴露時(shí)間、根脂質(zhì)含量、ATS3s、ATS4m、AATS2v、ATS3e、ATS4s)。拓?fù)浣Y(jié)構(gòu)自相關(guān)(ATS)描述符,也稱為Moreau-Broto 自相關(guān)描述符。利用該描述符評(píng)估原子對(duì)(如電荷或質(zhì)量)的特定屬性與它們的拓?fù)渚嚯x(將它們分開鍵的數(shù)量)之間的相關(guān)性,以表征分子結(jié)構(gòu),相關(guān)的描述符包括AATS(平均ATS)、ATSC(中心ATS)和AATSC(平均ATSC)[14-15]。其中ATS3m、ATS3s、ATS4m、AATS2v、ATS3e、ATS4s(m指分子質(zhì)量、s指原子電荷、e指電負(fù)性、v指原子體積)描述符因其較高的重要性得分而被篩選出。使用8個(gè)最優(yōu)特征作為模型的輸入特征,進(jìn)一步評(píng)估XGB模型的性能。如圖3(b)所示,與未進(jìn)行特征篩選時(shí)相比,訓(xùn)練集的R2 值略微下降至0.88,說明模型減少了過擬合,但是測(cè)試集上的R2和RMSE沒有變化,表明模型的預(yù)測(cè)能力在簡(jiǎn)化特征后仍然保持穩(wěn)定。

2.3 土培體系最優(yōu)模型和知識(shí)遷移

對(duì)于土培數(shù)據(jù)集,研究使用了與水培相同的機(jī)器學(xué)習(xí)模型(XGB、RF、MLR、SVR),如圖4所示,這些模型的表現(xiàn)與在水培數(shù)據(jù)集上趨勢(shì)一致,XGB 模型依然表現(xiàn)最佳,其次是RF模型,而SVR和MLR模型表現(xiàn)相對(duì)較差,說明XGB模型在處理復(fù)雜環(huán)境數(shù)據(jù)時(shí),都能夠準(zhǔn)確捕捉非線性關(guān)系。XGB模型通過樹模型的逐步提升,有效地減少了預(yù)測(cè)誤差[16],確保了在兩個(gè)數(shù)據(jù)集上均能達(dá)到優(yōu)異的預(yù)測(cè)效果??傮w而言,水培和土培數(shù)據(jù)集在模型表現(xiàn)上的一致性表明了這些數(shù)據(jù)集中的共性,即都存在復(fù)雜的非線性模式和特征交互關(guān)系,基于決策樹的模型(XGB、RF)能夠提供更優(yōu)的預(yù)測(cè)結(jié)果。

由于水培體系中PFAS的吸收和積累機(jī)制較為直觀且易于研究,且PFAS種類更為豐富,本研究在此基礎(chǔ)上構(gòu)建了一個(gè)從水培體系到土壤體系的遷移學(xué)習(xí)模型,該模型通過知識(shí)共享的方式,有效提升了對(duì)復(fù)雜土壤體系中PFAS根系吸收和積累的預(yù)測(cè)精度。具體而言,遷移學(xué)習(xí)的過程首先基于水培體系中的特征篩選結(jié)果,使用水培模型對(duì)土培數(shù)據(jù)集進(jìn)行初步預(yù)測(cè),進(jìn)而將這些預(yù)測(cè)輸出作為土培模型的輸入特征。通過這種方式,模型能夠保留并利用水培體系中所捕捉到的PFAS 在水-植物根表過程某些關(guān)鍵特征信息,并將其融入到土壤體系的土-水-植物多界面建模過程中。如圖5所示,遷移學(xué)習(xí)后,各種機(jī)器學(xué)習(xí)模型的表現(xiàn)均有所提升,尤其是在測(cè)試集上的表現(xiàn)尤為顯著。其中,XGB 模型的效果最為突出。在訓(xùn)練集上,XGB 的R2 值從0.98 略微提升至0.99,RMSE 從0.09下降至0.07,然而,測(cè)試集上的變化則更加明顯。測(cè)試集R2從遷移前的0.83提升至0.86,RMSE從0.28下降至0.25。訓(xùn)練集上提升較小的原因在于模型本身在訓(xùn)練集上已經(jīng)有較強(qiáng)的擬合能力,因此遷移后的主要改進(jìn)體現(xiàn)在模型的泛化能力上,而非單純提高訓(xùn)練集的擬合效果[17]。這種優(yōu)化不僅使得模型在土培體系下表現(xiàn)更加穩(wěn)健,也為實(shí)際應(yīng)用中復(fù)雜環(huán)境數(shù)據(jù)的建模提供了新的思路。通過遷移學(xué)習(xí)的知識(shí)共享,成功利用了水培體系中的信息,增強(qiáng)了土培體系中PFAS積累預(yù)測(cè)的準(zhǔn)確性,從而驗(yàn)證了遷移學(xué)習(xí)在處理不同環(huán)境體系中的有效性。

2.4 特征重要性分析

基于土壤數(shù)據(jù)遷移前后的XGB 模型,本研究利用SHAP分析探究了影響lg RCF 的重要特征。如圖6(a)和圖6(b)所示,特征重要性排名前五的因素依次為暴露時(shí)間、土壤pH值、PFAS濃度、土壤有機(jī)碳含量以及遷移模型預(yù)測(cè)。暴露時(shí)間是最關(guān)鍵的影響因素。暴露時(shí)間越短,植物與PFAS的相互作用時(shí)間越少,導(dǎo)致吸收積累率越低。隨著暴露時(shí)間的增加,PFAS的累積效應(yīng)逐漸顯現(xiàn),lg RCF 值也會(huì)增加。有研究表明,這一趨勢(shì)可能與植物的生長(zhǎng)周期密切相關(guān),在最初的40 d內(nèi),植物的根部迅速生長(zhǎng),根系吸收較強(qiáng),從而產(chǎn)生較高的lg RCF 值,在約70 d后,植物根系開始腐爛,從而影響PFAS 的吸收效率,這可能導(dǎo)致暴露60 d lg RCF 值出現(xiàn)顯著下降[9,18]。

土壤pH 值在本研究中顯示出第二重要的影響力。PFAS多為含羧基或磺酸基團(tuán)的離子型化合物,其吸收效率受到土壤pH值的顯著影響。在堿性土壤中,負(fù)電荷狀態(tài)的PFAS化合物可能更容易通過土壤溶液擴(kuò)散,進(jìn)而降低根系的吸收效率[19]。已有研究表明,中性pH值范圍最有利于植物根系的生長(zhǎng)及其對(duì)PFAS的捕獲能力,在較高的pH條件下(gt;7.7),lg RCF值可能較低,可能是植物在堿性環(huán)境下受到脅迫所致[20]。除此之外,PFAS在植物組織中的富集含量與培養(yǎng)介質(zhì)中的暴露濃度密切相關(guān)。當(dāng)土壤中的PFAS含量高于10 μg·kg-1時(shí),lg RCF 值下降趨勢(shì)較緩,而當(dāng)含量低于該特征值后lg RCF 值急劇下降。這一趨勢(shì)可以歸因于低含量PFAS時(shí)植物的吸收效率較低[21]。然而,由于植物根部的載體蛋白、陰離子通道和水通道蛋白的數(shù)量有限,不同植物種類的根系對(duì)PFAS物質(zhì)的轉(zhuǎn)運(yùn)路徑有所不同,這種差異可能導(dǎo)致不同的吸收表現(xiàn)[22]。

土壤有機(jī)碳含量是影響土壤對(duì)PFAS 吸收行為的關(guān)鍵因素。PFAS 通過疏水作用被大量吸附在有機(jī)碳上,這可能導(dǎo)致有機(jī)質(zhì)微孔堵塞或構(gòu)象改變,從而增加PFAS 在土壤中的滯留,降低其生物可利用性[22-23]。Xiang 等[9]的研究也表明了類似的趨勢(shì),即隨著有機(jī)碳含量從2.2%增加到2.4%,RCF 值急劇下降。這進(jìn)一步驗(yàn)證了有機(jī)碳含量在控制PFAS 吸收過程中的重要作用。

圖6(c)和圖6(d)展示了知識(shí)遷移之前XGB模型的特征重要性排名。從水培遷移到土培數(shù)據(jù)集的過程中,主要用暴露時(shí)間、根脂質(zhì)含量和分子結(jié)構(gòu)信息等水培模型篩選的特征維度實(shí)現(xiàn)遷移學(xué)習(xí)。在土培數(shù)據(jù)集遷移學(xué)習(xí)前,根脂質(zhì)含量的特征重要性排名較低,這表明盡管它對(duì)某些PFAS分子的吸收和積累有一定影響,但在整體模型中的貢獻(xiàn)較小,遠(yuǎn)不及暴露時(shí)間和土壤pH等特征顯著,但在水培模型中根脂質(zhì)含量是一個(gè)相對(duì)重要的特征,這歸因于復(fù)雜的土壤環(huán)境削弱了其影響。在遷移到土壤體系后,根脂質(zhì)含量的重要性進(jìn)一步降低,這是由于遷移學(xué)習(xí)過程中已經(jīng)包含了水-植物界面過程中根脂質(zhì)含量的信息,導(dǎo)致遷移后的模型中該特征的重要性有所下降。這表明脂質(zhì)含量的信息在遷移過程中變得冗余,XGB 模型優(yōu)先考慮了對(duì)新環(huán)境更為關(guān)鍵的特征,自適應(yīng)調(diào)整該特征的相對(duì)重要性。值得注意的是,GATS7i分子描述符在土壤體系中的重要性提升。GATS7i衡量的是分子中相距7 個(gè)鍵的原子之間的電離能相關(guān)性。PFAS分子的電離狀態(tài)直接影響其與植物根系的相互作用,GATS7i通過加權(quán)第一電離能,揭示了距離較遠(yuǎn)的原子在不同環(huán)境條件下如何影響PFAS分子的電離趨勢(shì)或行為[24]。其重要性的提升表明,在土-水-植物多個(gè)界面復(fù)雜過程中,分子結(jié)構(gòu)和電子分布對(duì)PFAS的吸收和積累行為有了更大的影響。

總的來說,遷移學(xué)習(xí)幫助模型捕捉到了從水培系統(tǒng)到土培體系中PFAS行為的變化,尤其是部分信息的冗余和分子結(jié)構(gòu)特征在土壤環(huán)境中的增強(qiáng)作用,為研究PFAS在復(fù)雜土壤條件下的遷移和吸收積累機(jī)制提供了新的思路。

3 結(jié)論

(1)相較于水培體系,土培體系lg RCF 中位數(shù)小且分布集中,這與PFAS 在土-水界面上的吸附作用相關(guān),兩者數(shù)據(jù)融合可以支撐PFAS多相界面過程的機(jī)制模型。

(2)XGB 模型在水培和土培數(shù)據(jù)集上顯著優(yōu)于RF、MPL、SVR 模型。通過水培知識(shí)遷移,XGB 模型在土壤數(shù)據(jù)集預(yù)測(cè)中的穩(wěn)定性和預(yù)測(cè)精度得到增強(qiáng),為研究PFAS在復(fù)雜環(huán)境中的植物吸收和富集機(jī)制提供了新的思路。

(3)通過特征重要性分析發(fā)現(xiàn),遷移學(xué)習(xí)后PFAS分子結(jié)構(gòu)和電子分布在土培條件下對(duì)PFAS吸收行為具有重要影響,而根脂質(zhì)含量的重要性降低。

參考文獻(xiàn):

[1] QIAN L, ZHAO H Y, SCHIERZ A, et al. A deep insight into

perfluorooctanoic acid photodegradation using metal ion-exchanged

zeolites[J]. ACS ESamp;T Engineering, 2024, 4(3):748-757.

[2] JOHNSON G R. PFAS in soil and groundwater following historical land

application of biosolids[J]. Water Research, 2022, 211:118035.

[3] ZHANG J F, HU L H, XU H Y. Dietary exposure to per - and

polyfluoroalkyl substances:potential health impacts on human liver[J].

Science of the Total Environment, 2024, 907:167945.

[4] SONG C Z, GU Q, ZHANG D K, et al. Prediction of PFAS

bioaccumulation in different plant tissues with machine learning

models based on molecular fingerprints[J]. Science of the Total

Environment, 2024, 950:175091.

[5] HUANG D L, XIAO R H, DU L, et al. Phytoremediation of poly- and

perfluoroalkyl substances:a review on aquatic plants, influencing

factors, and phytotoxicity[J]. Journal of Hazardous Materials, 2021,

418:126314.

[6] GAO F, SHEN Y K, BRETT SALLACH J, et al. Predicting crop root

concentration factors of organic contaminants with machine learning

models[J]. Journal of Hazardous Materials, 2022, 424:127437.

[7] LIU X, LU D W, ZHANG A Q, et al. Data-driven machine learning in

environmental pollution:gains and problems[J]. Environmental Science

amp; Technology, 2022, 56(4):2124-2133.

[8] ADU O, BRYANT M T, MA X M, et al. A machine learning approach

for predicting plant uptake and translocation of per - and

polyfluoroalkyl substances(PFAS) from hydroponics[J]. ACS ESamp;T

Engineering, 2024, 4(8):1884-1890.

[9] XIANG L, QIU J, CHEN Q Q, et al. Development, evaluation, and

application of machine learning models for accurate prediction of root

uptake of per - and polyfluoroalkyl substances[J]. Environmental

Science amp; Technology, 2023, 57(46):18317-18328.

[10] ZHU Y H, ZHANG S Z, ZHU Y G, et al. Improved approaches for

modeling the sorption of phenanthrene by a range of plant species[J].

Environmental Science amp; Technology, 2007, 41(22):7818-7823.

[11] MURANO H, OTANI T, SEIKE N, et al. Dieldrin uptake and

translocation in plants growing in hydroponic medium[J].

Environmental Toxicology and Chemistry, 2010, 29(1):142-148.

[12] LIU Z Y, LU Y L, SONG X, et al. Multiple crop bioaccumulation and

human exposure of perfluoroalkyl substances around a mega

fluorochemical industrial park, China:implication for planting

optimization and food safety[J]. Environment International, 2019, 127:

671-684.

[13] JIANG S Y, ZHOU Y R, XU W, et al. Machine learning-driven

optimization and application of bimetallic catalysts in

peroxymonosulfate activation for degradation of fluoroquinolone

antibiotics[J]. Chemical Engineering Journal, 2024, 486:150297.

[14] ZHENG T Y, MITCHELL J B O, DOBSON S. Revisiting the

application of machine learning approaches in predicting aqueous

solubility[J]. ACS Omega, 2024, 9(32):35209-35222.

[15] ANDROUTSOS L, PALLANTE L, BOMPOTAS A, et al. Predicting

multiple taste sensations with a multiobjective machine learning

method[J]. NPJ Science of Food, 2024, 8:47.

[16] WANG K, HU S J, LI D Q, et al. Ensemble tree model prediction of

summer precipitation in north China based on predictor selection

strategy[J]. Climate Dynamics, 2024, 62(7):6539-6554.

[17] WANG F Q, ZHOU Y C, YAN H Z, et al. Enhancing the

generalization ability of deep learning model for radio signal

modulation recognition[J]. Applied Intelligence, 2023, 53(15):18758-

18774.

[18] CHEN L, ZHANG S Z, HUANG H L, et al. Partitioning of

phenanthrene by root cell walls and cell wall fractions of wheat

(Triticum aestivum L.)[J]. Environmental Science amp; Technology,

2009, 43(24):9136-9141.

[19] MA X, LIU X P, DING S L, et al. Sorption and leaching behavior of

bithionol and levamisole in soils[J]. Chemosphere, 2019, 224:519-

526.

[20] ZHAO H X, GUAN Y, QU B C. PFCA uptake and translocation in

dominant wheat species(Triticum aestivum L.)[J]. International

Journal of Phytoremediation, 2018, 20(1):68-74.

[21] XIANG L, CHEN X T, YU P F, et al. Oxalic acid in root exudates

enhances accumulation of perfluorooctanoic acid in lettuce[J].

Environmental Science amp; Technology, 2020, 54(20):13046-13055.

[22] ADU O, MA X M, SHARMA V K. Bioavailability, phytotoxicity and

plant uptake of per-and polyfluoroalkyl substances(PFAS):a review

[J]. Journal of Hazardous Materials, 2023, 447:130805.

[23] LIU M, TIAN S Y, CHEN P, et al. Predicting the bioavailability of

sediment-associated polybrominated diphenyl ethers using a 45-d

sequential Tenax extraction[J]. Chemosphere, 2011, 85(3):424-431.

[24] PASTEWSKA M, BEDNARCZYK-CWYNAR B, KOVA?EVI? S, et

al. Multivariate assessment of anticancer oleanane triterpenoids

lipophilicity[J]. Journal of Chromatography A, 2021, 1656:462552.

猜你喜歡
遷移學(xué)習(xí)機(jī)器學(xué)習(xí)
遷移學(xué)習(xí)研究綜述
從認(rèn)知角度探討大學(xué)英語網(wǎng)絡(luò)教學(xué)模式
基于多特征融合的跨域情感分類模型研究
奇異值分解與移移學(xué)習(xí)在電機(jī)故障診斷中的應(yīng)用
基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
前綴字母為特征在維吾爾語文本情感分類中的研究
基于支持向量機(jī)的金融數(shù)據(jù)分析研究
機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
台东县| 正镶白旗| 赤壁市| 江安县| 灌阳县| 遵义县| 潮安县| 开封市| 大港区| 江安县| 奉化市| 加查县| 和平区| 长乐市| 仁寿县| 门源| 玉环县| 松滋市| 家居| 北安市| 克山县| 江西省| 公安县| 祁阳县| 修武县| 新泰市| 吉首市| 临清市| 嘉兴市| 贡觉县| 东台市| 甘德县| 建水县| 化德县| 太康县| 共和县| 永川市| 青田县| 济宁市| 仁寿县| 理塘县|