朱騰義 姜 越
(揚(yáng)州大學(xué)環(huán)境科學(xué)與工程學(xué)院, 揚(yáng)州 225127)
疏水性有機(jī)污染物大多會(huì)匯聚在水體沉積物中[1],隨著沉積物在環(huán)境介質(zhì)的遷移、轉(zhuǎn)化,其潛在毒性使有機(jī)污染物對(duì)整個(gè)生物圈都產(chǎn)生不可逆的影響.因此準(zhǔn)確測(cè)定有機(jī)污染物的濃度有利于從整體上認(rèn)識(shí)其在環(huán)境介質(zhì)中的分布及歸趨.而被動(dòng)采樣是一種用于檢測(cè)水、沉積物、土壤、空氣或其他環(huán)境媒介中有機(jī)污染物濃度的強(qiáng)有力工具[2-3].被動(dòng)采樣是以污染物在兩相間擴(kuò)散的化學(xué)勢(shì)能梯度作為動(dòng)力,用來(lái)測(cè)定污染物逸度的平衡采樣技術(shù)[4].常見的被動(dòng)采樣器主要分為固相微萃取(solid phase microextraction,SPME)和半透膜(semipermeable membrane device,SPMD)[5]2種.SPME利用石英纖維表面不同性質(zhì)的涂層吸附不同類型的化合物.在測(cè)定非極性污染物時(shí)最常用的涂層是聚二甲基硅氧烷(PDMS).有機(jī)污染物在PDMS與水相中的分配系數(shù)(KPDMS-W)是權(quán)衡被動(dòng)采樣器性能的重要指標(biāo)[6].目前常用的實(shí)驗(yàn)測(cè)定KPDMS-W值方法有靜態(tài)法和動(dòng)態(tài)法2種.文獻(xiàn)[7-9]利用靜態(tài)法測(cè)定有機(jī)污染物的KPDMS-W值,其主要原理分為單點(diǎn)校正[7,10]和多點(diǎn)校正[11].靜態(tài)法的主要缺點(diǎn)是只考慮了SPME光纖與水相之間的兩相平衡,而忽略了化合物自身?yè)]發(fā)或由于系統(tǒng)表面的吸附所引起的損失,從而造成了較大的測(cè)量誤差.動(dòng)態(tài)法[12-13]則對(duì)上述問題進(jìn)行了優(yōu)化,消除了部分誤差.然而,對(duì)于疏水性較強(qiáng)的化合物,系統(tǒng)表面的吸附所帶來(lái)的誤差仍不能忽略.同時(shí),采樣器內(nèi)化合物的運(yùn)輸取決于很多因素,包括采樣器固相內(nèi)部自由空隙體積的大小和固相碳鏈上節(jié)段遷移率等[2].目前有機(jī)污染物的KPDMS-W值均是通過(guò)繁瑣的實(shí)驗(yàn)測(cè)得,費(fèi)時(shí)且費(fèi)力,因此,開發(fā)一種預(yù)測(cè)模型方法用來(lái)預(yù)測(cè)污染物的KPDMS-W值十分必要.
目前的預(yù)測(cè)方法主要有3種:① 分配系數(shù)法,即利用化合物的辛醇水分配系數(shù)間的關(guān)系式來(lái)計(jì)算KPDMS-W值;② 線性自由能關(guān)系(LFER)法;③ 理論線性溶解能關(guān)系(TLSER)法.由于化合物的辛醇水分配系數(shù)(Kow)常用于度量化合物的疏水性程度,因此利用待測(cè)物的KPDMS-W值與Kow值之間的關(guān)系來(lái)預(yù)測(cè)KPDMS-W值是一種主流的預(yù)測(cè)方法.該方法的優(yōu)點(diǎn)是,當(dāng)分子量較小時(shí),HOCs(如PAHs)的Kow值在3.36~6.50范圍內(nèi),Kow與KPDMS-W呈良好的正相關(guān)性.缺點(diǎn)是當(dāng)分子量較大時(shí)HOCs(如PCBs)從水相向PDMS涂層的萃取過(guò)程主要是靠吸附而不是吸收,也就是說(shuō),Kow與KPDMS-W之間是非線性的.因此,針對(duì)疏水性較強(qiáng)的化合物,利用Kow值來(lái)預(yù)測(cè)化合物KPDMS-W值具有一定局限性.
另一種預(yù)測(cè)方法是利用計(jì)算機(jī)基于多參數(shù)線性自由能關(guān)系(pp-LFER)建立模型,優(yōu)點(diǎn)是通過(guò)理論計(jì)算得到分子描述符,提升了對(duì)實(shí)驗(yàn)參數(shù)未知化學(xué)品的預(yù)測(cè)能力.它允許在完全脫離實(shí)驗(yàn)測(cè)定的條件下,預(yù)測(cè)所感興趣的化合物的性質(zhì),實(shí)現(xiàn)了虛擬預(yù)測(cè)或計(jì)算機(jī)(in silico)預(yù)測(cè)技術(shù).缺點(diǎn)為pp-LFER預(yù)測(cè)模型缺少溶質(zhì)(化學(xué)品)相關(guān)的Abraham描述符(E、S、A、B、V).此外,由于缺少不同溫度下實(shí)驗(yàn)數(shù)據(jù)的校準(zhǔn),pp-LFER模型對(duì)不同溫度下分配系數(shù)的預(yù)測(cè)仍然存在缺陷.
TLSER是在 LSER的基礎(chǔ)上通過(guò)理論計(jì)算代替LSER經(jīng)驗(yàn)性描述符而建立起來(lái)的一種研究方法[14].這種研究方法可以彌補(bǔ)現(xiàn)有數(shù)據(jù)的缺失、減少實(shí)驗(yàn)測(cè)試費(fèi)用和評(píng)估實(shí)驗(yàn)結(jié)果數(shù)據(jù)的不確定性,同時(shí)可以很好地定量化評(píng)價(jià)污染物對(duì)環(huán)境的影響,如陳景文等[15]應(yīng)用TLSER預(yù)測(cè)了部分鹵代芳烴的正辛醇/空氣分配系數(shù),朱騰義等[16]基于TLSER模型預(yù)測(cè)了部分有機(jī)污染物的LDPE膜/空氣分配系數(shù).多環(huán)芳烴(PAHs)和多氯聯(lián)苯(PCBs)因其來(lái)源多樣性廣以及對(duì)水生生物的毒性強(qiáng)而受到了國(guó)內(nèi)外很多學(xué)者的關(guān)注[17].本文以部分PAHs和PCBs的logKPDMS-W實(shí)測(cè)值為樣本,利用TLSER建立模型,對(duì)部分有機(jī)污染物KPDMS-W值進(jìn)行預(yù)測(cè)與表征.
通過(guò)查閱文獻(xiàn)[18-21]并整理得到本次1個(gè)數(shù)據(jù)集共109種化合物的KPDMS-W實(shí)測(cè)值,其中包含了84個(gè)PCBs和25個(gè)PAHs.所建模型的泛化能力可通過(guò)將化合物劃分訓(xùn)練集和驗(yàn)證集進(jìn)行體現(xiàn),在109種疏水性有機(jī)污染物中隨機(jī)選擇80%的化合物作為訓(xùn)練集,剩余20%的化合物作為驗(yàn)證集進(jìn)行預(yù)測(cè)檢驗(yàn).
在計(jì)算分子結(jié)構(gòu)描述符前,首先利用ChemBio 3D Ultra 12.0軟件生成數(shù)據(jù)集中所有化合物的初始分子結(jié)構(gòu),其次,運(yùn)行Minimize Energy將化合物最小能量化以模擬該化合物在自然界中最穩(wěn)定狀態(tài),利用MOPAC 2016模塊中的Mopac Interface PM7算法[22]對(duì)化合物結(jié)構(gòu)進(jìn)行優(yōu)化并計(jì)算,從輸出文件中提取5個(gè)量化描述符(α,εb,εa,q-,q+),最后運(yùn)行PaDEL-Descriptor[23]軟件得到各化合物的分子結(jié)構(gòu)描述符,提取其中McGowan特征體積描述符.
TLSER模型是基于LSER理論,同時(shí)結(jié)合量子化學(xué)方法提出和發(fā)展起來(lái)的一種理論模型[14],其表達(dá)式如下:
KPDMS-W=k+aV+bα+cεb+dq-+eεa+fq+
式中,V為分子McGowan體積;α為分子極化率[16];εb表征氫鍵堿度;εa表征氫鍵酸度[24];q-為分子最負(fù)的原子凈電荷;q+為分子最正的原子凈電荷;a、b、c、d、e和f為多元線性回歸系數(shù)[25];k為常數(shù)項(xiàng).
(1)
(2)
(3)
(4)
采用基于模型本身驗(yàn)證過(guò)程中計(jì)算得到的標(biāo)準(zhǔn)殘差δ和leverage值定義的Williams圖[17]表征預(yù)測(cè)模型的應(yīng)用域.δ、H、hi及警戒值h*的計(jì)算公式如下:
(5)
H=X(XTX)-1XT
(6)
(7)
h*=3(m+1)/n
(8)
(9)
式中,X為n×mn×m的矩陣,表征了模型中訓(xùn)練集化合物的描述符空間;hi為第i個(gè)化合物的杠桿值;xii為第i個(gè)化合物分子結(jié)構(gòu)描述符的行向量;SEM為均值標(biāo)準(zhǔn)誤差.
最優(yōu)模型表達(dá)式為
logKPDMS-W=2.658V+51.89εb-3.11
(10)
圖1 logKPDMS-W實(shí)測(cè)值與預(yù)測(cè)值的擬合關(guān)系
如圖2所示,本文TLSER模型采用Williams圖來(lái)表征其應(yīng)用域.若有機(jī)污染物的標(biāo)準(zhǔn)殘差δ落在(-3.0,+3.0)以外,則認(rèn)為該點(diǎn)是離群點(diǎn).由圖2可見,模型中除一個(gè)化合物為離群點(diǎn)外其余所有化合物都在應(yīng)用域中,訓(xùn)練集和驗(yàn)證集中化合物的標(biāo)準(zhǔn)殘差|δ|≤3,且這些化合物的杠桿值h均小于警戒值h*=0.103,可見訓(xùn)練集和驗(yàn)證集都具有較高的代表性.而僅有一個(gè)離群點(diǎn)可能是由于該化合物實(shí)驗(yàn)值本身存在誤差而偏離了本模型應(yīng)用域.因此TLSER模型能對(duì)應(yīng)用域內(nèi)其他有機(jī)污染物分配系數(shù)的logKPDMS-W值進(jìn)行預(yù)測(cè).
表1 數(shù)據(jù)集中化合物的logKPDMS-W值
注:*表示化合物為驗(yàn)證集.
圖2 TLSER模型的Williams圖
TLSER模型中包含2個(gè)分子描述符,即McGowan特征體積V和氫鍵堿度εb.氫鍵是由價(jià)鍵和靜電2部分構(gòu)成[29],εb表征分子提供質(zhì)子或接受電子對(duì)的能力,在本模型中εb與logKPDMS-W值呈正相關(guān).因此,當(dāng)溶質(zhì)分子作為氫鍵受體時(shí),氫鍵堿度越小,與水的氫鍵相互作用越弱,logKPDMS-W值就越大,化合物分子也就更容易分配到被動(dòng)采樣材料相中.
McGowan特征體積V表征空穴形成作用,系數(shù)為正值.由于水分子排列高度有序且凝聚性強(qiáng)[30],而PDMS空間位阻較大使其凝聚性較弱,故化合物在PDMS中形成空穴的能量遠(yuǎn)小于其在水中形成空穴的能量.因此,化合物分子更容易通過(guò)空穴形成作用分配到采樣材料相中.
將本文構(gòu)建的TLSER模型與前人研究PAHs和PCBs的模型進(jìn)行比較,結(jié)果見表2.由表可得,數(shù)據(jù)集中化合物數(shù)量的增多會(huì)引起模型預(yù)測(cè)能力的降低,且前人模型中描述符主要為Kow.前文提到,目前針對(duì)化學(xué)結(jié)構(gòu)相似化合物的Kow值在小范圍內(nèi)與KPDMS-W值呈良好的正相關(guān)關(guān)系,而在大范圍內(nèi)并沒有呈現(xiàn)良好的線性關(guān)系.因此,利用Kow作為描述符建立的模型,其預(yù)測(cè)能力不能滿足目前對(duì)其他化合物KPDMS-W值的預(yù)測(cè)需求.本模型利用2個(gè)參數(shù)(V和εb)彌補(bǔ)了Kow作為描述符的部分局限性,對(duì)同種化合物(如文獻(xiàn)[9]中的PCBs)有更高的擬合度,而且,數(shù)據(jù)集中化合物更加豐富,化合物的實(shí)測(cè)值跨度更大,應(yīng)用域也更加廣泛.同時(shí),與文獻(xiàn)[33-34]中2種模型相比,本模型針對(duì)PAHs和PCBs這2類化合物進(jìn)行了研究,補(bǔ)充了針對(duì)2類化合物KPDMS-W值的模型預(yù)測(cè)方法.因此,本模型與前人預(yù)測(cè)模型相比,優(yōu)點(diǎn)在于描述符數(shù)量少,數(shù)據(jù)集中化合物數(shù)量多且預(yù)測(cè)結(jié)果準(zhǔn)確性高,具有良好的擬合優(yōu)度和預(yù)測(cè)能力.
表2 模型比較
1) 采用理論線性溶解能關(guān)系,構(gòu)建了PCBs和PAHs兩類共109種疏水性有機(jī)污染物PDMS膜水分配系數(shù)的預(yù)測(cè)模型.
3) 模型具有較少參數(shù)(V和εb)的同時(shí)包含更加豐富的數(shù)據(jù)集,化合物的實(shí)測(cè)值跨度大,應(yīng)用域廣泛,對(duì)PCBs和PAHs這2類化合物預(yù)測(cè)精度較高,可用于預(yù)測(cè)在應(yīng)用域范圍內(nèi)其他與這2類化合物結(jié)構(gòu)相似的有機(jī)污染物的KPDMS-W值.