劉紅霞,李 瓊,吳風林
(1湖北理工學院環(huán)境科學與工程學院,湖北黃石435003;2湖北理工學院礦區(qū)環(huán)境污染控制與修復湖北省重點實驗室,湖北黃石435003)
酚類化合物已成為重要的環(huán)境有毒污染物,世界各國對于其環(huán)境污染和生態(tài)效應的研究都給予了高度重視[1-2]。其中,酚類化合物對水生生物的影響不容忽視,它能夠使水生生物繁殖能力下降、生長變慢,甚至導致其死亡[3-5]。已有研究表明,酚類化合物具有較強激素作用,是誘發(fā)腫瘤的環(huán)境內(nèi)分泌干擾物[6-8]。因此,對酚類化合物生物活性的研究具有重要意義。
酚類化合物種類繁多、數(shù)量龐大,近年來相關研究者已廣泛運用定量結構-活性相關(Quantitative Structure-Activity Relationship,QSAR)推測其分子結構與生物活性的關系。酚類化合物常用的分子結構參數(shù)有物理化學參數(shù)、拓撲參數(shù)、幾何參數(shù)以及量子化學參數(shù)[9],主要計算方法有拓撲指數(shù)法[10-11]、比較分子力場方法(CoMFA)[12]、支持向量機法[13-14]、量子化學密度泛函理論(DFT)法[15-16]等。QSAR 所建模型穩(wěn)定性好,適用于預測酚類化合物各類生物活性,在研究環(huán)境污染物毒性方面有重要的實用價值。
近年來,分子電性距離矢量(Molecular Electronegativity-Distance Vector,MEDV)用于對多種有毒化合物的結構與活性研究,已顯示出其良好的分辨率和高度相關性[17-18]。而將MEDV 用于酚類化合物對水生生物急性毒性等活性的研究相對較少[19-21]。因此,本文采用MEDV 法對25 種取代酚進行了結構表征,運用多元線性回歸(Multiple Linear Regression,MLR)建立了該類化合物與其生物活性的QSAR 模型。
王連生等報道了25 個取代酚化合物對黑頭呆魚的毒性數(shù)據(jù),即其對黑頭呆魚的半數(shù)致死濃度LC50[10]。本文引用該LC50值,取其負對數(shù)(-lgLC50)作為生物活性指標,將25 個取代酚的MEDV 值以及對黑頭呆魚的毒性實驗值、預測值列于表1。
表1 25 個取代酚的MEDV 值以及對黑頭呆魚的毒性實驗值、預測值
MEDV 需要指定分子中4 種非氫原子類型,用來表達分子中電性不同的原子以及不同類型化學鍵特征。MEDV 具體定義:根據(jù)與其相連的非氫原子數(shù)目將碳(C)、氧(O)、氮(N)、硫(S)等非氫原子分為1,2,3,4 這4 種原子類型,原子類型通常以k 或l 表示。如果k =1,表示該原子只與1 個非氫原子相連;依次類推,k =2,3,4,分別表示該原子與2 個、3個、4 個非氫原子相連。
MEDV 定義原子屬性,意在表征不同原子或同一原子由于處于不同環(huán)境而性質(zhì)不同的結構特征。原子屬性包含元素的電負性和成鍵特性,可以反映出該原子在分子中的化學鍵型。一般地,原子屬性以1 個雙字符串表示,其中,第1 個字母表示原子元素符號,第2 個字母或數(shù)字表示鍵型。如原子屬性為“CC”,表示該原子為處于共扼體系中的碳原子,第1個字母是該原子元素符號“C”,第2 個字符“C”表示碳原子(C)處于共扼體系中。
MEDV 定義相對電性及相對鍵長。某元素相對電性(q)為該元素電負性與碳元素電負性(2.55)的比值,如氧和氮的相對電性分別為q = 3.44/2.55 = 1.3490 和q = 3.04/2.55 = 1.1922。某化學鍵相對鍵長(d)為該鍵鍵長與碳碳單鍵(C-C,0.154 nm)的比值,如CC-CC 鍵的相對鍵長為d =0.144/0.154=0.9351 nm。分子結構中大多數(shù)化學鍵的鍵長數(shù)值變化小,考慮到計算的簡便性,除共扼與環(huán)體系外同一化學鍵在不同分子環(huán)境中的鍵長均看作相等[22]。
眾所周知,一個化合物的分子性質(zhì)取決于分子結構中不同環(huán)境原子間的各種相互作用,其大小隨著原子的電性、化學鍵型以及各種連接關系而變化。MEDV 就是一個新的矢量型結構描述子,表示分子結構中各非氫原子的不同結構特征,通過獲得各非氫原子之間的相互作用來定量估計分子的性質(zhì)。MEDV 的計算公式如下:
式(1)中,k 或l 指原子類型,原子i 和j 分別屬于第k 類型和第l 類型;qi和qj分別指原子i 和j 的電性(以相對電性表示);dij指原子i 和j之間的距離(以相對鍵長表示),是原子i 通過一個或多個化學鍵到原子j 的路徑中各相對鍵長之和。因此,MEDV 應有10 個變量,依次為:M11、M12、M13、M14、M22、M23、M24、M33、M34、M44。
采用MEDV 計算方法得到了25 個取代酚的MEDV 值,具體數(shù)值如表1所示。其中,所有化合物的M44均為0,故舍去這一變量。
采用SPSS17.0 統(tǒng)計分析軟件對25 個取代酚化合物MEDV 值與生物活性實驗值(表1)進行多元線性全回歸法分析。其中變量M14被排除,得到8 個變量的預測模型(M1):
-lgLC50= 3.967 + 0.717 M11-0.010 M12-0.221 M13+ 0.100 M22-0.003 M23+0.307 M24+0.353 M33+0.383 M34;
統(tǒng)計參數(shù):N =25,m =8,R =0.678,SD =0.712,F(xiàn)=1.701。
一般地,相關系數(shù)R 作如下劃分[23]:
|R| <0.4 為低度線性相關,0.4 ≤|R| <0.7 為顯著性相關,0.7≤|R| <1 為高度線性相關。模型(M1)中相關系數(shù)(R)為0.678,說明取代酚類化合物分子結構與其生物毒性之間存在著顯著線性關系。
為消除變量間偶然性相關,逐步回歸分析剔除影響模型穩(wěn)定性的自變量而使回歸方程始終顯著。首先選擇影響最顯著的變量建立模型;再逐個引入其他變量,當原變量由于引入變量后影響不再顯著時,就將其剔除。經(jīng)過逐個“引入-剔除-引入”的反復過程,直到無顯著變量引入也無顯著變量剔除為止。采用SPSS17.0 統(tǒng)計分析軟件進行逐步回歸分析,結果如表2所示;逐步回歸相關系數(shù)(R)及標準偏差(SD)隨逐步回歸的變化情況如圖1所示。
表2 逐步回歸分析結果(N=25)
圖1 相關系數(shù)(R)和標準偏差(SD)隨逐步回歸的變化情況
由表2 和圖1 可以明顯看出,隨著引入變量個數(shù)增加,相關系數(shù)(R)逐漸增大,標準偏差(SD)先逐漸減小而后逐漸增大。當引入變量數(shù)m =6 時,R =0.676,SD 最小(SD =0.673)。綜合考慮各方面情況可以得出,當引入6 個變量時,建立的模型最好。此時用25 個取代苯酚的MEDV 值與其半數(shù)致死濃度LC50相關聯(lián),建立6 個變量的預測模型(M2)為:
-lgLC50= 4.038 + 0.344 M33-0.027 M12+ 0.096 M22+ 0.780 M11-0.231 M13+0.578 M24;
統(tǒng)計參數(shù):N =25,m =6,R =0.676,SD =0.673,F(xiàn)=2.523。
模型(M2)中相關系數(shù)(R)為0.676。根據(jù)文獻[23]對R 分級判定,同樣說明取代酚類化合物分子結構與其生物毒性之間存在著顯著線性關系。
比較2 個模型各統(tǒng)計參數(shù)(m,R,SD,F(xiàn))。模型(M2)使用6 個變量得到與模型(M1)相同的相關系數(shù)(R),并且標準偏差(SD)更小,表明模型(M2)較模型(M1)更優(yōu)越。使用模型(M2)對25 個取代苯酚生物毒性進行預測,計算結果如表1所示,將所得預測值與實驗值相關情況繪于圖2。在圖2 中,絕大多數(shù)取代酚的實驗值與預測值分布于過原點45°直線周圍,只有少數(shù)化合物出現(xiàn)偏離。由此說明絕大多數(shù)取代酚的實驗值與預測值呈顯著線性關系,M2 模型對絕大多數(shù)取代苯酚生物毒性的預測值與實驗值能較好地吻合。
圖2 模型(M2)的預測值與實驗值相關情況
針對25 種取代苯酚對黑頭呆魚急性毒性的QSAR 研究報道了3 種方法。王連生等采用拓撲指數(shù)法發(fā)現(xiàn)酚類結構與毒性之間顯著相關(N =25,R =0.934)[10]。崔秀君等采用支持向量機法得到滿意預測模型結果(N = 25,R =0.959)[13]。劉天寶等采用DFT 法得到穩(wěn)定性和預測性良好的模型(N =25,R =0.964)[15]。需要指出的是,以上3 種方法涉及的分子結構描述子通常是單參數(shù)或者是大量描述子的各種參數(shù)的優(yōu)化組合,因而所建立QSAR 模型的通用性和對異構體的分辨率均不太理想。MEDV方法采用矢量表征思想,對每個化合物均采用10 個參數(shù)表征其結構,適用于含多個雜原子、飽和鍵與不飽和鍵、環(huán)和非環(huán)等結構特征的化合物,具有較好的通用性[22]。對各類化合物和各種性質(zhì)的QSAR 研究表明,MEDV 具有良好的分辨率和高度相關性[17-21]。
需要特別說明的是,本研究所選取的25種取代苯酚結構差別很大。25 種取代苯酚包括烷基取代苯酚、烷氧基取代苯酚、硝基取代苯酚、苯基取代苯酚、氯代苯酚、溴代苯酚、烯烴取代苯酚、萘酚等,各類取代苯酚的MEDV值相差較大(表1)。而很多文獻均針對同一類型取代苯酚計算MEDV 值并建立QSAR 模型,如文獻[19]分別針對14 個溴代苯酚、6 個氯代苯酚、48 個鹵代苯酚進行討論;文獻[20]研究對象為20 個氯代苯酚;文獻[21]研究對象為16 個氟代苯酚。因此,MEDV 方法對于同一類型化合物的QSAR 研究更為優(yōu)越。
計算了25 種取代苯酚的MEDV 值,采用SPSS 統(tǒng)計分析軟件建立MEDV 值與取代苯酚生物活性的QSAR 模型,充分考慮各個非氫原子對酚類化合物生物活性的貢獻。在此基礎上,用逐步回歸方法對變量進行篩選,得到的6 變量模型具有較好的預測能力。將所建模型與其他模型進行對比,MEDV 作為描述子進行QSAR 研究具有良好的通用性和高度分辨率。需要指出的是,MEDV 方法對于同一類型化合物的QSAR 研究更為優(yōu)越。
[1]劉紅霞,李瓊.環(huán)境介質(zhì)中揮發(fā)酚的監(jiān)測技術現(xiàn)狀與展望[J].環(huán)境科學與管理,2012,37(6):132-137.
[2]杜克久,徐曉白.環(huán)境雌激素研究進展[J].科學通報,2000,45(21):2241-2251.
[3]許文武,孟菁,胡威,等.5 種酚類化合物對3種水生生物的毒性作用[J].環(huán)境化學,2011,30(10):1751-1757.
[4]盧玲,沈英娃.酚類、烷基苯類、硝基苯類化合物和環(huán)境水樣對劍尾魚和稀有鮈鯽的急性毒性[J].環(huán)境科學研究,2002,15(4):57-59.
[5]聶晶磊,劉鋒,周春玉,等.氯酚類化合物對金魚的急性和亞急性毒性研究[J].環(huán)境科學研究,2001,14(3):6-8.
[6]張帥帥,劉堰,劉樹深,等.不同終點檢測5 種雙酚A 類化合物對MCF-7 的細胞毒性[J].2012,33(11):3935-3940.
[7]鄭敏,朱琳.五氯酚對斑馬魚胚胎的毒性效應研究[J].應用生態(tài)學報,2005,16(10):1967-1971.
[8]呂曉華,古燕,宋艷.壬基酚對紅鯽、草魚和鰱魚的毒性及組織蓄積研究[J].衛(wèi)生研究,2012,41(5):785-789.
[9]崔秀君.部分有機污染物構效關系的研究[D].長春:東北師范大學,2006.
[10]王連生,支正良.分子連接性與分子結構-活性[M].北京:中國環(huán)境科學出版社,1992:196-200.
[11]舒元梯.鹵代苯酚和取代酚生物活性的分子拓撲研究[J].樂山師范學院學報,2005,20(5):44-46.
[12]錢力,陳華妮.取代苯胺和苯酚對鯉魚毒性的3D-QSAR 研究[J].安徽農(nóng)業(yè)科學,2010,38(24):13352-13354.
[13]崔秀君,王志欣,袁星,等.支持向量機用于酚類化合物毒性的QSAR 研究[J].計算機與應用化學,2008,25(5):298-302.
[14]李巍巍,代志軍,譚顯勝,等.基于支持向量回歸的酚類化合物QSAR 建模[J].現(xiàn)代生物醫(yī)學進展,2011,11(24):4857-4860.
[15]劉天寶,彭艷芬,汪新.DFT 法研究取代酚對黑頭呆魚的急毒性[J].計算機與應用化學,2012,29(2):175-177.
[16]葉慶國,宋斌,張宏哲,等.用密度泛函理論預測酚類化合物的正辛醇/水分配系數(shù)[J].化學研究,2011,22(4):66-71.
[17]周原,劉新玲,曾輝.酚類化合物色譜保留指數(shù)的估計與預測[J].湖南工程學院學報,2006,16(2):63-67.
[18]廖立敏,李建鳳,王碧,等.酚類污染物土壤吸收系數(shù)定量預測[J].分析科學學報,2012,28(3):373-376.
[19]張建,孫體健,刁海鵬,等.分子電性距離矢量用于苯酚類化合物生物活性的QSAR研究[J].山西大學學報(自然科學版),2011,34(3):468-474.
[20]呂俊杰,宗喜梅,張生萬,等.分子電性距離矢量用于氯苯酚對水生物毒性影響的研究[J].山西醫(yī)科大學學報,2010,41(11):963-966.
[21]謝永紅,廖立敏.氟化酚類化合物結構與生物毒性關系研究[J].河南師范大學學報(自然科學版),2012,40(2):112-114.
[22]劉樹深,劉堰,李志良,等.一個新的分子電性距離矢量(MEDV)[J].化學學報,2000,58(11):1353-1357.
[23]郭紅霞.相關系數(shù)及其應用[J].武警工程學院學報,2010(2):3-5.