堵錫華,陳艷,宋明,田林,徐艷
徐州工程學(xué)院材料與化學(xué)工程學(xué)院,徐州 221018
肉桂酸是從肉桂皮分離出的一種天然有機(jī)酸,有微量的桂皮氣味,安全無毒[1],它不但具有抗腫瘤、抗炎及抗氧化作用[2-3],還具有良好的抑菌和保鮮作用,故常被用作食品添加劑[4-5],由于它具有抑制過氧化物酶的生物活性并誘導(dǎo)類脂的過氧化作用[6],能抑制形成黑色酪氨酸酶、可隔絕紫外線,故又常用于高級防曬霜的生產(chǎn);此外它還用于香精香料、醫(yī)藥、農(nóng)藥以及有機(jī)合成等工業(yè)生產(chǎn)行業(yè)[7-8]。鹵代肉桂酸則是基于肉桂酸得到一種鹵代芳烴化合物,由于具有類似的特性,故也廣泛應(yīng)用于醫(yī)藥、化妝品和農(nóng)藥等生產(chǎn)行業(yè)[9],隨著近年來該化合物使用量的增加,對環(huán)境造成的影響也越來越為嚴(yán)重。
藻類是水生生態(tài)系統(tǒng)的初級生物,它維持著水生生態(tài)系統(tǒng)結(jié)構(gòu)和功能的穩(wěn)定[10],羊角月牙藻是淡水水體中常見的一種藻類,因其細(xì)胞特征明顯而且易于培養(yǎng)[11],對污染脅迫敏感性很強(qiáng),故常常用作水生生態(tài)毒理研究的一種重要的指示生物[12]。
定量結(jié)構(gòu)-活性關(guān)系(quantitative structure-activity relationship, QSAR)研究最初是應(yīng)用于藥物設(shè)計(jì)中的一種方法[13-14],近年來該法在化學(xué)[15]、環(huán)境科學(xué)[16]和毒理學(xué)[17]等領(lǐng)域得到推廣應(yīng)用。由于目前對鹵代肉桂酸的相關(guān)研究并不多見,特別是利用神經(jīng)網(wǎng)絡(luò)方法對鹵代肉桂酸相關(guān)急性毒性的QSAR研究未見有報(bào)道,故筆者在前期研究[18-19]基礎(chǔ)上,根據(jù)文獻(xiàn)[9]檢測分析鹵代肉桂酸對羊角月牙藻急性毒性半數(shù)效應(yīng)濃度(EC50)值,利用計(jì)算應(yīng)用程序軟件,計(jì)算了14種鹵代肉桂酸化合物分子的4類分子結(jié)構(gòu)參數(shù),并篩選了其中2種參數(shù),構(gòu)建了用于預(yù)測鹵代肉桂酸對羊角月牙藻急性毒性的神經(jīng)網(wǎng)絡(luò)模型,本研究對評估鹵代肉桂酸殘留的生物毒性及其生態(tài)風(fēng)險(xiǎn)具有指導(dǎo)意義。
李敏等[9]選擇了14種鹵代肉桂酸,測定了這些化合物對羊角月牙藻急性毒性的72 h-EC50值,鹵代肉桂酸(序號(hào)1~14)的分子結(jié)構(gòu)及其對羊角月牙藻的EC50實(shí)驗(yàn)值列于表1中。
表1 鹵代肉桂酸的分子結(jié)構(gòu)參數(shù)及其毒性Table 1 Molecular structure parameter and toxicity of halogenated cinnamic acid
根據(jù)表1中所列的序號(hào)為1~14共14種鹵代肉桂酸的分子結(jié)構(gòu),應(yīng)用Chemoffice2005畫圖軟件勾畫這些分子的3D分子結(jié)構(gòu)圖,利用MATLAB自編程序[20]相關(guān)軟件,計(jì)算了分子連接性指數(shù)、分子形狀指數(shù)、電性拓?fù)錉顟B(tài)指數(shù)和電性距離矢量4類分子結(jié)構(gòu)參數(shù),按照分子樣本總數(shù)/變量數(shù)需>5這一規(guī)則[21],經(jīng)過反復(fù)分析試驗(yàn),發(fā)現(xiàn)只有選用電性拓?fù)錉顟B(tài)指數(shù)(E13)和電性距離矢量(M15)這2個(gè)結(jié)構(gòu)參數(shù)時(shí),所得回歸分析結(jié)果相對最好,故這里選用E13和M15作為建立模型的自變量,相關(guān)數(shù)據(jù)也列于表1中。
將選擇的E13和M15這2個(gè)結(jié)構(gòu)參數(shù)作為自變量,將鹵代肉桂酸對羊角月牙藻的急性毒性值(72 h-EC50)作為因變量,進(jìn)行多元回歸分析,得到對羊角月牙藻毒性預(yù)測的多元回歸方程為:
EC50=1267.772E13-32.493M15-9962.357
(1)
神經(jīng)網(wǎng)絡(luò)方法是集計(jì)算機(jī)技術(shù)、統(tǒng)計(jì)學(xué)方法和化學(xué)技術(shù)等多學(xué)科交叉又較為前沿的一種研究方法,它能模擬生物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理,具有強(qiáng)大的非線性映射能力,該法在眾多學(xué)科領(lǐng)域得到了廣泛的應(yīng)用[22-26]。由于前述多元線性回歸法預(yù)測結(jié)果并不理想,這里進(jìn)一步采用神經(jīng)網(wǎng)絡(luò)非線性方法對鹵代肉桂酸對羊角月牙藻毒性進(jìn)行研究。將式(1)多元回歸模型中的E13和M15作為神經(jīng)網(wǎng)絡(luò)法中的輸入層參數(shù),14種鹵代肉桂酸化合物對羊角月牙藻急性毒性作為輸出層參數(shù),綜合許祿[27]和Andrea等[28]建議規(guī)則,得出下式:
2.2>n/[(Si+2)Y+1]≥1.4
(2)
式中:n、Si和Y分別為樣本總數(shù)、神經(jīng)網(wǎng)絡(luò)輸入層參數(shù)和隱含層參數(shù)。根據(jù)該式計(jì)算得到Y(jié)應(yīng)取2,為此神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)采用2-2-1的結(jié)構(gòu)方式。為防止建模過程中有過擬合現(xiàn)象,將14個(gè)鹵代肉桂酸分子隨機(jī)分為3組:取每5個(gè)分子的第1、3、5個(gè)分子作為訓(xùn)練集、第2個(gè)分子作為測試集、第4個(gè)分子作為驗(yàn)證集,將本法建立的神經(jīng)網(wǎng)絡(luò)模型計(jì)算得到的EC50預(yù)測值也列入表1中,神經(jīng)網(wǎng)絡(luò)模型的權(quán)重與偏置相關(guān)數(shù)據(jù)列于表2中。
表2 BP-ANN模型的權(quán)重和偏置Table 2 Weights and bias of BP-ANN model
通過計(jì)算14個(gè)鹵代肉桂酸的4類分子結(jié)構(gòu)參數(shù),篩選了其中E13和M15這2種指數(shù),與這些化合物分子對羊角月牙藻急性毒性進(jìn)行相關(guān)性分析,建立的多元回歸模型的相關(guān)系數(shù)為0.911,根據(jù)該模型得到的預(yù)測值與實(shí)驗(yàn)值的相對平均誤差為7.16%,而在此基礎(chǔ)上建立預(yù)測毒性的神經(jīng)網(wǎng)絡(luò)法模型,模型的總相關(guān)系數(shù)R總=0.951,訓(xùn)練集R訓(xùn)練=0.956、測試集R測試=0.996、驗(yàn)證集R驗(yàn)證=0.999,從這些相關(guān)系數(shù)可以看出,神經(jīng)網(wǎng)絡(luò)非線性模型的相關(guān)系數(shù)明顯得到提高,利用該模型預(yù)測鹵代肉桂酸對羊角月牙藻急性毒性,預(yù)測值與文獻(xiàn)實(shí)驗(yàn)值的吻合度較為理想(圖1),兩者的相對平均誤差為4.49%,對相對誤差作控制圖(圖2)可以看出,所有相對誤差均在可控范圍之內(nèi),說明預(yù)測結(jié)果較為可靠,分子結(jié)構(gòu)參數(shù)與毒性值之間存在較好的非線性關(guān)系,而不是線性關(guān)系。對神經(jīng)網(wǎng)絡(luò)法與多元回歸法所得預(yù)測誤差進(jìn)行比較可以看出,神經(jīng)網(wǎng)絡(luò)法的預(yù)測誤差值明顯小于多元回歸法的預(yù)測誤差值。
圖1 EC50的實(shí)驗(yàn)值(Exp.)與預(yù)測值(Pre.)關(guān)系Fig. 1 Relationship between experimental (Exp.) and predicted (Pre.) values of EC50
圖2 相對誤差的控制圖注:UCL為控制上限,LCL為控制下限。Fig. 2 Control chart of relative errorNote: UCL stands for upper control limit; LCL stands for lower control limit.
根據(jù)建構(gòu)的神經(jīng)網(wǎng)絡(luò)模型,對另外12種可能結(jié)構(gòu)的鹵代肉桂酸化合物分子(表1中打*的15~26號(hào)分子)的EC50進(jìn)行了預(yù)測,所得預(yù)測結(jié)果也列于表1中。根據(jù)表1中1~14號(hào)鹵代肉桂酸的分子結(jié)構(gòu)與EC50實(shí)驗(yàn)值的關(guān)系可以看出,肉桂酸苯環(huán)上連接半徑越大、電負(fù)性越小的鹵素原子,其毒性越大,如F的電負(fù)性>Cl的電負(fù)性>Br的電負(fù)性,而半徑大小相反,故連接Br的毒性>Cl>F;如基團(tuán)相同,則連接在2位的毒性<3位<4位。對照預(yù)測的15~26號(hào)分子所得毒性值,基本符合該變化規(guī)律,說明本法建構(gòu)的模型具有一定的合理性和應(yīng)用型,當(dāng)然這還需要通過實(shí)驗(yàn)來進(jìn)行確證,故本模型的建構(gòu),可以在理論上指導(dǎo)設(shè)計(jì)低毒性、高活性的類似化合物分子。
綜上所述,本研究表明:
(1)優(yōu)化篩選電性拓?fù)錉顟B(tài)指數(shù)和電性距離矢量作為分子結(jié)構(gòu)描述子,與鹵代肉桂酸對羊角月牙藻急性毒性具有較好的非線性關(guān)系,建構(gòu)的毒性預(yù)測神經(jīng)網(wǎng)絡(luò)模型相關(guān)系數(shù)達(dá)0.951,預(yù)測結(jié)果明顯優(yōu)于多元回歸法,說明鹵代肉桂酸的分子結(jié)構(gòu)參數(shù)與其對羊角月牙藻急性毒性(EC50)之間具有好的非線性關(guān)系,而不是線性關(guān)系。
(2)鹵代肉桂酸對羊角月牙藻急性毒性的大小,與其苯環(huán)上連接的鹵素基團(tuán)的原子半徑、電負(fù)性大小及基團(tuán)連接的位置有較大的相關(guān)性。