堵錫華,田 林,徐 艷,吳 瓊,陳 艷
(徐州工程學(xué)院 材料與化工學(xué)院,江蘇 徐州 221018)
二苯甲酮類化合物已在日用化工、醫(yī)藥、染料及其農(nóng)藥等領(lǐng)域得到廣泛應(yīng)用[1-4].由于它對紫外光有很好的吸收能力,故常被用于防曬霜、護(hù)膚液等個人護(hù)理品(personal care products, 簡稱PCPs)中,是個人護(hù)理品中非常重要的一種化工原料,但如果這些產(chǎn)品中二苯甲酮類物質(zhì)過度使用,會引起皮膚過敏、濕疹等不良反應(yīng),故我國化妝品衛(wèi)生標(biāo)準(zhǔn)中對防曬劑的種類和用量有嚴(yán)格的限制性規(guī)定[5].此外由于二苯甲酮的揮發(fā)性強(qiáng)、熱損失大,在固化膜中易遷移析出,產(chǎn)生毒性,經(jīng)過生物遷移累積到人體和生物體,可能導(dǎo)致遺傳毒性和內(nèi)分泌的干擾效應(yīng)[6].近年來,由于個人護(hù)理品和食品包裝膜等產(chǎn)品的用量增大,二苯甲酮類化合物被直接或間接排入水環(huán)境中,它們已成為一類新型的環(huán)境污染物,開始威脅人體健康和生態(tài)系統(tǒng),為此對二苯甲酮類化合物的粉塵或有機(jī)紫外防曬劑等的測定[7-8]、合成[9-10]、性質(zhì)[11-12]及其毒性評價[13-14]研究逐漸受到相關(guān)學(xué)者的重視.
神經(jīng)網(wǎng)絡(luò)方法是一個集數(shù)學(xué)、計(jì)算機(jī)、統(tǒng)計(jì)學(xué)、化學(xué)等多學(xué)科交叉的研究方法,該法在化學(xué)[15]、食品科學(xué)[16]、農(nóng)業(yè)科學(xué)[17]、藥物化學(xué)[18]、毒理學(xué)[19]、建筑學(xué)[20]等相關(guān)領(lǐng)域得到廣泛應(yīng)用.筆者在前期[21-23]工作基礎(chǔ)上,根據(jù)魏東斌等[24]檢測的14 種二苯甲酮類化合物對發(fā)光菌急性毒性值(EC50),按照梁逸曾等[25-26]相關(guān)研究編寫的計(jì)算應(yīng)用程序,計(jì)算了文獻(xiàn)[24]所列14種具有代表性的二苯甲酮類化合物分子的分子連接性指數(shù),并利用MINITAB軟件中的最佳變量子集回歸方式,篩選了其中的2X,5Xc兩種指數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入層參數(shù),以二苯甲酮類化合物對發(fā)光菌急性毒性的EC50作為輸出層參數(shù),建構(gòu)了二苯甲酮類化合物對發(fā)光菌急性毒性的神經(jīng)網(wǎng)絡(luò)預(yù)測模型,該模型具有高度相關(guān)性,所得預(yù)測值與文獻(xiàn)值吻合度也達(dá)到了令人滿意的結(jié)果,研究工作對環(huán)境中個人護(hù)理品含有的二苯甲酮類化合物殘留的生物毒性及其生態(tài)風(fēng)險評估具有實(shí)際意義,可為防曬劑的綠色生產(chǎn)、合理使用和科學(xué)管理提供指導(dǎo).
分子連接性指數(shù)是Kier等[27]改進(jìn)了Randic提出的分枝指數(shù)而提出的一種根據(jù)分子的空間和電性結(jié)構(gòu)信息的結(jié)構(gòu)參數(shù).這里應(yīng)用Chemoffice2005軟件勾畫了文獻(xiàn)[24]列出的14種二苯甲酮類化合物的分子結(jié)構(gòu),利用MATLAB軟件自編應(yīng)用程序,調(diào)用14種二苯甲酮類化合物的分子結(jié)構(gòu),計(jì)算其分子連接性指數(shù),再采用MINITAB14.0統(tǒng)計(jì)分析應(yīng)用軟件中的最佳變量子集回歸方式,統(tǒng)計(jì)分析二苯甲酮類化合物分子結(jié)構(gòu)與其對發(fā)光菌急性毒性之間的相關(guān)關(guān)系,篩選了分子連接性指數(shù)中與急性毒性相關(guān)性最優(yōu)的2個變量2X,5Xc,分析結(jié)果見表1.
表1 pEC50與連接性指數(shù)mX的最佳變量子集回歸結(jié)果
(1)
其中:n為二苯甲酮類化合物的樣本總數(shù),b為多元回歸分析模型的變量數(shù),r2為回歸分析模型的決定系數(shù).根據(jù)式(1)計(jì)算所得FIT值越大,說明模型越穩(wěn)定.由于樣本數(shù)相對較少,按照樣本數(shù)/變量數(shù)必須≥5的要求,這里只能取2個變量,故選擇模型2,將14個二苯甲酮類化合物分子及其分子連接性指數(shù)的2X,5Xc值列于表2中.
注:帶*號的分子為設(shè)計(jì)的新分子.
將文獻(xiàn)[24]中列出的14種二苯甲酮類化合物對發(fā)光菌急性毒性與優(yōu)化篩選的2種分子連接性指數(shù)2X和5Xc進(jìn)行回歸分析,得到的多元回歸方程為
pEC50=2.3652X-9.1525Xc+1.818,
(2)
利用式(2)對發(fā)光菌急性毒性值進(jìn)行預(yù)測,所得預(yù)測值與文獻(xiàn)實(shí)驗(yàn)值[24]之間有較大的誤差,兩者的相對平均誤差為13.87%,說明利用多元回歸方法預(yù)測毒性并不理想.
針對上述多元回歸方法預(yù)測結(jié)果不理想的問題,為提高預(yù)測二苯甲酮類化合物對發(fā)光菌急性毒性的準(zhǔn)確性,需進(jìn)一步采用神經(jīng)網(wǎng)絡(luò)方法進(jìn)行研究,故先檢驗(yàn)多元回歸模型的穩(wěn)定性,采用逐一剔除法進(jìn)行檢驗(yàn),即每次剔除1個分子后進(jìn)行建模,得到相應(yīng)相關(guān)系數(shù),這樣共有14個相關(guān)系數(shù),見表3.由表3可以看出,14個相關(guān)系數(shù)值較為接近,平均值為0.874 8,與式(2)相吻合.
表3 Jackknifed相關(guān)系數(shù)的檢驗(yàn)
將式(2)模型中使用的兩個變量2X和5Xc作為神經(jīng)網(wǎng)絡(luò)法中的輸入層節(jié)點(diǎn),14種二苯甲酮類化合物對發(fā)光菌的急性毒性作為輸出層節(jié)點(diǎn),并按照許祿等[29]的建議規(guī)則,要求符合1.4≤n/M<2.2,n為樣本的個數(shù),M為網(wǎng)絡(luò)總權(quán)重,M的計(jì)算式為
M=(Si+1)H+(H+1)So,
(3)
其中:Si,H,So為神經(jīng)網(wǎng)絡(luò)3層結(jié)構(gòu)中的輸入層節(jié)點(diǎn)數(shù)、隱含層數(shù)及輸出層節(jié)點(diǎn)數(shù).這里采用了2個連接性指數(shù)作為輸入層節(jié)點(diǎn),故Si=2; 二苯甲酮類化合物對發(fā)光菌的急性毒性作為輸出層節(jié)點(diǎn),即So=1; 根據(jù)式(3)計(jì)算得到H為2,故這里神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)采用2-2-1的結(jié)構(gòu)方式.
為防止建模過程中的過擬合現(xiàn)象,將14個二苯甲酮類化合物分子分為3組:第1組為訓(xùn)練集組(以每5個分子為1組,取其中第1,3,5個分子)、第2組為測試集組(每5個分子組中的第2個分子)、第3組為驗(yàn)證集組(每5個分子組中的第4個分子),用MATLAB軟件中神經(jīng)網(wǎng)絡(luò)計(jì)算軟件進(jìn)行計(jì)算分析,得到了預(yù)測二苯甲酮類化合物對發(fā)光菌急性毒性模型的總相關(guān)系數(shù)rt=0.998 3,3個集組的相關(guān)系數(shù)分別為:訓(xùn)練集組的相關(guān)系數(shù)r1=0.999 1、測試集組的相關(guān)系數(shù)r2=0.999 9、驗(yàn)證集組的相關(guān)系數(shù)r3=0.999 7,這里可以看出,模型總相關(guān)系數(shù)相比多元回歸方法得到了明顯提升,達(dá)到了0.99以上的優(yōu)級相關(guān)性,而且3個集組的相關(guān)系數(shù)與模型總相關(guān)系數(shù)較為接近,說明模型的穩(wěn)定性相對較好,利用該QSAR神經(jīng)網(wǎng)絡(luò)模型來預(yù)測二苯甲酮類化合物對發(fā)光菌急性毒性,計(jì)算得到的預(yù)測值與文獻(xiàn)值吻合度較為理想,兩者的相對平均誤差僅為1.60%,明顯優(yōu)于多元回歸方法的預(yù)測精度,說明神經(jīng)網(wǎng)絡(luò)法模型的預(yù)測能力優(yōu)于多元回歸分析法.將急性毒性的預(yù)測值與文獻(xiàn)值同樣列于表2中,將多元回歸法、神經(jīng)網(wǎng)絡(luò)法的預(yù)測值與文獻(xiàn)值的關(guān)系分別作雷達(dá)圖(見圖1,2),并將神經(jīng)網(wǎng)絡(luò)模型的權(quán)重和偏置列于表4.
圖1 多元回歸法雷達(dá)圖
圖2 神經(jīng)網(wǎng)絡(luò)法雷達(dá)圖
表4 神經(jīng)網(wǎng)絡(luò)模型的權(quán)重和偏置
通過計(jì)算14個二苯甲酮類化合物的分子連接性指數(shù),篩選了其中的2種指數(shù)與該化合物分子對發(fā)光菌急性毒性的相關(guān)性分析,建立了二苯甲酮類化合物對發(fā)光菌急性毒性預(yù)測的神經(jīng)網(wǎng)絡(luò)法模型,該毒性預(yù)測模型的總相關(guān)系數(shù)能達(dá)到0.998 3優(yōu)級相關(guān),預(yù)測得到的毒性值與文獻(xiàn)[24]所得的值吻合度較高,相對平均誤差為1.60%.從表2可以看出,二苯甲酮類化合物分子的毒性大小,既與化合物分子本身的大小有關(guān),還與連接的基團(tuán)種類、基團(tuán)性質(zhì)、連接的位置、連接基團(tuán)的數(shù)量多少有關(guān),它們均能影響其毒性大小.如連接的羥基數(shù)越多毒性越大,且連接在2,3,4位,毒性會逐漸增大;如連接烷氧基、磺酸基等基團(tuán),則能使毒性減小.為此,筆者根據(jù)這一特性,設(shè)計(jì)了新的7個二苯甲酮化合物分子(見表2中15*-21*號分子),利用建構(gòu)的神經(jīng)網(wǎng)絡(luò)預(yù)測毒性模型所得預(yù)測值與分子結(jié)構(gòu)參數(shù)之間的關(guān)系,得到了這7個分子的毒性預(yù)測值,這些毒性預(yù)測值也列于表2中,這里可以看出,這些分子中,即使毒性最大的2-羥基-3-磺酸基-5-甲氧基-二苯甲酮(pEC50為0.565),其毒性值也明顯小于文獻(xiàn)[24]所列的14個二苯甲酮化合物的急性毒性,這里毒性最小的是2′-羥基-3-甲基-4-甲氧基-5-磺酸基-二苯甲酮(pEC50為0.111),可能與其吸電子的磺酸基對相近的甲基、甲氧基的影響較大有關(guān),當(dāng)然這里預(yù)測的毒性值還需要通過實(shí)驗(yàn)來進(jìn)行確證,但模型的建構(gòu)對設(shè)計(jì)毒性低的新的化合物分子可起到重要的理論指導(dǎo)作用.
(1) 通過MINITAB應(yīng)用程序優(yōu)化篩選了2個分子連接性指數(shù)作為結(jié)構(gòu)描述子,與二苯甲酮類化合物對發(fā)光菌急性毒性具有高度的非線性相關(guān)性,建構(gòu)的預(yù)測模型相關(guān)系數(shù)達(dá)到了0.998 3的高度相關(guān),建立的神經(jīng)網(wǎng)絡(luò)毒性預(yù)測模型明顯優(yōu)于多元回歸法模型,利用神經(jīng)網(wǎng)絡(luò)模型預(yù)測得到的毒性值誤差明顯低于多元回歸分析法,相對平均誤差只有1.60%,充分說明二苯甲酮類化合物的連接性指數(shù)(mX)與生物急性毒性(EC50)之間具有良好的非線性關(guān)系.利用該神經(jīng)網(wǎng)絡(luò)模型,可以設(shè)計(jì)毒性低的新的二苯甲酮類化合物分子.
(2) 神經(jīng)網(wǎng)絡(luò)模型具有較好的預(yù)測能力.優(yōu)化篩選的分子連接性指數(shù)2X和5Xc能充分反映二苯甲酮類化合物的分子空間結(jié)構(gòu)以及電性結(jié)構(gòu)之間相關(guān)信息,它們能在一定程度上反映該類化合物對生物急性毒性大小變化的規(guī)律.
(3) 二苯甲酮類化合物分子苯環(huán)上連接的基團(tuán)種類和數(shù)量、連接的位置對毒性影響較大.連接的羥基越多毒性越大,連接烷氧基和磺酸基則能使毒性變小.