堵錫華,吳 瓊,李 靖,陳 艷,田 林
(徐州工程學院 材料與化學工程學院,江蘇 徐州 221018)
高級氧化技術(Advanced oxidation process,AOPs)是一種依托于聲、光、電、磁等現(xiàn)代科技手段,生成具有極強氧化性帶電離子或者自由基降解污染物的技術[1],是處理難降解有機污染廢水比較有應用前景的方法之一[2],所以在污水處理技術的應用和發(fā)展研究方面受到越來越多科研工作者的關注[3-7].
近年來,定量構效關系(QSAR)研究在農(nóng)藥毒性[8]、環(huán)境污染[9]、醫(yī)藥[10-11]等領域得到越來越多的應用,利用人工神經(jīng)網(wǎng)絡(Artificial neural network,ANN)與定量構效,應用在化學[12]、藥學[13]、環(huán)境科學[14]、土壤學[15]、食品科學[16]、農(nóng)學[17]等眾多領域.本文采用神經(jīng)網(wǎng)絡方法構建20種有機污染物降解速率的定量構效關系預測模型[18-20],分析了對有機污染物降解速率的主要影響因素,為有機污染化合物的降解處理提供理論依據(jù).
20種有機污染物分子及降解速率(以色度降解動力學常數(shù)Kcolor表示)來源于文獻[20],降解動力學常數(shù)Kcolor根據(jù)公式ln(A0/At)=Kcolort計算得到.式中:A0為反應開始時的吸光度,At為反應時間為t時的吸光度,t為反應時間(min).Kcolor值見表1.文獻采用的實驗條件為:T=298 K、pH=4、使用λ=254 nm紫外光和過量的H2O2.
表1 有機污染物的色度降解動力學常數(shù)和結構參數(shù)
根據(jù)文獻[20]中所列的20種有機污染化合物的分子結構,在MATLAB環(huán)境下采用文獻[21-22]方法自編程序計算這20種分子的分子形狀指數(shù)和電性拓撲狀態(tài)指數(shù),去除所得兩類指數(shù)中全部或大部分指數(shù)值為0的數(shù)組,使用可進行統(tǒng)計分析、預測式分析、可視化分析和改進分析的MINITAB應用軟件,對剩余數(shù)組和降解速率(以有機污染物的色度降解動力學常數(shù)Kcolor表示)進行最佳變量子集回歸分析.按照樣本數(shù)與變量數(shù)比值n/b≥5的要求[23],優(yōu)化篩選出形狀指數(shù)K1和K4、電性拓撲狀態(tài)指數(shù)E13共3個分子結構參數(shù),相關結構參數(shù)見表1.這里采用二種不同種類的3個參數(shù)進行組合,是因為只是采用同一類的結構參數(shù)與Kcolor回歸分析,所得方程的相關性不大理想;而采用多類參數(shù)分析,則又受到變量個數(shù)的限制,故經(jīng)反復比較分析,發(fā)現(xiàn)當取形狀指數(shù)K1和K4與電性拓撲狀態(tài)指數(shù)E13這3個參數(shù)結合作為自變量時,與有機污染物的色度降解動力學常數(shù)Kcolor的相關性相對而言能達到最佳,最佳變量子集回歸分析結果見表2.
表2 分子形狀指數(shù)、電性拓撲狀態(tài)指數(shù)與Kcolor的最佳變量子集回歸結果
分子形狀指數(shù)K1和K4中的K1為1階形狀特征參數(shù),反映分子的環(huán)性;K4=K1×K2,其中的K2為2階形狀特征參數(shù),反映原子空間密度;E13則代表—OH、—O—基團片段.
考察文獻[20]中所列的20種有機污染化合物的色度降解動力學常數(shù)Kcolor,與優(yōu)化篩選出的分子形狀指數(shù)和電性拓撲狀態(tài)指數(shù)中的K1、K4和E13進行多元回歸分析,得到多元回歸模型為
Kcolor= 5.321K1-6.615K4+0.325E13-11.481,
(1)
n=20,r=0.740,r2=0.547,S=6.331,F(xiàn)=6.451.
模型(1)中n為回歸分析樣本數(shù).該多元回歸模型的決定系數(shù)r2只有0.547,相關性不好,說明結構參數(shù)與這些有機污染物的色度降解動力學常數(shù)之間不是簡單的線性關系,需要進一步采用非線性研究方法進行研究.
由于采用多元回歸分析結構參數(shù)與色度降解動力學常數(shù)的線性方程不理想,為此以選擇的3個結構參數(shù)作為神經(jīng)網(wǎng)絡的輸入層節(jié)點,以色度降解動力學常數(shù)作為神經(jīng)網(wǎng)絡輸出層節(jié)點,隱含層節(jié)點數(shù)則按照Andreao 等[24]和許祿等[25]建議規(guī)則:2.2>n/[(Si+2)Y+1]≥1.4.這里n為樣本總數(shù),Si為神經(jīng)網(wǎng)絡的輸入層節(jié)點數(shù),可以得到隱含層節(jié)點數(shù)Y的值,經(jīng)過計算隱含層節(jié)點數(shù)Y應取2,故使用神經(jīng)網(wǎng)絡法研究的網(wǎng)絡結構采用3-2-1方式.為防止神經(jīng)網(wǎng)絡建模過程中過擬合,將20種有機污染物分子隨機分為3個組集:取每5種分子的第1、3、4種分子為訓練集、第2種分子為測試集、第5種分子為驗證集;計算所得結果較為理想.將本法建立模型得到的預測值列入表1中.
經(jīng)神經(jīng)網(wǎng)絡計算分析,得到預測有機污染化合物色度降解動力學常數(shù)模型的總相關系數(shù)R總=0.997 6,訓練集R訓練=0.966 5、測試集R測試=0.998 9、驗證集R驗證=0.995 6,無論是從總的相關系數(shù)還是3個組集的相關系數(shù)都可以看出,用神經(jīng)網(wǎng)絡法所得非線性模型的總相關系數(shù),比多元回歸法所得線性模型的相關系數(shù)提升較為明顯,達到0.99以上,屬于優(yōu)級相關,利用構建的模型進行預測的色度降解動力學常數(shù)與實驗值的吻合度較好(見圖1),明顯優(yōu)于多元回歸法的吻合度(見圖2),說明分子結構參數(shù)與色度降解動力學常數(shù)之間存在非線性關系,本法建構的預測模型有良好的預測能力.
圖1 神經(jīng)網(wǎng)絡法Kcolor的實驗值與預測值關系
圖2 多元回歸法Kcolor的實驗值與預測值關系
從圖1可以看到,神經(jīng)網(wǎng)絡法預測值與實驗值的對應點完全貼近對應值直線,而從圖2看到,多元回歸法預測值與實驗值的對應點偏離完全對應值直線,有的甚至偏離較遠.這里再以神經(jīng)網(wǎng)絡法模型所得預測值與實驗值的誤差作控制圖(見圖3)及雷達圖(見圖4)也可以看出,本法所得誤差在可控范圍內(nèi),說明所得結果較為可靠.
圖3 Kcolor誤差控制圖
圖4 Kcolor誤差雷達圖
考察這20種有機化合物分子的分子結構與其色度降解動力學常數(shù)的大小可以看出,當分子中含有的羥基、硝基等基團數(shù)越多時,有機物發(fā)生氧化反應的活性位點越多,在酸性條件下,被氧化降解的速率越大;當具有相同取代基及數(shù)目時,基團連接的位置則影響降解速率的大??;分子形狀指數(shù)蘊含了分子的環(huán)性和分子中原子空間密度的特性,電性拓撲狀態(tài)指數(shù)中的E13則能反映—OH、—O—基團片段在分子中的連接和電性特性,其值的大小與色度降解動力學常數(shù)的變化規(guī)律一致,故將其與神經(jīng)網(wǎng)絡法結合,可構建良好的預測模型[26-28].
為檢驗所建神經(jīng)網(wǎng)絡模型的應用能力,將該模型對茜素S、溴酚藍、百里酚藍、中性紅、α-萘酚酞等有色化合物分子的色度降解動力學常數(shù)進行預測,所得結果除中性紅是1.578 8外,其他幾種有色化合物分子的色度降解動力學常數(shù)在6~16之間(相關數(shù)據(jù)也列入表1),這說明在酸性條件下,對這5種有色化合物的色度降解能力較為理想,當然這需要通過具體的實驗來進一步證實,但在理論上分析應該可靠.
由于有色化合物降解的色度降解動力學常數(shù)大小與多種因素有關,如所使用的降解催化劑、有色化合物的水溶性、溫度、溶液的酸堿性等,均會對該值大小有影響[29-30],本法只是對特定條件下的有色化合物降解速率有一定的預測作用,對其他條件下降解速率預測應用還是受到一定的限制,還需要更深入的研究.
1)神經(jīng)網(wǎng)絡模型的相關系數(shù)明顯優(yōu)于多元回歸模型的相關系數(shù),說明優(yōu)化篩選的分子形狀指數(shù)、電性拓撲狀態(tài)指數(shù)與有機污染化合物的色度降解動力學常數(shù)有良好的非線性關系,神經(jīng)網(wǎng)絡模型具有良好的穩(wěn)定性和較強的預測能力,預測值與實驗值吻合度較好.
2)神經(jīng)網(wǎng)絡模型具有一定的應用性,可判斷其他化合物分子被氧化降解的能力.
3)影響有機污染化合物色度降解動力學常數(shù)的因素除分子的空間結構特性外,還有如—OH、—O—等基團片段是其主要影響因素.