黃保軍
摘要:采用誤差反傳前向人工神經(jīng)網(wǎng)絡(luò)(BP-ANN)建立了63種大棗香味成分的結(jié)構(gòu)與色譜保留之間的定量關(guān)系模型(QSRR)。以63種大棗香味成分的分子電性距離矢量為輸入?yún)?shù),色譜保留時(shí)間為輸出參數(shù),采用內(nèi)外雙重驗(yàn)證法分析該模型的穩(wěn)定性和外部預(yù)測(cè)能力。所構(gòu)建網(wǎng)絡(luò)模型的相關(guān)系數(shù)為0.998 9,交叉檢驗(yàn)相關(guān)系數(shù)為0.998 9,標(biāo)準(zhǔn)偏差為0.959,殘差絕對(duì)值低于3.844,應(yīng)用于外部預(yù)測(cè)集,外部預(yù)測(cè)集相關(guān)系數(shù)為0.998 9;而多元線性回歸(MLR)法模型的相關(guān)系數(shù)為0.981 9,交叉檢驗(yàn)相關(guān)系數(shù)為0.982 0,標(biāo)準(zhǔn)偏差為3.697、殘差絕對(duì)值低于9.264,外部預(yù)測(cè)集相關(guān)系數(shù)為0.986 1。結(jié)果表明,ANN模型的擬合效果明顯優(yōu)于MLR模型。
關(guān)鍵詞:大棗;香氣成分;定量結(jié)構(gòu)色譜保留關(guān)系(QSRR);人工神經(jīng)網(wǎng)絡(luò)(ANN)
中圖分類號(hào):TP29;O657.7 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2013)08-1927-04
大棗營(yíng)養(yǎng)豐富,是天然的藥食同源食品,具有較高保健和藥用功效[1]。隨著人們對(duì)棗營(yíng)養(yǎng)價(jià)值認(rèn)識(shí)的深入,棗的深加工產(chǎn)品種類日益豐富[2-4],其中,具有獨(dú)特香味的棗油、棗酊逐漸應(yīng)用于食品、保健品、化妝品、煙草等行業(yè)[4]。但目前這些研究工作主要集中于香氣成分提取、加工工藝、抗氧化性等方面[1,5],而對(duì)香味成分的分子結(jié)構(gòu)與其性質(zhì)之間的相關(guān)關(guān)系研究報(bào)道較少。目前,用于定量結(jié)構(gòu)色譜保留關(guān)系(Quantitative structure-chromatography retention relationship,QSRR)建模的線性方法,主要包括多元線性回歸法(Multiple linear regressions,MLR)[6]、偏最小二乘(Partial least squares,PLS)法等[7-9]。但因?yàn)榉肿咏Y(jié)構(gòu)與色譜保留關(guān)系之間的復(fù)雜性,線性建模方法逐漸顯示其不足,而非線性方法在建模當(dāng)中受到青睞。其中,人工神經(jīng)網(wǎng)絡(luò)方法(Artificial neural network,ANN)因其獨(dú)特的結(jié)構(gòu)與功能,對(duì)高度非線性問題具有較好的擬合能力,因此在QSRR研究中頗受關(guān)注[10,11]。本試驗(yàn)采用人工神經(jīng)網(wǎng)絡(luò)方法構(gòu)建大棗香味成分的定量結(jié)構(gòu)色譜保留關(guān)系模型,對(duì)預(yù)測(cè)大棗香味成分色譜保留值、選擇香味成分分離條件等具有重要意義,為進(jìn)一步了解大棗的香味特征、對(duì)大棗進(jìn)行深加工和開發(fā)應(yīng)用、香氣成分分離條件的選擇等提供理論依據(jù)。
1 材料與方法
1.1 數(shù)據(jù)來源
網(wǎng)絡(luò)的訓(xùn)練集和預(yù)測(cè)集由63種大棗的香味成分與其色譜保留時(shí)間組成,數(shù)據(jù)引自文獻(xiàn)[6],輸入?yún)?shù)分別是分子電性距離矢量M11、M12、M13、M22、M23、M33(共6個(gè)),輸出參數(shù)為大棗香味成分一定條件下在色譜柱(Ultra2柱,50 m×320 μm×0.17 μm)中的保留指數(shù)。
1.2 建模方法
采用3層BP網(wǎng)絡(luò)對(duì)63種大棗香味成分的結(jié)構(gòu)與保留時(shí)間進(jìn)行建模,BP網(wǎng)絡(luò)來自于MATLAB工具箱。
1.3 BP網(wǎng)絡(luò)模型的檢驗(yàn)
在QSRR研究中,模型的穩(wěn)健性和實(shí)用性的檢驗(yàn)非常重要。模型的穩(wěn)健性檢驗(yàn)采用交互檢驗(yàn)(Cross validation,CV),而模型的實(shí)用性通過外部預(yù)測(cè)能力衡量。為保障模型的可靠性和外部預(yù)測(cè)能力,本試驗(yàn)將63種大棗香味成分的保留時(shí)間按由小到大排序,每間隔5個(gè)樣本選擇1個(gè),共12個(gè)作為外部預(yù)測(cè)集,其他51個(gè)作為訓(xùn)練集。采用ANN和MLR分別進(jìn)行建模,模型有效性通過R(相關(guān)系數(shù)——包含訓(xùn)練集和外部預(yù)測(cè)集)、RCV (LOO法交互檢驗(yàn)相關(guān)系數(shù))、s(標(biāo)準(zhǔn)偏差)、Rext(外部預(yù)測(cè)集相關(guān)系數(shù))、Sext(外部預(yù)測(cè)集標(biāo)準(zhǔn)偏差)等判別。
2 結(jié)果與討論
2.1 QSQR模型的建立
采用BP網(wǎng)絡(luò)構(gòu)建63種大棗香味成分的定量結(jié)構(gòu)與色譜保留之間的關(guān)系。所用3層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)通過反復(fù)數(shù)據(jù)試驗(yàn)優(yōu)化,最終確定結(jié)構(gòu)及參數(shù)如下:網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為6 × 6 × 1,輸入層、隱含層和輸出層傳遞函數(shù)均為L(zhǎng)ogsig函數(shù),學(xué)習(xí)目標(biāo)函數(shù)為0.000 2,學(xué)習(xí)速度為0.1,迭代次數(shù)10 000次。
網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的輸入節(jié)點(diǎn)數(shù)由分子結(jié)構(gòu)參數(shù)決定(通過回歸分析統(tǒng)計(jì)方法優(yōu)選6個(gè)指數(shù),即節(jié)點(diǎn)數(shù)為6),隱含層節(jié)點(diǎn)數(shù)分別設(shè)為3、4、5、6,由數(shù)據(jù)處理試驗(yàn)優(yōu)選為6,輸出為色譜保留時(shí)間(維數(shù)為1)。Logsig函數(shù)為BP-ANN常用的3種傳遞函數(shù)之一,能夠?qū)⑤斎搿⑤敵鱿拗圃?~1之間,比較符合數(shù)據(jù)處理的需求。學(xué)習(xí)目標(biāo)函數(shù)分別設(shè)定為0.000 000 08、0.000 2、0.000 1,最終選擇0.000 2,當(dāng)實(shí)際輸出與理論輸出的誤差達(dá)到此數(shù)值時(shí),網(wǎng)絡(luò)停止學(xué)習(xí)。學(xué)習(xí)速率快慢也由數(shù)據(jù)處理試驗(yàn)確定,學(xué)習(xí)速率過高將引起網(wǎng)絡(luò)的振蕩,導(dǎo)致數(shù)據(jù)結(jié)果不太穩(wěn)定;而太小則需要更多的學(xué)習(xí)預(yù)測(cè)時(shí)間。迭代次數(shù)由能夠達(dá)到學(xué)習(xí)目標(biāo)函數(shù)的學(xué)習(xí)次數(shù)確定,10 000次能夠滿足要求。
63種大棗香味成分結(jié)構(gòu)與色譜保留的BP-ANN、MLR結(jié)果見表1。由表1可見,BP-ANN模型的預(yù)測(cè)值與試驗(yàn)值的絕對(duì)誤差分布在-3.844~2.220之間,而MLR預(yù)測(cè)值與試驗(yàn)值絕對(duì)誤差分布在-9.264~7.796之間,BP-ANN模型訓(xùn)練集的預(yù)測(cè)值、外部集的預(yù)測(cè)值、留一交叉檢驗(yàn)的預(yù)測(cè)值更接近于試驗(yàn)值,其絕對(duì)誤差(殘差)明顯小于MLR預(yù)測(cè)值。由圖1可明顯看出,BP網(wǎng)絡(luò)QSRR模型與MLR模型得到的預(yù)測(cè)值與試驗(yàn)值的殘差基本在y軸等于0的直線上下分布,殘差絕對(duì)值低于3.844,頻率分布接近于正態(tài),接近于0的較多,誤差大的較少。而MLR法得到的結(jié)果離散性更強(qiáng),殘差值高達(dá)-9.264。由此可見,用神經(jīng)網(wǎng)絡(luò)研究大棗香味成分與色譜保留之間的關(guān)系結(jié)果更好,擬合能力明顯優(yōu)于多元線性回歸法。
2.2 QSQR模型的檢驗(yàn)
ANN模型和MLR模型的相關(guān)系數(shù)(R)、標(biāo)準(zhǔn)偏差(s)、留一交互檢驗(yàn)相關(guān)系數(shù)(RCV)、外部預(yù)測(cè)集相關(guān)系數(shù)RTRST分別見表2、圖2和圖3。BP-ANN模型的預(yù)測(cè)值與試驗(yàn)值相關(guān)系數(shù)R為0.998 9、訓(xùn)練集留一交叉檢驗(yàn)的相關(guān)系數(shù)RCV為0.998 9,模型穩(wěn)健性良好;當(dāng)將其應(yīng)用于外部預(yù)測(cè)集時(shí),外部預(yù)測(cè)集的預(yù)測(cè)值與試驗(yàn)值的相關(guān)系數(shù)Rext為0.998 9,說明模型外推能力很強(qiáng);統(tǒng)計(jì)分析結(jié)果Sext為0.985,顯著性系數(shù)低于0.000 1,結(jié)合殘差散點(diǎn)圖可知,模型無顯著性差異。而MLR法的R為0.981 9、Rext為0.986 1、Sext為3.724,顯然不及BP-ANN模型。由此可知,BP-ANN模型的穩(wěn)定性和外推能力都明顯優(yōu)于MLR模型。
3 結(jié)論
采用BP-ANN對(duì)大棗香味成分與色譜保留之間的定量構(gòu)效關(guān)系進(jìn)行建模,取得了較好的預(yù)測(cè)結(jié)果,相關(guān)系數(shù)R為0.998 9、RCV為0.998 9、Rext為0.998 9,模型的穩(wěn)健性和實(shí)用性均較好;殘差絕對(duì)值分布在-3.844~2.220,頻率直方圖基本符合正態(tài)分布,且統(tǒng)計(jì)分析的Sext為0.985,顯著性系數(shù)小于0.000 1,說明模型無顯著性差異。這對(duì)預(yù)測(cè)棗香味成分色譜保留值、選擇香味成分分離條件等具有重要意義。并且可為進(jìn)一步了解大棗香味成分特征、對(duì)大棗深加工和開發(fā)應(yīng)用、實(shí)現(xiàn)香氣成分分離條件的選擇等提供一定的理論依據(jù)。
參考文獻(xiàn):
[1] 胡 芳,趙智慧,劉孟軍.金絲小棗類黃酮提取最佳條件及抗氧化研究[J].中國(guó)食品學(xué)報(bào),2012,12(4):77-83.
[2] 張軍和,師玉忠,杜朝曦.紅棗糯米酒的研制[J]. 食品與機(jī)械,2012,28(2):210-212.
[3] 李 俠,彭 丹,張春暉,等.紅棗酒發(fā)酵動(dòng)力學(xué)研究[J].中國(guó)釀造,2012,31(1):190-193.
[4] 張峻松,賈春曉,毛多斌,等.生物技術(shù)制備天然棗香料的香味化合物分析[J].精細(xì)化工,2003,20(2):82-84.
[5] 凌圣寶,向進(jìn)樂,李志西,等.拐棗醋飲加工工藝及其抗氧化活性分析[J]. 食品工業(yè)科技,2012,33(15):254-257,262.
[6] 吳菊花,張生萬(wàn),張嬋娟,等.棗香味成分的結(jié)構(gòu)表征及其色譜保留值的預(yù)測(cè)[J].山西大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,33(3):425-429.
[7] GHAVAMI R, FAHAM S. QSRR Models for Kova‘ts retention indices of a variety of volatile organic compounds on polar and apolar gc stationary phases using molecular connectivity indexes[J]. Chromatographia,2010,72(9-10):893-903.
[8] NOORIZADEH H, FARMANY A. QSRR models to predict retention indices of cyclic compounds of essential oils[J]. Chromatographia, 2010,72(5-6):563-569.
[9] NOORIZADEH H, NOORIZADEH M. QSRR-based estimation of the retention time of opiate and sedative drugs by comprehensive two-dimensional gas chromatography[J]. Medicinal Chemistry Research,2012,21(8):1997-2005.
[10] GARKANI-NEJAD Z. Use of self-training artificial neural networks in a qsrr study of a diverse set of organic compounds[J]. Chromatographia,2009,70(5-6):869-874.
[11] NEMECEK P, MOCAK J, LEHOTAY J, et al. Prediction of HPLC retention factor of potential antituberculotics by QSRR[J]. Journal of Liquid Chromatography & Related Technologies,2011,34(3):168-181.