秦正龍,馮長(zhǎng)君
(1.江蘇師范大學(xué) 化學(xué)與材料科學(xué)學(xué)院,江蘇 徐州 221116;2.徐州工程學(xué)院 化學(xué)化工學(xué)院,江蘇 徐州 221008)
山楂又稱紅果、仙果、山里果、山里紅等,是薔薇科山楂屬植物山楂或山里果的成熟果實(shí)[1-2],在我國(guó)的云南、山東、貴州、東北、太行山南部及燕山山脈等地廣泛種植[3],與北美、智利形成三大世界山楂種植中心[4],山楂資源十分豐富。但是,由于其口感酸澀,故鮮食量很少,而傳統(tǒng)的加工品種也不多,僅有山楂醬、山楂糕、山楂罐頭及山楂果脯等,產(chǎn)品附加值低[5-6]。果酒因其口感細(xì)膩、營(yíng)養(yǎng)豐富、清亮透明、果香濃郁且酒精度低、節(jié)約糧食、保健價(jià)值高,是未來(lái)釀酒企業(yè)的發(fā)展方向。因此,以山楂為原料加工成果酒,既解決了山楂貯藏保鮮問(wèn)題,又提升了附加值[7-8],促進(jìn)區(qū)域經(jīng)濟(jì)發(fā)展。目前,對(duì)山楂果酒的研究主要集中在分離、鑒定、檢測(cè)及工藝等方面[9-12],對(duì)其香氣組分性質(zhì)的研究則較少。神經(jīng)網(wǎng)絡(luò)是模擬人腦網(wǎng)絡(luò)結(jié)構(gòu)的一種信息功能處理系統(tǒng),該方法結(jié)構(gòu)簡(jiǎn)單、自適應(yīng)及自學(xué)習(xí)能力強(qiáng),可以構(gòu)建高質(zhì)的非線性模型,在藥物、環(huán)境及食品等領(lǐng)域應(yīng)用廣泛[13-16],但利用神經(jīng)網(wǎng)絡(luò)方法研究山楂果酒香氣成分鮮見(jiàn)報(bào)道。為此本研究采用神經(jīng)網(wǎng)絡(luò)方法中的誤差逆?zhèn)鞑ザ鄬忧梆伨W(wǎng)絡(luò)算法,建立香氣成分色譜保留時(shí)間與其分子結(jié)構(gòu)之間的神經(jīng)網(wǎng)絡(luò)模型并對(duì)其進(jìn)行預(yù)測(cè),為快速檢測(cè)山楂果酒的風(fēng)味成分,提高果酒品質(zhì)提供一定依據(jù)。
山楂紅酒中48種香氣成分的色譜保留時(shí)間(retention time,RT):取自參考文獻(xiàn)[9]。
Agilent 7890A-5975C氣相色譜-質(zhì)譜聯(lián)用儀(gas chromatography-mass spectrometry,GC-MS):美國(guó)安捷倫公司;DH6000AH型電熱恒溫培養(yǎng)箱:天津市泰斯特儀器有限公司。
1.3.1 分子結(jié)構(gòu)表征
拓?fù)渲笖?shù)是對(duì)分子圖的某種矩陣通過(guò)數(shù)學(xué)計(jì)算而獲得的,是圖的一種不變量,可揭示化合物分子的結(jié)構(gòu)特征。只要拓?fù)渲笖?shù)蘊(yùn)含了影響色譜保留時(shí)間的本質(zhì)因素,那么,兩者之間必然具有良好的相關(guān)性。
分子價(jià)連接性指數(shù)(mXtV)[17]定義成鍵的非氫原子i的特征值(δiv)為:
示和非氫原子i成鍵的氫原子數(shù)。
分子價(jià)連接性指數(shù)(mXtV)的計(jì)算公式為:
式中:m為指數(shù)的階數(shù);t為子圖的類(lèi)型,有鏈、星、環(huán)、星-鏈等4種子圖,依次記作p、c、ch及pc。
電拓?fù)錉顟B(tài)指數(shù)(Ei)[18]包含兩個(gè)方面,一方面是原子的本征值,它是由每個(gè)非氫原子類(lèi)型i的原子結(jié)構(gòu)和拓?fù)洵h(huán)境共同決定,以“Hi”表示;另一方面是原子本征值的增量,它是由其他非氫原子擾動(dòng)所產(chǎn)生的,以“ΔHi”表示。定義電拓?fù)錉顟B(tài)指數(shù)(Ei)為:
式中:j為原子類(lèi)型i的個(gè)數(shù)。
1.3.2 兩類(lèi)拓?fù)鋮?shù)的計(jì)算
采用Chemoffice 2005繪圖軟件,畫(huà)出文獻(xiàn)[9]中山楂紅酒48種揮發(fā)性香味化合物分子的結(jié)構(gòu)圖,然后在MATLAB軟件中,使用張婷等[19]報(bào)道的方法編寫(xiě)計(jì)算程序,運(yùn)算得分子價(jià)連接性指數(shù)(mXtV)及電拓?fù)錉顟B(tài)指數(shù)(Ei)(見(jiàn)表1,限于篇幅,表中只列出了相關(guān)的6種)。
表1 山楂紅酒香氣成分的結(jié)構(gòu)參數(shù)及色譜保留時(shí)間Table 1 Structural parameters and chromatographic retention time of aroma compounds in hawthorn red wine
續(xù)表
1.3.3 實(shí)驗(yàn)方法
將上述計(jì)算得到的山楂紅酒中48種香氣成分的兩類(lèi)指數(shù)用Minitab最佳變量子集回歸,分析篩選與香氣成分色譜保留時(shí)間相關(guān)性最優(yōu)的變量集,并以Kubinyi函數(shù)(Kubinyi function,Kf)[20-21]作為判據(jù),Kf值越大,模型的穩(wěn)定性、預(yù)測(cè)能力就越強(qiáng)。
由表2可見(jiàn),模型中隨著變量數(shù)目的增多,R、R2和R2adj持續(xù)增大,S逐漸減小,但五元模型后,其數(shù)值變化均很小,且Kf在五元模型處出現(xiàn)最大值,說(shuō)明該模型的質(zhì)量最好。所以本實(shí)驗(yàn)選用4XpV、E12、1XpV、E1、0XpV為最佳變量組合。
表2 保留時(shí)間與mXtV、Ei的回歸結(jié)果Table 2 Regression results of mXtV,nEiand retention time
將山楂紅酒中48種揮發(fā)性香味化合物的色譜保留時(shí)間(RT)與上述優(yōu)化篩選得到的5參數(shù)最佳變量組合4XpV、E12、1XpV、E1、0XpV進(jìn)行多元線性回歸,得到的模型為:
用模型(4)給出的預(yù)測(cè)值與實(shí)驗(yàn)值基本吻合(預(yù)測(cè)值1,見(jiàn)表1)。
為了檢驗(yàn)?zāi)P停?)的穩(wěn)定性及預(yù)測(cè)能力,采用Jackknifed檢驗(yàn)法進(jìn)行檢驗(yàn),即每次從48個(gè)山楂紅酒香氣成分中剔除1個(gè),用余下的47個(gè)組分建模,依次建立48個(gè)方程,得到48個(gè)相關(guān)系數(shù),其平均值為0.979,與模型(4)的相關(guān)系數(shù)完全吻合。根據(jù)一般的統(tǒng)計(jì)標(biāo)準(zhǔn),所建模型的R2>0.8,說(shuō)明所建模型具有良好的預(yù)測(cè)能力。模型(4)的R2為0.958,另外,模型(4)的Kf最大,說(shuō)明該模型的預(yù)測(cè)能力最好,穩(wěn)定性最佳。為了進(jìn)一步檢驗(yàn)?zāi)P停?)的質(zhì)量,將48個(gè)香氣化合物分成兩個(gè)集,即訓(xùn)練集和測(cè)試集。隨機(jī)剔去序號(hào)為4、13、22、29和41共5個(gè)化合物,并作為測(cè)試集,剩余的43個(gè)化合物為訓(xùn)練集,按上述方法建立的模型為:
由模型(5)給出的序號(hào)為4、13、22、29、41五個(gè)化合物色譜保留時(shí)間的預(yù)測(cè)值分別為12.031、13.427、29.008、33.295、46.198,與模型(4)給出的預(yù)測(cè)值、實(shí)驗(yàn)值較好吻合,而且模型(5)和模型(4)十分相似:①兩個(gè)模型中對(duì)應(yīng)的各項(xiàng),其數(shù)值非常接近;②兩個(gè)模型的R、R2、R2adj、F、S等質(zhì)量指標(biāo)也十分接近??梢?jiàn)模型(4)是相關(guān)性、穩(wěn)定性俱佳的模型。
為了判斷模型是否存在離域點(diǎn),將山楂紅酒中48種揮發(fā)性香味化合物的Jackknifed相關(guān)系數(shù)作雷達(dá)圖(圖1),以0.970為圓心,間距為0.002,48個(gè)Jackknife 相關(guān)系數(shù)圍繞原始模型(4)的相關(guān)系數(shù)(0.979)上下波動(dòng),且波動(dòng)范圍很小,Jackknife的相關(guān)系數(shù)全都處在0.977~0.982 之間,表明模型(4)沒(méi)有異常的離域點(diǎn)。
圖1 相關(guān)系數(shù)的雷達(dá)圖Fig.1 Radar chart of correlation coefficients
為了使模型的預(yù)測(cè)精準(zhǔn)度進(jìn)一步提高,使用誤差反向傳播方法的三層網(wǎng)絡(luò)結(jié)構(gòu),以前述最好的多元回歸模型中的5種分子結(jié)構(gòu)參數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入層單元,揮發(fā)性香味成分的色譜保留時(shí)間作為輸出層單元,最佳隱蔽層的單元數(shù)按照許祿等[22]提出規(guī)則,經(jīng)計(jì)算并優(yōu)化得5。因此,網(wǎng)絡(luò)結(jié)構(gòu)為5∶5∶1。為了避免發(fā)生過(guò)擬合,把山楂紅酒中48種揮發(fā)性香味物質(zhì)劃分為3個(gè)集,1組5個(gè)數(shù)據(jù),其中的第1、3、4個(gè)數(shù)據(jù)即為訓(xùn)練集,其相關(guān)系數(shù)為0.997,每組的第2個(gè)、第5個(gè)數(shù)據(jù)則分別為測(cè)試集和驗(yàn)證集,它們的相關(guān)系數(shù)分別是0.999、0.999,總相關(guān)系數(shù)是0.998。由神經(jīng)網(wǎng)絡(luò)法得到的預(yù)測(cè)值見(jiàn)表1(預(yù)測(cè)值2),預(yù)測(cè)值與實(shí)驗(yàn)值頗為吻合,平均相對(duì)誤差為3.31%。多元回歸法與神經(jīng)網(wǎng)絡(luò)法實(shí)驗(yàn)值和預(yù)測(cè)值的關(guān)系見(jiàn)圖2。由圖2可知,神經(jīng)網(wǎng)絡(luò)法更優(yōu)。
圖2 兩種方法預(yù)測(cè)值與計(jì)算值的關(guān)系Fig.2 Relationship between experimental and predicted values of the two methods
在氣相色譜分析中,影響色譜保留時(shí)間的因素很多,如果其他條件恒定下,那么色譜保留時(shí)間的長(zhǎng)短決定于化合物分子和固定相之間的相互作用,相互之間的作用力越大,則色譜保留時(shí)間就越長(zhǎng)。相互之間的作用力主要包含取向力、誘導(dǎo)力及色散力。分子價(jià)連接性指數(shù)把化合物結(jié)構(gòu)圖中各種子結(jié)構(gòu)碎片進(jìn)行加權(quán)計(jì)算,對(duì)于3個(gè)以上非氫原子組成的分子,即可產(chǎn)生鏈、簇、星和環(huán)等許多片段結(jié)構(gòu),能表征分子的大小、形狀、分枝、表面積等,較好地揭示了色散力的強(qiáng)弱。電拓?fù)錉顟B(tài)指數(shù)反映了化合物分子中成鍵原子的價(jià)態(tài)信息、固有特征、電子狀態(tài)、拓?fù)洵h(huán)境及電性作用等,其數(shù)值大小較好地揭示了取向力、誘導(dǎo)力的強(qiáng)弱。因此,與神經(jīng)網(wǎng)絡(luò)方法結(jié)合,相關(guān)系數(shù)由原來(lái)的0.979提高到了0.998,預(yù)測(cè)能力大幅度提升。
通過(guò)Minitab優(yōu)化篩選的5 個(gè)分子結(jié)構(gòu)參數(shù)與山楂紅酒中48種香氣成分色譜保留時(shí)間之間建立的定量構(gòu)效關(guān)系模型,經(jīng)檢驗(yàn)不存在異常的離域值,具有良好的穩(wěn)定性和較強(qiáng)的預(yù)測(cè)能力。神經(jīng)網(wǎng)絡(luò)法比多元回歸分析法的預(yù)測(cè)準(zhǔn)確度和糾錯(cuò)能力都更好,訓(xùn)練集的相關(guān)系數(shù)為0.997,測(cè)試集的相關(guān)系數(shù)是0.999,驗(yàn)證集的相關(guān)系數(shù)是0.999,總的相關(guān)系數(shù)為0.998,平均相對(duì)誤差為3.31%,計(jì)算值與實(shí)驗(yàn)值很好吻合。
山楂果酒酸甜適口,酒體清爽優(yōu)雅,不但有很高的營(yíng)養(yǎng)價(jià)值,而且還有獨(dú)特的保健及藥理功能。近年來(lái),人們的生活水平和質(zhì)量不斷提升,對(duì)天然食品的保健功能也更加重視。本研究結(jié)果為探索色譜分離條件,研究色譜保留機(jī)制提供有益的理論參考,對(duì)山楂果酒香氣成分的結(jié)構(gòu)表征、質(zhì)量檢驗(yàn)及藥用價(jià)值的開(kāi)發(fā)等,具有一定的實(shí)際意義。