孫曉榮,周子健,劉翠玲,付新鑫,竇 穎
基于光譜預(yù)處理結(jié)合遺傳算法優(yōu)化波長的面粉水分快速檢測
孫曉榮,周子健,劉翠玲,付新鑫,竇 穎
(北京工商大學(xué)計算機(jī)與信息工程學(xué)院,食品安全大數(shù)據(jù)技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100048)
基于光譜預(yù)處理及遺傳算法(genetic algorithm,GA)法優(yōu)化波長,再結(jié)合偏最小二乘(partial least squares,PLS)法建立面粉中水分的定量分析模型,對比在不同預(yù)處理方法下相關(guān)系數(shù)R2、校正標(biāo)準(zhǔn)差(root mean square error of calibration,RMSEC)、預(yù)測標(biāo)準(zhǔn)偏差(root mean square error of prediction,RMSEP)3 個指標(biāo),隨機(jī)選擇130 份樣本建立預(yù)處理+GA+PLS定量分析模型,實(shí)驗(yàn)結(jié)果為R2從0.955 2提高到0.977 7、RMSEC從0.375 8降低到0.245 3、RMSEP從0.268降低到0.264。結(jié)果表明基于光譜預(yù)處理結(jié)合GA優(yōu)化波長來定量分析面粉中水分含量是可行的,且準(zhǔn)確性和誤差度皆優(yōu)于無優(yōu)化模型。
光譜預(yù)處理;遺傳算法;近紅外光譜;偏最小二乘法;面粉;水分
面粉是重要的碳水化合物來源,且富含各種人體所需的微量元素和營養(yǎng)物質(zhì)。面粉中水分含量會影響面制食品的白度、柔軟度和保鮮時間等,目前國標(biāo)測定水分的方法為105 ℃衡溫法和130 ℃高溫定時法,但由于高溫烘干法不但耗時費(fèi)力還造成資源浪費(fèi),越來越多的研究人員將光譜檢測與化學(xué)計量學(xué)結(jié)合建立定量分析模型用于面粉的品質(zhì)檢測[1-4]。目前,偏最小二乘(partial least squares,PLS)法是應(yīng)用最廣的多元回歸預(yù)測建模方法,但在檢測過程中存在諸多因素干擾模型的準(zhǔn)確性和穩(wěn)定性,因此對光譜進(jìn)行預(yù)處理以及波長的優(yōu)化有極其重要的意義[5]。常用預(yù)處理方法有矢量歸一化、Savitsky-Golay卷積平滑法、導(dǎo)數(shù)法、標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variate correction,SNV)、多元散射校正(multiplicative scatter correction,MSC)[6-8]等。常用波長優(yōu)化方法有相關(guān)系數(shù)法、無信息量消除法、模擬退火算法(simulated annealing algorithm,SAA)、遺傳算法(genetic algorithm,GA)等[9-13]。
光譜預(yù)處理方法眾多,對于不同的待測樣本不同的預(yù)處理方法有著自身的優(yōu)越性和缺點(diǎn)。例如:校正不同厚度的樣本多使用矢量歸一化,對于顆粒狀固體或表面散射樣本多使用SNV[14]。GA是由美國Holland教授1975年首先提出,源于自然界優(yōu)勝劣汰原則。GA利用選擇、交換和突變等算子等操作,通過迭代的手段,根據(jù)目標(biāo)函數(shù)值留下較優(yōu)變量,去除較差變量,最終實(shí)現(xiàn)特征變量優(yōu)選,是一個自適應(yīng)的全局搜索算法。GA相比于其他波長優(yōu)化方法有如下特點(diǎn)[15-17]:適合求解離散問題;直接對結(jié)構(gòu)對象進(jìn)行操作,不存在求導(dǎo)和函數(shù)連續(xù)性的限定;采用概率化的尋優(yōu)方法,能自動獲取和指導(dǎo)優(yōu)化的搜索空間,自適應(yīng)地調(diào)整搜索方向,不需要確定的規(guī)則。
GA在許多行業(yè)和領(lǐng)域都發(fā)揮著極重要的作用。蔡麗君等[18]運(yùn)用小波壓縮結(jié)合GA篩選變量建立關(guān)于臍橙糖度的定量模型,結(jié)果良好,應(yīng)用于在線檢測可提升預(yù)測精度。黃常毅等[19]為降低模型計算復(fù)雜程度、提高預(yù)測性能,運(yùn)用GA篩選譜區(qū),建立預(yù)測紅曲菌固態(tài)發(fā)酵生物量PLS定量模型。實(shí)驗(yàn)證明了GA應(yīng)用于該模型的可行性且為進(jìn)一步實(shí)現(xiàn)在線控制提供了理論與實(shí)踐依據(jù)。
建立在相關(guān)領(lǐng)域研究的基礎(chǔ)上,提出基于光譜預(yù)處理+GA波長優(yōu)化,并結(jié)合PLS建立面粉中水分的定量分析模型,達(dá)到模型優(yōu)化的目的。
1.1 材料
實(shí)驗(yàn)中所用130 份面粉樣本均取自古船面粉不同批次以及不同種類的面粉產(chǎn)品,待測組分真實(shí)值均來自古船面粉廠依據(jù)傳統(tǒng)國標(biāo)法測得的實(shí)驗(yàn)數(shù)據(jù)。
1.2 儀器與設(shè)備
近紅外定量模型優(yōu)化實(shí)驗(yàn)采用德國布魯克(Bruker)公司Vertex 70傅里葉紅外光譜儀采集面粉樣本的近紅外光譜。光譜數(shù)據(jù)分析在Matlab 2014環(huán)境下完成。
儀器參數(shù)設(shè)置為:分辨率8 cm-1,樣本掃描次數(shù)64 次,背景掃描次數(shù)64 次,采集光譜范圍12 000~4 000 cm-1,光闌孔徑設(shè)置6 mm,掃描速率10 kHz。
1.3 方法
1.3.1 光譜預(yù)處理方法
為了將光譜儀器采集到的除自身信息以外的無關(guān)變量和噪聲,如雜散光、樣本背景削弱或清除,保證光譜信息和含量值之間有很好的相關(guān)性,實(shí)驗(yàn)運(yùn)用適合的預(yù)處理方法十分關(guān)鍵[20-21]。
常用的光譜預(yù)處理方法很多,本實(shí)驗(yàn)研究結(jié)合樣本特性和預(yù)處理方法功能,對比分析最終選擇了5 種預(yù)處理方法,分別為矢量歸一化、Savitsky-Golay卷積平滑法、導(dǎo)數(shù)法、SNV以及MSC[22-23]。
1.3.2 常用波長篩選算法原理及特點(diǎn)
波長的優(yōu)化不僅減少參與校正計算的數(shù)據(jù)量,降低數(shù)據(jù)運(yùn)算時間,提升檢測工作的效率,并且校正模型整體質(zhì)量有一定程度的提高。目前在光譜分析中,常用優(yōu)化算法很多,一些常用算法的實(shí)現(xiàn)方式和特點(diǎn)如表1所示。
表1 常用波長篩選算法原理及特點(diǎn)Table 1 The principle and characteristics of wavelength selection methods
傳統(tǒng)篩選方法更多考慮的是光譜波長與待測組分的關(guān)系,因此需要研究人員提供更多化學(xué)經(jīng)驗(yàn)和知識作為理論參考;而隨機(jī)優(yōu)化算法則更多展現(xiàn)的是在復(fù)雜問題中強(qiáng)大的搜索能力,在合理時間內(nèi)最大限度根據(jù)客觀實(shí)驗(yàn)結(jié)果參數(shù)找出最優(yōu)波長,減少了人為因素干擾。在算法的選擇上,應(yīng)具體問題具體對象進(jìn)行具體分析,尋找最適合實(shí)驗(yàn)?zāi)P偷膬?yōu)化算法。綜合各方面考慮,本研究最終選擇GA進(jìn)行波長篩選。一方面盡量避免專業(yè)知識及經(jīng)驗(yàn)的影響和限制;GA適合解決離散問題,且具有全局最優(yōu)的優(yōu)勢。
1.3.3 GA及適應(yīng)度函數(shù)
GA的操作過程包括選擇、交叉、變異,其中選擇環(huán)節(jié)依據(jù)適應(yīng)度函數(shù),選擇優(yōu)良個體。
適應(yīng)度函數(shù)是GA中至關(guān)重要的復(fù)雜函數(shù),用于區(qū)分個體優(yōu)劣,提升整體優(yōu)勢[29-31]。可選擇校正模型的相關(guān)系數(shù)R2、校正標(biāo)準(zhǔn)偏差(root mean square error of calibration,RMSEC)或者預(yù)測標(biāo)準(zhǔn)偏差(root mean square error of prediction,RMSEP)。R2、RMSEC、RMSEP都是評價校正模型的重要參數(shù),分別按公式(1)~(3)計算。
式中:yi,a為第i個樣本參考方法的測定值;yi,a為校正集所有樣本參考方法測定值的平均值;yi,p為預(yù)測過程中第i個樣本的預(yù)測值;n為校正集的樣本數(shù)。
式中:yi,a為第i個樣本參考方法的測定值;yi,p為驗(yàn)證集預(yù)測過程中第i個樣本的預(yù)測值;m為驗(yàn)證集的樣本數(shù)。
1.4 數(shù)據(jù)處理
實(shí)驗(yàn)中利用OPUS 7.0軟件將收集到的光譜轉(zhuǎn)換為數(shù)據(jù)點(diǎn)格式以及單一PLS回歸預(yù)測曲線,光譜預(yù)處理+GA結(jié)合PLS由Matlab 2014軟件完成。
2.1 采集樣品的近紅外光譜
圖1 部分面粉樣本的近紅外光譜圖Fig. 1 Near infrared spectra of partial samples
實(shí)驗(yàn)中共130 份面粉樣本,基于SPXY樣本劃分法選取其中106 份樣本作為校正集,24 份樣本作為測試集。實(shí)驗(yàn)每隔0.5 h采集一次背景光譜,并保持室內(nèi)恒溫26 ℃。光譜儀器掃描次數(shù)設(shè)置為64 次,分辨率為8 cm-1采集部分面粉樣本近紅外光譜如圖1所示。
2.2 光譜預(yù)處理結(jié)合PLS建立面粉中水分含量的定量模型實(shí)驗(yàn)選用歸一化、導(dǎo)數(shù)、SNV、MSC、Savitsky-Golay平滑5 種常用光譜預(yù)處理方法,按照一定關(guān)系排列成11 種組合,分別對面粉中水分定量分析模型進(jìn)行光譜處理,旨在最大程度消除光譜數(shù)據(jù)無關(guān)信息和噪音,提升校正模型的預(yù)測性能和穩(wěn)健性,通過對結(jié)果對比分析,找出最適合面粉檢測的預(yù)處理方法。模型基于11 種預(yù)處理組合分別建立PLS全譜模型,結(jié)果如表2所示。
表2 不同預(yù)處理方法的定量模型結(jié)果對比Table 2 Comparison of quantitative models developed using different spectral pretreatments
從表2可以看出,平滑結(jié)合歸一化和平滑結(jié)合一階導(dǎo)數(shù)預(yù)處理組合優(yōu)化光譜后,所見模型部分參數(shù)略優(yōu)于原始光譜所建模型。包含二階求導(dǎo)預(yù)處理方法的組合,對模型并未起到優(yōu)化作用,甚至各個參數(shù)均明顯低于原始光譜定量模型,因此二階求導(dǎo)并不適用于建立關(guān)于面粉中水分含量的定量分析模型。其余組合方法優(yōu)化效果不明顯。
2.3 面粉中水分含量的GA-PLS定量模型
實(shí)驗(yàn)在建立基于GA優(yōu)化波長的面粉中水分含量PLS定量模型時,GA適應(yīng)度函數(shù)收斂結(jié)果如圖2所示,GA在迭代150 次時適應(yīng)度函數(shù)已經(jīng)趨于平穩(wěn);相關(guān)系數(shù)R2和RMSEC隨特征波長數(shù)量變化如圖3所示,模型參數(shù)在特征波長數(shù)量為60的時候趨于平穩(wěn)。因此綜合以上分析,種群規(guī)模設(shè)定為30,最大迭代次數(shù)設(shè)定為150 次,提取特征波長數(shù)量為60 個,適應(yīng)度函數(shù)選擇RMSEP。
圖2 適應(yīng)度函數(shù)隨迭代次數(shù)收斂結(jié)果Fig. 2 Superconvergence of fitness function with varying number of iterations
圖3 R2和RMSEC隨特征波長數(shù)量變化Fig. 3 Curves of R2 and RMSEC against number of characteristic wavelengths
2.4 結(jié)合光譜預(yù)處理的GA-PLS定量模型對比
采用水分含量區(qū)間為10%~16%的校正樣本建立全譜PLS定量分析模型,并結(jié)合光譜預(yù)處理以及GA優(yōu)化該模型,由于結(jié)合二階導(dǎo)數(shù)的預(yù)處理組合建模效果較差,因此預(yù)處理結(jié)合波長優(yōu)化方法實(shí)驗(yàn)中將不再使用該組合,各方法優(yōu)化結(jié)果如表3所示。
本研究在模型評價方面,除使用相關(guān)系數(shù)R2和RMSEP評價模型預(yù)測準(zhǔn)確性外,還引入穩(wěn)健性參數(shù)RMSEP/RMSEC和RPD兩個評價指標(biāo)。在實(shí)際應(yīng)用中,待測樣本光譜在采集時會遇干擾產(chǎn)生變動,模型穩(wěn)健性是描述模型容許光譜變動的包容能力,即模型抗干擾能力。國際谷物化學(xué)組織規(guī)定在正常容變范圍之內(nèi)RMSEP/ RMSEC應(yīng)小于1.2,若穩(wěn)健性參數(shù)大于1.2則表示模型穩(wěn)健性不足;另外,使用相對分析誤差RPD對預(yù)測精度進(jìn)行進(jìn)一步評價,即相對分析誤差RPD為SD/RMSEP(SD為驗(yàn)證集標(biāo)準(zhǔn)偏差)。如果RPD不小于3,說明預(yù)測效果良好,建立的定量分析模型可用于實(shí)際檢測;如果RPD在2.5與3之間,說明利用近紅外光譜定量分析是可行的,但預(yù)測精度有待于進(jìn)一步提高;如果RPD不大于2.5,則說明難于進(jìn)行近紅外光譜定量分析[32-33]。
表3 近紅外光譜經(jīng)預(yù)處理結(jié)合GA優(yōu)化模型結(jié)果Table 3 Comparison of PLSR models developed using different spectral pretreatments combined with GA-based wavelength selection
從實(shí)驗(yàn)結(jié)果得出,在保證模型穩(wěn)健性的情況下,GA篩選特征波長可以有效提升模型的預(yù)測準(zhǔn)確性,結(jié)合適合的光譜預(yù)處理方法后,模型的優(yōu)化結(jié)果進(jìn)一步得到提升。
圖4 SG平滑(17)+一階導(dǎo)數(shù)+SNV法預(yù)處理后近紅外光譜Fig. 4 NIR spectra treated by SG(17) + first derivative + SNV
圖5 SG(17)+一階導(dǎo)數(shù)+SNV+GA的水分PLS校正集定量模型Fig. 5 Predictive values from SG + first derivative + SNV + GA + PLS model and actual values for calibration set
近紅外光譜經(jīng)SG平滑(17點(diǎn))+一階導(dǎo)數(shù)+SNV預(yù)處理后譜圖如圖4所示,SG平滑(17)+一階導(dǎo)數(shù)+ SNV結(jié)合GA優(yōu)化的水分PLS定量分析校正集模型如圖5所示,測試集定量模型如圖6所示。
圖6 SG(17)+一階導(dǎo)數(shù)+SNV+GA的水分PLS測試集定量模型Fig. 6 Predictive values from SG + first derivative + SNV + GA + PLS model and actual values for test set
研究在不同光譜預(yù)處理組合方式與波長篩選方法做了大量實(shí)驗(yàn),旨在優(yōu)化面粉近紅外光譜定量分析模型,使模型具備良好的預(yù)測準(zhǔn)確性與穩(wěn)健性。在實(shí)驗(yàn)過程中探討了11 種光譜預(yù)處理組合方式對模型評價參數(shù)的影響,以及不同預(yù)處理組合結(jié)合GA篩選波長對優(yōu)化模型評價參數(shù)的影響。
近紅外光譜不經(jīng)過預(yù)處理以及波長優(yōu)化,模型在相關(guān)系數(shù)R2、RMSEC和RMSEP 3 方面指標(biāo)均較低,說明面粉中水分含量PLS定量模型準(zhǔn)確性和穩(wěn)健性都較差。結(jié)合GA建立的GA-PLS模型得到完善,再結(jié)合光譜預(yù)處理,模型得到進(jìn)一步提升。在眾多預(yù)處理組合中,SG平滑+一階導(dǎo)數(shù)+SNV與GA相結(jié)合后模型的預(yù)測準(zhǔn)確性最好,并且RPD結(jié)果較好屬于可接受范圍內(nèi),表明模型穩(wěn)健性良好。利用模型可以綠色環(huán)保的應(yīng)用在面粉品質(zhì)快速檢測的生產(chǎn)活動中,減少面粉工廠的人力消耗,提升生產(chǎn)廠家效益。
[1] 王玉庭. 中國小麥消費(fèi)現(xiàn)狀及趨勢分析[J]. 中國實(shí)物與營養(yǎng), 2010(5): 47-50. DOI:10.3969/j.issn.1006-9577.2010.05.013.
[2] 肖馳. 水分對面粉凈含量的影響[J]. 山東工業(yè)技術(shù), 2015(21): 231. DOI:10.16640/j.cnki.37-1222/t.2015.21.206.
[3] 豆康寧. 小麥與面粉中水分的測定方法[J]. 現(xiàn)代面粉工業(yè), 2016(1): 30-32. DOI:10.3969/j.issn.1674-5280.2016.01.012.
[4] SHEN F, YING Y B, XU H R, et al. Identification of aging status of Chinese rice wine using Fourier transform near-infrared spectroscopy[J]. Transactions of the Asabe, 2011, 54: 1857-1862. DOI:10.13031/2013.39825.
[5] 馬蘭, 夏俊芳, 張戰(zhàn)鋒, 等. 番茄總糖含量的近紅外光譜無損檢測方法研究[J]. 食品科學(xué), 2009, 30(6): 171-174. DOI:10.3321/ j.issn:1002-6630.2009.06.037.
[6] 褚小立, 劉慧穎, 燕澤程. 近紅外光譜分析技術(shù)實(shí)用手冊[M]. 北京:機(jī)械工業(yè)出版社, 2016: 115-117.
[7] 劉永, 楊華蓉, 林大勝, 等. 近紅外光譜法測定三七通舒膠囊粉末的混合均勻度[J]. 華西醫(yī)學(xué)雜志, 2012, 27(4): 418-420. DOI:10.13375/ j.cnki.wcjps.2012.04.013.
[8] 陸婉珍. 現(xiàn)代近紅外光譜分析技術(shù)[M]. 2版. 北京: 中國石化出版社, 2006: 35-36.
[9] 竇穎, 孫曉榮, 劉翠玲, 等. 基于模擬退火算法優(yōu)化波長的面粉品質(zhì)檢測[J]. 食品科學(xué), 2016, 37(12): 208-211. DOI:10.7506/spkx1002-6630-201612037.
[10] 褚小立, 袁洪福, 陸婉珍. 近紅外分析中光譜預(yù)處理及波長選擇方法進(jìn)展與應(yīng)用[J]. 化學(xué)進(jìn)展, 2004, 16(4): 528-542. DOI:10.3321/ j.issn:1005-281X.2004.04.008.
[11] 褚小立. 化學(xué)計量學(xué)方法與分子光譜分析技術(shù)[M]. 北京: 化學(xué)工業(yè)出版社, 2011: 83-84.
[12] ZOU Xiaobo, ZHAO Jiewen. Variables selection methods in nearinfrared spectroscopy[J]. Analytica Chimica Acta, 2010, 667(1/2): 14-23. DOI:10.1016/j.aca.2010.03.048.
[13] 馬永杰, 云文霞. 遺傳算法研究進(jìn)展[J]. 計算機(jī)應(yīng)用研究, 2012, 29(4): 1201-1206. DOI:10.3969/j.issn.1001-3695.2012.04.001.
[14] 黃承偉, 戴連奎, 董學(xué)鋒. 結(jié)合SNV的分段直接標(biāo)準(zhǔn)化方法在拉曼光譜模型傳遞中的應(yīng)用[J]. 光譜學(xué)與光譜分析, 2011, 31(5): 1279-1282. DOI:10.3964/j.issn.1000-0593(2011)05-1279-04.
[15] 杜文麗, 原亮. 遺傳算法的特點(diǎn)及應(yīng)用領(lǐng)域研究[J]. 科技信息, 2008(10): 31-54. DOI:10.3969/j.issn.1001-9960.2008.10.022.
[16] 邊霞, 米良. 遺傳算法理論及其應(yīng)用研究進(jìn)展[J]. 計算機(jī)應(yīng)用研究, 2010, 27(7): 2425-2434. DOI:10.3969/j.issn.1001-3695.2010.07.006.
[17] 王元忠, 趙艷麗, 張霽, 等. 紅外光譜結(jié)合統(tǒng)計分析對不同產(chǎn)地瑪咖的鑒別分類[J]. 食品科學(xué), 2016, 37(4): 169-175. DOI:10.7506/ spkx1002-6630-201604030.
[18] 蔡麗君, 劉燕德, 萬常斕. 臍橙糖度近紅外光譜在線檢測的建模變量優(yōu)選[J]. 西北農(nóng)林科技大學(xué)學(xué)報(自然科學(xué)版), 2012(1): 215-220. DOI:CNKI:61-1390/S.20111216.1116.002.
[19] 黃常毅, 范海濱, 劉飛, 等. 近紅外光譜結(jié)合遺傳算法快速檢測紅曲菌固態(tài)發(fā)酵生物量[J]. 分析測試學(xué)報, 2014, 33(5): 520-526. DOI:10.3969/j.issn.1004-4957.2014.05.005.
[20] STEFANOV I, BAETEN V, ABBAS O. Analysis of milk oddand branched-chain fatty acids using fourier transform (FT)-raman spectroscopy[J]. Journal of Agricultural & Food Chemistry, 2010, 58(20): 10804-10811. DOI:10.1021/jf102037g.
[21] BARBARA M, BERNHARD L, ANTONIO M D, et al. Determination of oil and water content in olive pomace using near infrared and Raman spectrometry. A comparative study[J]. Analytical & Bioanalytical Chemistry, 2004, 379(1): 35-41. DOI:10.1007/s00216-004-2493-5.
[22] 周揚(yáng), 戴曙光, 呂進(jìn), 等. 光譜預(yù)處理對近紅外光譜快速檢測黃酒酒精度的影響[J]. 光電工程, 2011, 38(4): 54-58. DOI:10.3969/ j.issn.1003-501X.2011.04.010.
[23] 蘆永軍, 曲艷玲, 馮志慶, 等. 多元散射校正技術(shù)用于近紅外定標(biāo)波長組合的優(yōu)選研究[J]. 光譜學(xué)與光譜分析, 2007, 27(1): 58-61. DOI:10.3321/j.issn:1000-0593.2007.01.016.
[24] 郝勇, 孫旭東, 潘圓媛, 等. 蒙特卡羅無信息變量消除方法用于近紅外光譜預(yù)測果品硬度和表面色澤的研究[J]. 2011, 31(5): 1225-1229. DOI:10.3964/j.issn.1000-0593(2011)05-1225-05.
[25] 李倩倩, 田曠達(dá), 李祖紅, 等. 無信息變量消除法變量篩選優(yōu)化煙草中總氮和總糖的定量模型[J]. 分析化學(xué), 2013, 41(6): 917-921. DOI:10.3724/SP.J.1096.2013.21017.
[26] 郭亮, 吉海彥. 蟻群算法在近紅外光譜定量分析中的應(yīng)用研究[J].光譜學(xué)與光譜分析, 2007(9): 1703-1705.
[27] XIE Y. Principle and realization of the simulated annealing algorithm[J]. Numerical Mathematies A Journal of Chinese Universities, 1999(3): 212-218.
[28] 石吉勇, 鄒小波, 王開亮, 等. 模擬退火算法用于食醋總酸含量近紅外光譜模型的波數(shù)點(diǎn)優(yōu)選[J]. 食品科學(xué), 2011, 32(10): 120-123.
[29] 朱鰲鑫. 遺傳算法的適應(yīng)度函數(shù)研究[J]. 系統(tǒng)工程與電子技術(shù), 1998(11): 57-62. DOI:10.3321/j.issn:1001-506X.1998.11.015.
[30] 徐承愛, 林偉, 肖紅. 一種基于加權(quán)海明距離的自適應(yīng)遺傳算法[J]. 華南師范大學(xué)學(xué)報, 2015, 47(6): 121-127. DOI:10.6054/ j.jscnun.2015.05.003.
[31] 劉英. 遺傳算法中適應(yīng)度函數(shù)的研究[J]. 蘭州工業(yè)高等??茖W(xué)校學(xué)報, 2006, 13(3): 1-4. DOI:10.3969/j.issn.1009-2269.2006.03.001.
[32] 林新, 牛智有. 綠茶茶多酚近紅外光譜定量分析模型優(yōu)化研究[J]. 食品科學(xué), 2009, 30(10): 144-148. DOI:10.3321/ j.issn:1002-6630.2009.10.028.
[33] 張小燕, 楊炳南, 劉威, 等. 馬鈴薯主要營養(yǎng)成分的近紅外光譜分析[J].食品科學(xué), 2013, 34(2): 165-169.
Fast Detection of Flour Moisture through Spectral Data Pretreatment and Genetic Algorithm-Based Wavelength Selection
SUN Xiaorong, ZHOU Zijian, LIU Cuiling, FU Xinxin, DOU Ying
(Beijing Key Laboratory of Big Data Technology for Food Safety, School of Computer and Information Engineering, Beijing Technology and Business University, Beijing 100048, China)
A near infrared (NIR) spectroscopic model for the quantitation of flour moisture was developed using partial least squares regression (PLSR). Infrared spectra of 130 randomly selected samples were used to establish PLSR models employing different spectral pretreatments combined with wavelength selection using genetic algorithm (GA). The correlation coefficient (R2), root mean square error of calibration (RMSEC) and root mean square error of prediction (RMSEP) of the optimized model were 0.977 7, 0.245 3 and 0.264, which were respectively higher, lower and lower than those of the unoptimized one. Thus tt is feasible to establish a quantitative model for estimating flour moisture by spectral data pretreatment and GA-based wavelength selection which had better accuracy and lower errors than the unoptimized one.
spectral data pretreatment; genetic algorithm (GA); near infrared spectroscopy; partial least squares (PLS); flour; moisture
10.7506/spkx1002-6630-201716041
TS231
A
1002-6630(2017)16-0256-05
孫曉榮, 周子健, 劉翠玲, 等. 基于光譜預(yù)處理結(jié)合遺傳算法優(yōu)化波長的面粉水分快速檢測[J]. 食品科學(xué), 2017, 38(16): 256-260. DOI:10.7506/spkx1002-6630-201716041. http://www.spkx.net.cn
SUN Xiaorong, ZHOU Zijian, LIU Cuiling, et al. Fast detection of flour moisture through spectral data pretreatment and genetic algorithm-based wavelength selection[J]. Food Science, 2017, 38(16): 256-260. (in Chinese with English abstract)
10.7506/spkx1002-6630-201716041. http://www.spkx.net.cn
2016-08-24
北京市教委科研計劃重點(diǎn)項(xiàng)目(KZ201310011012);北京市教委科技創(chuàng)新平臺建設(shè)項(xiàng)目(PXM_2012_014213_000023);北京市自然科學(xué)基金項(xiàng)目(4142012);北京市優(yōu)秀人才資助項(xiàng)目(2012D005003000007);北京市大學(xué)生科研訓(xùn)練計劃深化項(xiàng)目
孫曉榮(1976—),女,副教授,碩士,研究方向?yàn)橹悄軠y量技術(shù)與數(shù)據(jù)處理、系統(tǒng)建模與仿真方法、智能控制
方法。E-mail:sxrchy@sohu.com