代志凱
(浙江醫(yī)藥股份有限公司新昌制藥廠,浙江新昌 312500)
食品工業(yè)是人類賴以生存與發(fā)展的基礎,是關系國計民生的主要產業(yè)。而食品加工工藝及配方優(yōu)化是食品開發(fā)與研制中不可缺少的環(huán)節(jié),選擇合適的優(yōu)化工藝及配方對縮短試驗時間、減低生產成本、保證食品的質量具有重要的作用。
國內外用得比較成熟的工藝及配方優(yōu)化方法有正交試驗、均勻設計和響應面設計等。雖然上述方法在試驗處理時可以取得較佳點,基本可以滿足一般試驗的要求,但它們還存在一些問題,如試驗的精度不夠,選擇的試驗取值僅僅是接近最佳取值,無法精確找到最佳點,難以描述優(yōu)化指標與各因素之間的非線性關系,誤差較大[1]。隨著人工神經網絡技術的成熟和完善以及優(yōu)化設計理論與算法的進步和發(fā)展,為食品加工工藝及配方的優(yōu)化開辟了新的途徑[2-3]。但是利用神經網絡與遺傳算法優(yōu)化需要較高的理論知識和較強的計算機編程能力,限制了其在食品工業(yè)中的應用。
本文從神經網絡和遺傳算法的原理、實驗設計的選擇、數據處理和分析入手對其進行系統(tǒng)的介紹,重點介紹如何使神經網絡的非線性映射和遺傳算法的全局搜索的能力有機結合在一起應用于食品工藝及配方優(yōu)化中,以期有更多的研究工作者采用神經網絡和遺傳算法技術方便有效地優(yōu)化生產過程提高工作效率。
人工神經網絡(Artificial neural network,ANN)簡稱神經網絡,是20世紀80年代重新興起的一種模擬人腦及其活動的理論化的數學模型,由多個非常簡單的處理單元按某種分時相互聯接而形成的計算系統(tǒng),具有自組織、自適應、自學習等特點,對解決非線性問題特別有效,還有很強的輸入輸出非線性映射能力,易于學習和訓練等優(yōu)點。它基本上類似黑箱理論,只根據輸入數據和輸出數據來建立模型,網絡的統(tǒng)計信息儲存在數量巨大的加權矩陣內,可以反映十分復雜的關系。目前對于不同目的的神經網絡有60多種,其中在食品工藝優(yōu)化中應用最多的是誤差反傳網絡即BP(Back-propagation)神經網絡。典型的BP神經網絡如圖1所示。
遺傳算法(Genetic algorithm,GA)是一種借鑒生物界自然選擇和進化機制發(fā)展起來的高度并行、隨機、自適應搜索算法。它將問題域中的可能解看作是群體的一個個體或染色體,并將變量進行二進制或十進制編碼,確定個體性能的評價依據,即適應度函數,然后模擬生物進化過程,對群體反復進行類似于遺傳的操作(選擇、交叉和變異),根據預定的目標適應度函數對每個個體進行評價,依據適者生存,優(yōu)勝劣汰的進化規(guī)則,不斷得到更優(yōu)的群體,同時以全局并行方式來搜索群體中的最優(yōu)個體,最終獲得適應度最好的個體。由于其思想簡單、易于實現、遺傳算法已廣泛應用于智能控制、問題優(yōu)化及求解、模式識別和人工生命等領域,并取得了許多令人鼓舞的成就。
ANN有很強的輸入輸出非線性映射能力,特別適用于非線性、非結構化的復雜模型中。而GA又是一種有導向的全局隨機搜索方法,對于目標函數和搜索空間沒有任何限制,因此非常適合ANN模型等無明確分析函數形式的優(yōu)化問題。將神經網絡與遺傳算法有機的融合,充分利用ANN的非線性擬合能力與GA的全局搜索能力,從而增強了ANN的智能搜索和泛化能力。目前在工藝優(yōu)化領域中BP神經網絡應用的最為廣泛,也相對簡單,因此本文將主要介紹BP神經網絡和遺傳算法耦合過程。
由于食品加工過程涉及的工藝參數種類很多,不同工藝參數對產品質量的影響程度也各不相同,因此為提高模型工作效率,降低網絡模型的復雜度,必須對模型要考察的輸入工藝參數項目進行選取。ANN建模過程中參數項的選擇將遵循以下原則:
1)所選輸入參數必須是易于控制和測量的變量。
2)所選輸入參數應盡可能是相互獨立的變量。
3
)所選輸入參數對輸出目標有顯著影響。
由于BP神經網絡是一種有到導師的學習過程,因此選擇合適的樣本來訓練網絡就顯得很關鍵。隨機進行實驗的數據來訓練神經網絡,需要較多樣本,且分布不合理,效率不高。按照一定優(yōu)化設計進行實驗,得到的實驗數據來訓練ANN建模,優(yōu)于一般的隨機實驗數據所建的模型。因為這些設計的取點在空間分布均勻,更有代表性,能減少訓練樣本數,所建的ANN模型的效果也更佳[4]。目前常用正交、均勻設計和響應面設計(response surface optimization,RSM)所得到的試驗樣本一般均能滿足要求。
當樣本選取好后,以避免由于變量取值范圍的差異造成的網絡不穩(wěn)定性,所有的變量(包括輸入、輸出變量)一般均做標準化處理。
利用ANN技術構建模型時,由于受各種因素的制約,所采集到的工藝參數值與實際值總有一定的差異,因此要求所建立的神經網絡模型除具有良好的非線性映射能力之外,還必須具有較強的去除噪能力和泛化能力。因此常常將收集到的實驗數據隨機的分成兩組,即訓練組和預測組。訓練組用來訓練神經網絡,預測組檢驗網絡的泛化能力。
ANN的拓撲結構確定以后,可以通過不斷調試網絡的參數來訓練ANN。當網絡訓練好之后還要檢驗其預測能力(即網絡的泛化能力)。為了更準確的測試網絡的性能,必須從訓練集之外的數據樣本中選取測試樣本,這是因為如果測試樣本本身來自訓練集之中,由于ANN訓練精度非常高,網絡模型對每組數據都高精度地擬合了,但是擬合的好并不一定網絡的泛化能力強,有時可能會陷入過度擬合,所以必須選用訓練集以外的樣本檢驗網絡的預測能力[5]。故應該將數據樣本分成兩部分,一部分用來訓練神經網絡,另外一部分用來檢驗網絡的預測能力。當網絡的擬合和泛化能力都滿足要求后,我們就可以利用GA來尋優(yōu)了。
將上述完成訓練的ANN輸出,作為求解目標函數值。由于GA不需要明確的數學導數表達式,故可利用它計算尋優(yōu)。ANN與GA相結合的優(yōu)化方法,整個流程見圖2。
圖2ANN與GA結合的框圖Fig.2 Schema of the working principle for ANN coupling GA
在圖2中,實驗數據被分成訓練組和預測組,訓練組用來訓練BP神經網絡,然后預測組用來對訓練好的網絡進行測試,由此構建ANN模型,并以該模型的輸出為GA的目標函數,通過GA的全局尋優(yōu),找到最優(yōu)工藝或配方組合[6]。
由于ANN強大的非線性擬合能力和GA優(yōu)良的全局收索能力,ANN-GA耦合已廣泛應用于食品工業(yè)工藝優(yōu)化的各個方面。具體見表1。
例如周先漢等[16]首先在單因素試驗基礎上,確定合理的因素水平范圍,設計均勻試驗,使試驗點盡可能多的分布在可行的試驗。然后再將單因素和均勻設計的41組實驗數據分為訓練(30組)和預測(11組)兩部分,建立拓撲結果為(5-16-1)的ANN模型,訓練組用來訓練ANN,預測組則用來檢驗網絡的泛化能力。最后以訓練好的ANN作為適應度函數,利用GA全局尋優(yōu)求取最優(yōu)工藝參數。
ANN-GA的特點在于:對于ANN模型而言,通過結合GA的優(yōu)化作用,使網絡的性能在合理范圍內得到提高;對于GA而言,ANN起的是一種約束作用,通過ANN的模擬使GA的優(yōu)化范圍大致限定在的實際合理的范圍內。目前限制ANN-GA在食品工藝優(yōu)化中應用的主要原因還是由于其需要一定的算法方面的論理知識和較強的計算機編程能力。因此下面將就一個具體實例為例詳細講解ANN-GA耦合在工藝優(yōu)化中的應用,旨在更加形象直觀展示其實現過程。
3.2.1 ANN模型的建立
本文以文獻[10]為例,具體說明ANN-GA的優(yōu)化過程??疾靝H值、交聯劑濃度和時間3個因素對固定纖維素酶活的影響,首先建立3因素5水平的中心組合設計,利用中心組合設計的20組數據建立ANN模型,然后利用另外3組合數據檢驗模型的泛化能力。
表1ANN-GA在食品工藝優(yōu)化中的應用Table 1 The application of ANN-GA in optimization of food technology
由于文獻[10]中提供的細節(jié)有限,因此本文只能簡單模擬其實現過程。
ANN的建立與檢驗程序如下:
注:本文的所建立的神經網絡只是對簡單的還原,并非與文中的模型完全一致,旨在幫助讀者形象的了解神經網絡的建立過程。
文獻[10]還分別比較了ANN模型和響應面(RSM)模型的擬合與預測能力。本文利用上述程序建立的神經網絡模型也能實現文獻中的效果,結果分別見圖3和4,可見,圖3和4表明所建的ANN模型的擬合與預測能力均優(yōu)于RSM模型。
3.2.2 GA優(yōu)化
當所建的ANN模型符合要求后,就可以利用GA來優(yōu)化求取最優(yōu)解,一般ANN的擬合能力非常強,關鍵是看其泛化能力,即對訓練集之外樣本的預測能力,由圖3可知上述所建的ANN的擬合和泛化能力基本達到要求,因此下面就利用gaot遺傳算法工具箱求解其最佳工藝。
GA的性能追蹤如圖5所示。
當經過約25次遺傳操作后最優(yōu)解和總群平均解均收斂于66%左右,即當pH=4.34,交聯劑濃度為0.085%,時間4.59 h,纖維素酶的最高固定化率為65.97%,最優(yōu)值與原文的66.75%相差不大,最佳工藝參數有少許差別,有待實驗檢驗。不過這并不是本文的重點,本文旨在還原ANN-GA在工藝優(yōu)化中實現的具體步驟和過程,為其實際應用提供一個參考。上述就是ANN-GA優(yōu)化的整個源程序,讀者只需掌握一定Mablab語言便可根據需要將程序稍許改動就能靈活運用,希望通過本文能給廣大科技工作者在利用ANN-GA優(yōu)化工藝及配方時提供便利。
在生產工藝及配方優(yōu)化過程中,影響因素很難用精確模型描述,傳統(tǒng)的正交及響應面方法存在模型粗糙,精度低等缺陷[19-20]。而利用ANN高度非線性擬合和GA的全局尋優(yōu)的能力能在很大的程度上克服傳統(tǒng)方法的缺陷,為生產工藝的決策和控制提供可靠的依據。
ANN-GA優(yōu)化工藝參數的過程中,關鍵步驟在于訓練ANN,理論上訓練ANN數據點越多越好,但是在實際的試驗中往往不能達到,通常是利用盡可能少的試驗次數得到盡量多的試驗信息。因此在訓練網絡時,在有限信息中,合理的數據點分布對ANN訓練的好壞起著重要的作用。理論上來說ANN訓練所需的試驗點應該在空間分布均勻,且有足夠的代表性。利用正交設計、均勻設計和中心組合設計等得到的數據點一般都能符合上述條件,其中尤其是均勻設計得到的數據點最佳,因為在相同的實驗次數下,均勻設計能考慮更多的因素和水平,而且均勻設計試驗點的分布和代表性均優(yōu)于中心組合設計。因此,利用均勻設計的試驗點來訓練ANN,能得到更好,泛化能力更強的網絡模型[21-22]。
利用ANN-GA優(yōu)化食品工藝時,可以直接利用正交、均勻設計或者響應面設計的實驗數據建立ANN,然后利用GA直接尋優(yōu),并不需要額外單獨的設計試驗。因此將傳統(tǒng)的實驗設計方法與ANN-GA相結合,提出了一種新的數據分析和處理方法。該方法能充分挖掘和利用試驗設計數據的信息,得出的結論可以和常規(guī)的實驗設計分析方法互相驗證,可預見在以后的研究中,ANN-GA在食品工藝及配方優(yōu)化中將越來越發(fā)揮重要的作用。
:
[1]Ba■D,Boyacl I H.Modeling and optimization I:Usability of response surface methodology[J].Journal of Food Engineering,2007,78:836-845
[2]李琳,趙謀明,張黎.人工神經網絡在食品工業(yè)中的應用[J].食品研究與開發(fā),2005,26(1):13-16
[3]Huang H.Applications of Artificial Neural Networks(ANNs)in Food Science[J].Critical Reviews in Food Science and Nutrition,2007,47:113-126
[4]Cheng J,Li Q S,Xiao RC.A new artificial neural network-based response surface method for structural reliability analysis[J].Probabilistic Engineering Mechanics,2008,23:51-63
[5]He L,Xu Y Q,Zhang X H.Medium factors optimization and fermentation kinetics for phenazine-1-carboxylic acid production by Pseudomonas sp.M18G[J].Biotechnol Bioeng,2008,100(2):250-259
[6]代志凱,張翠,阮征.試驗設計與統(tǒng)計優(yōu)化及其在培養(yǎng)基優(yōu)化中的應用[J].微生物學通報,2010,37(6):894-903
[7]Bao Y,Mou M Z,Yue M J.Optimization of tyrosinase inhibition activity of ultrasonic-extracted polysaccharides from longan fruit pericarp[J].Food Chemistry,2008,110:294-300
[8]Koc1 A B,Heinemann P H,Ziegler GR.optimization of whole milk powder processing variables with neural networks and genetic algorithms[J].Food and Bioproducts Processing,2007,85(C4):336-343
[9]Izadifar M,Zolghadri M.Application of genetic algorithm for optimization of vegetable oil hydrogenation process[J].Journal of Food Engineering,2007,78:1-8
[10]Zhang Y,Xu J L,Yuan Z H,et al.Artificial neural network-genetic algorithm based optimization for the immobilization of cellulase on the smart polymer Eudragit L-100[J].Bioresource Technology,2010,101:3153-3158
[11]Tushar G,Mainak C,Anshu S.Comparative Study of Response Surface Methodology,Artificial Neural Network and Genetic Algorithms for Optimization of Soybean Hydration[J].Food Technol.Biotechnol,2010,48(1):11-18
[12]Zhu Y B,Zhang J H,SHI Z P.Optimization of Operating Conditions in Rice Heat Blast Process for Chinese Rice Wine Production by Combinational Utilization of Neural Network and Genetic Algorithms[J].journal of the institute of brewing,2004,110(2):117-123
[13]唐明,藏占鋒,邵偉.酵母抽提物干燥工藝節(jié)能優(yōu)化研究[J].現代食品科技,2010,26(2):167-169
[14]趙武奇,仇農學,王宏.蘋果渣多酚提取工藝的神經網絡建模與遺傳算法優(yōu)化[J].食品科學,2007,28(12):138-142
[15]曹晞,吳毅強,李積華.人工神經網絡-遺傳算法優(yōu)化酶法提取綠豆渣水溶性纖維素工藝研究[J].食品科技,2006,10:296-299
[16]周先漢,阮少鈞,成剛.基于遺傳算法與神經網絡的微波浸提過程優(yōu)化[J].食品科學,2007,28(10):180-183
[17]肖連冬,許彬,臧晉,等.基于BP神經網絡和遺傳算法研究啤酒糟不溶性膳食纖維的酶法脫脂工藝[J].食品科學,2010,31(14):18-21
[18]趙武奇,殷涌光,仇農學.基于神經網絡和遺傳算法的紅景天苷緩釋微囊制備過程建模與優(yōu)化[J].西北農林科技大學學報(自然科學版),2006,34(11):106-110
[19]Nagata Y,Chu K H.Optimization of a fermentation medium using neural networks and genetic algorithms[J].Biotechnol Lett,2003,25(1):1837-1842
[20]Wang J L,Wan W.Optimization of fermentative hydrogen production process using genetic algorithm based on neural network and response surface methodology[J].Int J Hydrogen Energy,2009,34:255-261
[21]Lin Z,Yi Z L,Jian H J,et al.Uniform design applied to nonlinear multivariate calibration by ANN[J].Analytica Chimica Acta,1998,370:65-77
[22]Cheng J,Li Q S.Reliability analysis of structures using artificial neural network based genetic algorithms[J].Comput Methods Appl Mech Engrg,2008,197:3742-3750