姜同強,任 葉
(北京工商大學,計算機與信息工程學院,北京 100048)
GA-BP神經(jīng)網(wǎng)絡及其在液體乳安全評價中的應用
姜同強,任 葉*
(北京工商大學,計算機與信息工程學院,北京 100048)
利用遺傳算法(Genetic Algorithm,GA)優(yōu)化BP(Back Propagation,BP)神經(jīng)網(wǎng)絡的初始權值、閾值,以期加快網(wǎng)絡收斂,提高預測精度。以乳制品中的液體乳為實驗材料,建立安全評價指標體系;將優(yōu)化后的GA-BP神經(jīng)網(wǎng)絡作為評價模型,對液體乳的日常檢測數(shù)據(jù)進行擬合;以測試數(shù)據(jù)作為驗證,檢測模型的收斂速度和擬合度。結果表明GA-BP較BP神經(jīng)網(wǎng)絡來講更穩(wěn)定,能較快收斂,且仿真誤差較小;在隱層節(jié)點數(shù)為9時,GA-BP神經(jīng)網(wǎng)絡對液體乳的擬合效果最好,預測精度較高,是一種可行的液體乳安全狀況評價方法。
遺傳算法,BP神經(jīng)網(wǎng)絡,液體乳,食品安全評價
食品安全問題的發(fā)生,不僅損害了消費者的健康,還給社會經(jīng)濟造成了極大的損失,為保障人們吃上無害食品,對食品風險進行安全評價就顯得尤為重要。食品安全評價主要包括指標體系和評價模型兩個部分。
對不同的研究對象,指標體系的構建差異甚大。已有研究成果大多基于危害分析與關鍵控制點[1](Hazard Analysis Critical Control Point,HACCP),對食品生產(chǎn)、加工、銷售過程中可能產(chǎn)生危害的關鍵點進行分析,以構建安全評價指標體系,如以食品供應鏈為研究主線[2-3]。
評價模型的選取也直接影響評價結果的高效性和準確性。常用評價模型主要有2類:定性分析和定量分析。定性分析主要借助相關理論分析得出結論,如德爾菲法[4]、風險矩陣[5]、案例推理[6]等。定量分析主要采用方法、模型對食品的檢測或監(jiān)測數(shù)據(jù)進行分析,實現(xiàn)對食品安全的評價,如主成分分析[7]、因子分析[8]、時間序列法[9]、貝葉斯網(wǎng)絡[10-11]、神經(jīng)網(wǎng)絡[12-13]等。
針對以上內(nèi)容,國內(nèi)外研究學者已經(jīng)做了大量優(yōu)化指標體系[14-15]、改進評價方法[16-17]的工作來完善。神經(jīng)網(wǎng)絡是食品安全評價研究中的常用工具[18-19]。其中,BP神經(jīng)網(wǎng)絡是非線性不確定性數(shù)學模型[20],它將誤差作為導師信號,反向調(diào)整網(wǎng)絡權值、閾值,來實現(xiàn)數(shù)據(jù)的擬合,在乳制品溯源[21],品質(zhì)分類識別[22]等領域已經(jīng)有著廣泛的應用。
表1 液體乳安全檢測原始數(shù)據(jù)
然而,在實際使用中BP神經(jīng)網(wǎng)絡也存在著局限[20]:收斂速度慢;局部極小點。遺傳算法具有較快的收斂能力和較強的學習能力[23]。因此,可以利用遺傳算法(Genetic Algorithm,GA)擅長搜索全局最優(yōu)的特點,來彌補BP神經(jīng)網(wǎng)絡的缺陷[24]。
為彌補BP神經(jīng)網(wǎng)絡局部最優(yōu)、收斂速度慢的缺陷,本文利用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的初始權值、閾值,并以液體乳為材料進行實驗驗證。一方面,要利用GA-BP神經(jīng)網(wǎng)絡模型對液體乳進行安全評價,驗證模型有效性;另一方面,要根據(jù)實驗結果比較GA-BP神經(jīng)網(wǎng)絡與BP神經(jīng)網(wǎng)絡的網(wǎng)絡性能,驗證GA-BP神經(jīng)網(wǎng)絡的優(yōu)良性。
1.1 實驗材料
本文使用的實驗數(shù)據(jù)來自食藥監(jiān)局的日常檢測,偏重成品檢測。先對原始數(shù)據(jù)進行篩選,獲得液體乳檢測數(shù)據(jù)。同時,簡化屬性,去除次要因素,如報送單位、生產(chǎn)企業(yè)等信息。簡化后的數(shù)據(jù)如表1所示。
對簡化數(shù)據(jù)進行預處理。
對數(shù)據(jù)進行分析,去除次要影響因素,挑選出11個檢測項作為評價指標。評價指標分為5類:品質(zhì)指標、金屬污染物、食品添加劑、微生物與致病菌、非法添加物危害。
檢測結果包含定量值和定性值。對定量值,以標準界限值為參考依據(jù)進行處理。對定性值,先將其定量化,如“未檢出”量化為檢測值0,再按定量值進行處理。其中,正指標和逆指標的處理方法相反。
本文將挑選200組數(shù)據(jù)作為實驗的訓練集和測試集。每組樣本所對應的安全狀況將參考行業(yè)專家的意見,采用專家問卷方式獲得。此外,還需要對這200組數(shù)據(jù)進行歸一化。
1.2 實驗方法
1.2.1 安全評價指標體系的建立 根據(jù)預處理結果,參考國家標準[25]、企業(yè)標準,結合文獻資料[21],構建液體乳的安全評價指標體系,如表2所示。
對于液體乳安全狀況,本文將借鑒李克特量表[2]的思想構建液體乳安全狀況等級,將安全狀況進行量化。具體劃分見表3。
1.2.2 BP神經(jīng)網(wǎng)絡工作原理 BP神經(jīng)網(wǎng)絡是一種基于誤差反傳的多層感知器,以圖1所示的單隱層網(wǎng)絡的應用最為普遍。單隱層感知器包括了輸入層、隱層和輸出層。
表2 液體乳安全評價指標體系
表3 液體乳安全狀況等級劃分
圖1 三層BP神經(jīng)網(wǎng)絡結構[20]Fig.1 Three-layer BP neural network[20]
表4 GA-BP神經(jīng)網(wǎng)絡和BP神經(jīng)網(wǎng)絡性能比較
三層傳感器中,輸入向量為X=(x1,x2,…,xi,…,xn)T,隱層輸出向量為Y=(y1,y2,…,yj,…,ym)T,輸出層輸出向量為O=(o1,o2,…,ok,…,ol)T,期望輸出向量為d=(d1,d2,…,dk,…,dl)T,輸入層到隱層之間的權值矩陣為V=(V1,V2,…,Vj,…,Vm),隱層到輸出層之間的權值矩陣為W=(W1,W2,…,Wk,…,Wl)。隱含層和輸出層的激活函數(shù)分別為f1、f2,設b1、b2為隱層、輸出層神經(jīng)元的閾值,其中V,W,b1,b2的取值范圍為(-1,1)。
當網(wǎng)絡輸出與期望輸出不等時,存在輸出誤差E,定義如下:
k=1,2,…,lj=1,2,…,m
式(1)
由式(1)可知,網(wǎng)絡誤差E是包含權值、閾值(V,W,b1,b2)的函數(shù),當輸入向量X一定時,調(diào)整兩者可以改變誤差E的大小,而網(wǎng)絡局限也與網(wǎng)絡初始狀態(tài)(初始權值、閾值)有關,為此采用遺傳算法產(chǎn)生其初始狀態(tài),實現(xiàn)對BP神經(jīng)網(wǎng)絡的優(yōu)化。
1.2.3 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡 利用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的初始權值、閾值的核心內(nèi)容主要為:
確定編碼長度。因為是利用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的初始狀態(tài),所以種群中的每個個體都應該包含網(wǎng)絡權值、閾值,那么編碼串就應該由四部分組成[24]:輸入層到隱層權值(W)、隱層到輸出層權值(V)、隱層閾值(b1)、輸出層閾值(b2)。根據(jù)BP神經(jīng)網(wǎng)絡的網(wǎng)絡結構,編碼的長度為:i×m+m×l+m+l,對應權值個數(shù)和閾值個數(shù)。
確定適應度函數(shù)。BP神經(jīng)網(wǎng)絡主要以其均方誤差作為評判依據(jù),誤差越小,網(wǎng)絡越優(yōu)良。因此,本文將均方誤差的倒數(shù)作為適應度,若誤差越小,則適應度越大。
確定網(wǎng)絡初始狀態(tài)。將遺傳算法獲得的最優(yōu)權值、閾值作為BP神經(jīng)網(wǎng)絡的初始狀態(tài)。
以MATLAB軟件為實驗工具,將樣本集中180組樣本作為訓練集,剩下的20組樣本作為測試集進行實驗。本實驗將在經(jīng)驗公式范圍內(nèi),對BP神經(jīng)網(wǎng)絡和GA-BP神經(jīng)網(wǎng)絡隨機運行50次,選取均方誤差MSE、迭代步數(shù)(收斂速度)作為網(wǎng)絡性能評價指標。
2.1 GA-BP神經(jīng)網(wǎng)絡和BP神經(jīng)網(wǎng)絡性能比較
對表4中的實驗結果進行分析,隨著隱含層神經(jīng)元個數(shù)的增加,兩種網(wǎng)絡的迭代次數(shù)、訓練集的均方誤差均逐漸降低,而測試集的均方誤差變化較復雜,波動較多,在隱層神經(jīng)元個數(shù)為8(BP)和9(GA-BP)時取得最低值。因而,就本次實驗的數(shù)據(jù)來講,GA-BP和BP神經(jīng)網(wǎng)絡的最佳隱層節(jié)點數(shù)分別為9和8,此時兩種網(wǎng)絡能夠更好地擬合實驗數(shù)據(jù)。
由表4中的實驗結果可見,在訓練過程中,GA-BP神經(jīng)網(wǎng)絡較BP神經(jīng)網(wǎng)絡而言迭代次數(shù)更少,收斂速度更快,說明利用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的初始權值、閾值,確實能起到加快網(wǎng)絡收斂的效果。但隨著隱層神經(jīng)元個數(shù)的增加,兩種網(wǎng)絡的收斂速度都有較大提高,利用遺傳算法優(yōu)化網(wǎng)絡在加快網(wǎng)絡收斂上的優(yōu)勢就不夠明顯。就實驗誤差來看,不管是訓練還是測試過程,GA-BP比BP神經(jīng)網(wǎng)絡對數(shù)據(jù)的擬合更好,其均方誤差更小。因而,利用遺傳算法能夠一定程度優(yōu)化BP神經(jīng)網(wǎng)絡的局部最優(yōu)問題。值得一提的是,BP神經(jīng)網(wǎng)絡進行數(shù)據(jù)擬合時,迭代次數(shù)和實驗誤差都波動較大,表現(xiàn)時好時壞,而GA-BP神經(jīng)網(wǎng)絡的實驗結果在小范圍內(nèi)進行波動,相對來講更穩(wěn)定,那么就有更大的概率能夠?qū)?shù)據(jù)實現(xiàn)較好的擬合。
2.2 GA-BP神經(jīng)網(wǎng)絡的液體乳安全評價
就實驗結果來看,利用GA-BP神經(jīng)網(wǎng)絡進行液體乳安全評價時,網(wǎng)絡的最佳隱節(jié)點數(shù)為9。因而,針對隱節(jié)點數(shù)為9的GA-BP神經(jīng)網(wǎng)絡實驗,列舉某一次實驗結果進行分析。
將遺傳算法優(yōu)化得到的初始權值、閾值賦給BP神經(jīng)網(wǎng)絡,用實驗樣本集進行訓練,對數(shù)據(jù)進行擬合,預測非線性函數(shù)輸出,其訓練集與測試集的仿真誤差見圖2。
圖2 基于GA-BP神經(jīng)網(wǎng)絡的 液體乳安全狀況評價仿真結果Fig.2 Simulation results of dairy products safety evaluation based on GA-BP neural network注:a為訓練集,b為測試集。
從圖2可見,訓練集使用180組數(shù)據(jù),測試集為剩余的20組。利用訓練好的網(wǎng)絡對訓練集和測試集進行仿真,得到的結果與實際值間的均方誤差為0.0000897、0.0012。就網(wǎng)絡誤差來看,仿真結果均方誤差較小,說明GA-BP神經(jīng)網(wǎng)絡能夠?qū)σ后w乳的檢測數(shù)據(jù)進行較好擬合,對液體乳安全評價的非線性仿真效果良好。訓練好的GA-BP神經(jīng)網(wǎng)絡模型亦可以用于后續(xù)的液體乳安全狀況評價。
本文以液體乳為實驗材料,采用GA-BP神經(jīng)網(wǎng)絡評價模型對檢測數(shù)據(jù)進行擬合,實現(xiàn)對液體乳安全狀況的可靠性評價和GA-BP模型的有效性驗證。研究結果表明,利用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的初始權值、閾值能加快網(wǎng)絡收斂,有效擬合數(shù)據(jù),優(yōu)化了BP神經(jīng)網(wǎng)絡的局部最優(yōu)問題。同時,GA-BP較BP神經(jīng)網(wǎng)絡來講更穩(wěn)定,有更大的概率達到全局最優(yōu)。經(jīng)實驗驗證,GA-BP神經(jīng)網(wǎng)絡能夠在系統(tǒng)內(nèi)部規(guī)律未知的情況下,對液體乳安全狀況進行可靠評價,且在隱層節(jié)點數(shù)為9時,仿真結果誤差最小,是一種可行的食品安全分析途徑。
[1]Liao J Y. Research of food quality safety control system based on HACCP[J]. Journal of Anhui Agricultural Sciences,2012,23:11843-11845.
[2]蔡強,王君君,李海生,等.基于神經(jīng)網(wǎng)絡的食品安全評價 模型構建研究[J].食品科學技術學報,2014,01:69-77.
[3]雷勛平,Robin Qiu,吳楊.基于供應鏈和可拓決策的食品安全預警模型及其應用[J].中國安全科學學報,2011,11:136-143.
[4]周萍萍,張磊,焦陽,等.應用德爾菲法建立進口食品中化學性危害物質(zhì)風險分級指標體系[J].食品安全質(zhì)量檢測學報,2016,05:2114-2119.
[5]Liu Q J,Chen T,Zhang J H,et al. Risk matrix-based risk monitoring model of food safety[J]. Food Science,2010. 05:86-90.
[6]Gong Y X,Wang D H. View on the food safety emergencies risk pre-warning system based on case-based reasoning[J]. Food Science & Technology,2012,07:311-315.
[7]周乃元,潘家榮,汪明.食品安全綜合評估數(shù)學模型的研究[J].中國食品衛(wèi)生雜志,2009,03:198-203.
[8]王媛媛,洪思慧,房曉倩,等.基于因子分析的食品監(jiān)管風險評價模型研究[J].食品工業(yè)科技,2016,13:266-270.
[9]董笑,白寶光.基于時間序列分解法對原料乳質(zhì)量安全預測的探究[J].食品工業(yè),2016,05:188-191.
[10]張麗,滕飛,王鵬.基于貝葉斯網(wǎng)絡的食品供應鏈風險評價研究[J].食品研究與開發(fā),2014,18:179-182.
[11]Zhang F Y,Dong Q L,Huang S L,et al. Modeling the qualifying criteria of pork based on Bayesian network[J]. Science & Technology of Food Industry,2012,10:52-54,93.
[12]Wang J,Tang Z,Jin X. Food Safety Evaluation System Construction Based on Artificial Neural Network[J]. Advance Journal of Food Science and Technology,2015,02:98-100.
[13]章德賓,徐家鵬,許建軍,等. 基于監(jiān)測數(shù)據(jù)和BP神經(jīng)網(wǎng)絡的食品安全預警模型[J]. 農(nóng)業(yè)工程學報,2010,01:221-226.
[14]唐曉純,茍變麗.食品安全預警體系框架構建研究[J].食品科學,2005,12:246-250.
[15]武力. “從農(nóng)田到餐桌”的食品安全風險評價研究[J].食品工業(yè)科技,2010,09:304-306.
[16]徐超,杜樹新,羅祎,等. 基于集對分析理論的進出口食品安全風險評價方法[J]. 科技通報,2013,03:208-211,230.
[17]劉於勛.食品安全綜合評價指標體系的層次與灰色分析[J].河南工業(yè)大學學報(自然科學版),2007,05:53-57.
[18]金劍,齊思源,彭亞拉.神經(jīng)網(wǎng)絡法在食品安全預警中的應用[J]. 食品科技,2011,11:306-309.
[19]王輝,王斌,徐靜,等.基于BP神經(jīng)網(wǎng)絡的乳制品質(zhì)量預測研究[J].農(nóng)機化研究,2013,03:218-220.
[20]韓力群.人工神經(jīng)網(wǎng)絡理論、設計及應用[M].北京:化學工業(yè)出版社,2007:47-62.
[21]吳聰.乳制品供應鏈的溯源體系與預警模型研究[D].廣州:華南理工大學,2014.
[22]仲偉峰,馬麗霞,何小溪.PCA和改進BP神經(jīng)網(wǎng)絡的大米外觀品質(zhì)識別[J].哈爾濱理工大學學報,2015,04:76-81.
[23]雷英杰,等.MATLAB遺傳算法工具箱及應用[M].西安:西安電子科技大學出版社,2005:146-207.
[24]劉春艷,凌建春,寇林元,等.GA-BP神經(jīng)網(wǎng)絡與BP神經(jīng)網(wǎng)絡性能比較[J].中國衛(wèi)生統(tǒng)計,2013,02:173-176.
[25]國家國家食品安全風險評估中心. 食品安全國家標準匯編[M].北京:中國人口出版社,2014:1-563.
GA-BP neural network and its application in safety evaluation of liquid milk
JIANG Tong-qiang,REN Ye*
(School of computer and information engineering,Beijing Technology and Business University,Beijing,100048)
The initial weights and thresholds of back propagation(BP)neural network were optimized by genetic algorithm(GA)to accelerate the network convergence and improve the prediction precision. The liquid milk in dairy products was used as the experimental material to establish the safety evaluation index system. The GA-BP neural network was used as the evaluation model to fit the daily data of liquid milk. The convergence rate and the fitting degree of the model were verified by the test data. The results showed that GA-BP was more stable than BP neural network and could converge quickly,and the simulation error of GA-BP neural network was smaller. When the number of nodes was 9,GA-BP neural network had the best fitting effect to liquid milk,and the prediction precision was high. So GA-BP neural network was a feasible method to evaluate the safety of liquid milk.
genetic algorithm;BP neural network;liquid milk products;evaluation of food safety
2016-10-24
姜同強(1966-),男,碩士,教授,研究方向:綜合評價技術,E-mail:jiangtq@th.btbu.edu.cn。
*通訊作者:任葉(1993-),女,碩士研究生,研究方向:食品安全綜合評價,E-mail:r1104040125@163.com。
國家科技支撐計劃“電子溯源的食品安全風險評估關鍵技術研究與應用”(2015BAK36B04);北京市科技計劃項目(Z161100001616004);2016年研究生科研能力提升計劃項目資助。
TS201.6
A
1002-0306(2017)05-0289-04
10.13386/j.issn1002-0306.2017.05.046