蔡 強, 王君君, 李海生, 毛典輝
(北京工商大學計算機與信息工程學院,北京 100048)
基于神經網絡的食品安全評價模型構建研究
蔡 強, 王君君, 李海生, 毛典輝
(北京工商大學計算機與信息工程學院,北京 100048)
食品安全評價模型的準確度高低,直接影響食品安全狀況評價、預測的準確率.結合危害分析與關鍵控制點的(HACCP)食品安全管理體系理論,從食品供應鏈的角度出發(fā),建立食品安全評價指標體系;使用層次分析法(AHP)改進逆向傳播(BP)神經網絡算法中隨機初始化計算權重的方法,訓練樣本數據,并以測試數據作為驗證,檢測模型的誤差收斂速度和擬合度.結果表明,這種BP神經網絡結合AHP方法構建的模型具有實用、精度高、快速、客觀等優(yōu)點,可用于生產、加工、銷售等流通環(huán)節(jié)食品安全評價、區(qū)域食品安全評價以及種類食品安全評價.
食品安全;神經網絡;權重計算;評價模型
近年來,食品安全事件頻發(fā),食品安全狀況成為人們最關心的話題.食品安全評價體系作為食品安全研究的重要內容,國內外研究者從食品安全管理技術角度、地域性食品安全評價、消費者行為食品安全評價等方面已經做了大量工作[1-2].評價方法主要依據食品安全分類、德爾菲、模糊聚類等技術,但是這些評價方法難以客觀、全面、統(tǒng)一估價食品安全狀況.本文將基于神經網絡,結合危害分析與關鍵控制點(hazard analysis critical control point,HACCP)的食品安全管理體系理論,以食品供應鏈為主線,貫穿食品質量安全,最終建立食品安全評價體系指標及模型,旨在準確測出食品安全狀況,為食品安全預測預警提供有效依據.食品安全風險因素,從食品供應鏈角度劃分,主要包含生產、加工、貯藏、流通、消費等各個環(huán)節(jié)[3],這些環(huán)節(jié)決定了評價指標的設計主線.
食品安全包括食品數量安全、質量安全、可持續(xù)安全,同時食品質量安全、可持續(xù)安全是食品安全的最終目標.如果沒有質量安全,數量安全亦是無效,可持續(xù)安全更無法保障[4].并且由于自然、經濟、社會等各種復雜因素互相作用,致使食品安全呈動態(tài)的、不確定的變化,風險因素和風險程度不盡相同.食品安全內容和目標的差異化,導致食品安全評價指標建立的難度增加[5],食品安全影響因素呈定量、定性交錯變化.
1.1 食品安全評價方法
從食品安全評價涉及的領域角度分析[6],食品安全評價方法主要分為模型分析法、指數分析法、危害分析法以及檢測分析法幾類.
1)模型分析法.主要運用統(tǒng)計、計量等方法建立數學模型,模擬數據并做出評價.如神經網絡、貝葉斯網絡、模糊聚類等,根據模型相關算法,調整函數以及參數,其特點是將數據轉化為概率發(fā)生大小的問題.
2)指數分析法.確定影響食品安全狀況的影響因子,篩選出能夠評價食品安全狀況的指標,建立綜合評價指標模型,對所需問題評價.關鍵步驟是合理分析指標并進行分類,建立指數同時確定可信權數.但是建立模型的指數方法大多為線性,對復雜問題的不確定性難以解釋,具有片面性.
3)危害分析法.主要運用HACCP控制理論對食品生產全過程進行危害點分析,查找關鍵控制點,降低危害因素影響度,并采取應急措施.HACCP最早是在20世紀50年代末,由美國航空航天局與美國皮爾斯伯利公司建立,因為此體系簡便、實用、科學,已經被世界各國廣泛采用,關鍵之處是識別食品危害點,因此HACCP必須建立在食品安全項目的基礎之上運行[6].
1.2 食品安全評價指標體系建立
食品安全綜合評價指標具有明顯層次結構,借鑒國內外食品安全研究現狀、食品安全與食品供應鏈關系的相關文獻[3,7-8],確定從食品供應鏈的角度建立評價指標體系,如表1.目標層E代表區(qū)域型食品安全狀況、環(huán)節(jié)食品安全狀況或者種類食品安全的水平狀況,作為衡量食品安全的綜合水平指標;準則層/一級評價指標Ek,使用HACCP控制理論,從原產地到餐桌的基于供應鏈的關鍵控制點排序建立[9];基礎指標Eij依據隸屬于上層指標的環(huán)境、化學污染、農藥殘留、細菌殘留、重金屬殘留以及監(jiān)測部門安全管理水平等[4],最能直接表現食品安全問題的影響因子建立.
表1 食品安全評價指標體系Tab.1 Evaluation index of food safety
在訓練神經網絡,輸入變量之前,網絡權重闌值必須初始化,當使用MATLAB神經網絡工具nntool工具箱中newff函數建立網絡net時,網絡自動初始化權值和闌值.初始化過程中,通過設置net.initFcn來初始化方法參數.這里我們對初始化過程加以改進,摒棄了Nguyen-Widrow算法隨機初始化權值和闌值的不客觀、不準確性以及因相關性較大易導致網絡學習中互相干擾的不足,采用指標權重確定方法[10],層次分析法(analytic hierarchy process,AHP)[11]計算食品安全評價指標權重.
2.1 成對比較矩陣建立
AHP是一種定量與定性相結合的、系統(tǒng)化的、層次化的分析方法,由Saaty[12]于20世紀70年代初期提出.此方法通過對系統(tǒng)多個因素的分析,劃出各影響因子之間的層次排序;再根據層內各因子的相對重要性程度,量化表示;然后建立數學模型,計算出每層各個因素的相對重要性權值.對于權值計算,我們首先要建立成對比較矩陣,確定下層各元素指標相對上層指標的重要性程度,應用權重量化指標的比重.現假設有n(n>0)個指標元素,且用E= (eij)n×n表示成對比較矩陣,使用eij描述第i個元素與第j個元素相對上一層父親元素的重要性,構造矩陣E.
式(1)中,1≤eij≤9,eii=1,eji=1/eij,根據標度尺[13],計算出矩陣中各元素相對上層元素的重要程度向量,即完成對權重計算,這里采用根式計算方法:
2.2 一致性檢驗及權重計算
使用AHP方法計算出等價矩陣權重W之后;根據數理統(tǒng)計理論,對成對可比較矩陣進行一致性檢驗,以確定AHP方法設計的合理性,一致性檢驗指標PCI
式(3)中λmax為矩陣最大特征值的近似值,N為評價指標個數,計算出PCI值,然后使用
進行一致性檢驗(其中,ε為滿足一致性要求所允許的最大值,一般根據具體情況來確定,k為迭代次數),若滿足檢驗要求,計算停止,w(k)即為所求權重;否則根據修正判斷系數,直到權重計算完成,停止.
經過統(tǒng)計分析,觀察指標對應數據樣本值發(fā)現,食品安全在不同時期存在不同問題.各種指標受到環(huán)境、經濟、農業(yè)狀況以及社會等各種不確定因素影響.指標值的變化映射了不同時期、不同地點食品安全的綜合狀況.此外食品安全的評價評估能為食品安全管理部門提供決策性的依據,具有重要意義.目前國內外對于安全評價的研究,在統(tǒng)計方法運用方面主要有單變量分析法,多元判別分析法,Logistic回歸模型以及類神經網絡模型.對于模型的設計,我們應用當前比較流行的計算軟件MATLAB中的神經網絡工具箱作為實現平臺,建立基于BP神經網絡的食品安全評價模型,并測試驗證準確率.
3.1 網絡輸入輸出確定
BP網絡作為有監(jiān)督學習算法,訓練過程首要步驟即是確定輸入向量和期望響應.食品安全評價模型輸入向量即食品安全評價指標,期望響應即食品安全狀況評價預測結果;必要條件即樣本量充足,樣本數據來自歷年中國統(tǒng)計年鑒(2007—2009),以及食品監(jiān)督檢驗部門日常檢測數據,具有一定可靠性和權威性.訓練過程通過提供的輸入向量和期望響應,對網絡的權值和偏差進行調整,最終實現期望效果.在訓練樣本與測試樣本選取的時候,要避免過擬合.過擬合是指當模型輸入分別為訓練樣本和測試樣本時,準確率不一致甚至偏差嚴重的現象.例如,在訓練樣本作為輸入,模型取得較高的準確率時,會出現測試樣本作為輸入,準確率較低的現象[14].為解決此問題本文在考慮樣本模式平衡的前提下,將樣本數據采用隨機分配法按比例分為訓練、測試樣本.其中,訓練樣本的輸入向量和目標期望響應值,作為模型構建中的訓練部分;測試的樣本輸入向量和目標期望響應,作為模型的評價與驗證.
3.2 網絡結構設計
BP神經網絡結構通常具有數據輸入層,一個或多個sigmoid隱層以及輸出層.結構的核心設計部分是在訓練過程中網絡權值和偏差調整時,梯度向量的選擇以及梯度方向的選擇[15].標準BP算法是一種簡單的快速下降靜態(tài)尋優(yōu)算法.梯度下降法在調整權值修正第任意K次權值迭代誤差時,僅僅按照當前時刻的負梯度方向進行調整,并未考慮已運算各步驟中的梯度方向,因此迭代過程受新樣本影響過大,通常導致訓練過程的調整方向不均衡震蕩、收斂速度慢以及預測精度較低等問題[16].為了解決此問題,我們采用BP神經網絡訓練,動量梯度下降法作為基本訓練算法,并改進初始化網絡中權重參數選擇方法,建立改進型的BP神經網絡評價預測模型.
經過對單隱層與雙隱層的神經網絡評價模型的評價結果的對比發(fā)現雙隱層訓練次數與誤差相對較低(見表2).因此設計采用一個輸入層、兩個隱含層和一個輸出層的3個神經元層的BP神經網絡結構.
表2 網絡結構比較Tab.2 Network structure comparison
1)輸入層節(jié)點.輸入層即樣本數據導入,作為網絡結構的輸入變量,相當于一個待分析的樣本數據庫.節(jié)點個數根據影響因子確定.對于食品安全狀況等級判斷有顯著影響的指標如表1,共有21個,決定了輸入節(jié)點的輸入變量共21個,并依據產品類型浮動調整輸入變量個數.
2)輸出層節(jié)點.輸出層即食品安全狀況等級的數據表示,本論文參照五點尺度量評定法(five-point rating scale),采取“利克特量表”(likert scale)[3],構建食品安全狀況等級的數據表.具體情況見食品安全等級劃分表(表3).
表3 食品安全等級劃分Tab.3 Food safety hierarchy
3)傳遞函數.隱含層的傳遞函數為log-sigmoid型函數logsig,因為網絡輸出的值域限制在[0,1],故輸出層也采用S型的sigmoid函數,輸出[0,1]間的連續(xù)值,輸出值按照表3歸類判斷.輸出值在[0,0.2],說明食品安全狀況良好;在[0.2,0.5],說明食品安全受到影響;在[0.5,1],說明食品安全受到威脅.
BP神經網絡又稱為誤差反向傳播(back propagation)神經網絡,誤差與信號反向傳播.誤差從后向傳播,反向傳播過程中,逐層修改權值和偏差.反向傳播和誤差調整過程依次為隱層與輸出層之間、隱層與隱層之間以及輸入層與隱層之間的權值調整3個步驟.其中BP迭代計算公式可以表示為:
式(5)中,Xk,X(k+1)分別表示當次以及下次迭代產生的權值與偏差,ak表示當前誤差函數梯度,gk表示學習效率.
對公式(5)衍生得到動量梯度下降算法權值迭代公式:
式(6)中,Dk,D(k-1)分別表示k和k-1時刻的負梯度,η表示學習步長,α表示負梯度的權重參數.
因為,BP算法中權值調整量和輸出的關系與期望響應的誤差能量對權值的偏導,大小成正比關系,符號反向.因此通過計算權值偏導,將傳遞函數,局部梯度值代入公式(6)即可計算出權值調整量和輸出的關系,分別迭代實現隱層與輸出層之間、隱層與隱層之間以及輸入層與隱層之間的權值調整,當達到預期誤差水準,誤差曲線平穩(wěn)收斂時停止,迭代結束.
依據食品安全綜合評價指標的建立以及評價模型的設計,對原始樣本數據報表進行量化處理,計算指標值以及確定指標權重.并對數據源做簡單處理,略去被檢驗單位、廠家等復合屬性以及形狀、色澤等與食品安全關系并不密切的屬性,部分樣本數據如表4.
表4 食品安全監(jiān)測數據Tab.4 Food safety inspection data report
表4中日常檢測數據按指標類型劃分,主要分為重金屬污染、農藥殘留、化學殘留、微生物污染等危害食品安全的因素,以及標簽完善度檢驗、形狀、色澤等感官檢驗.因此按檢驗項目類型從影響食品安全的因素對樣本集簡化,結合年鑒統(tǒng)計數據歸類成指標數據,并依據2.1小節(jié)中層次分析法理論計算指標權重,首先確定各個一級評價指標E1,E2,E3,E4,E5,E6對目標層綜合評價指標E的重要程度關系,根據式(1)建立一級指標的6-6成對比較矩陣,元素值用eij描述,表示指標Ei與Ej相對上層指標的重要性,例如矩陣中指標E1和E2,E1和E3與E4和E5的比較關系:e12=E1∶E2=1/2,e13=E1∶E3= 3,e45=E4∶E5=2/6.同理分別計算出矩陣中主對角線上側各個元素值eij,對于主對角線下側部分利用eij=1/eji計算得出,主對角線元素的物理意義指自身相對自身的重要程度,因此確定為1.矩陣元素確定后,根據公式(2)分別計算對應權值,并得出一級評價指標層 Ei的權向量,權向量用 W(1)表示,表示一級指標層Ei相對目標層E的權重,r=1,2,…6.同理得出二級評價指標層相對一級評價指標層的權重,例如第一環(huán)節(jié),原產地環(huán)境指數的權重,表示第一環(huán)節(jié)中二級指標相對一級指標的權重,m=1,2,3.同理得出后續(xù)環(huán)節(jié)權重值,然后按照一致性檢驗章節(jié)公式(3)和(4)進行一致性檢驗,獲得食品安全評價指標體系權值.按照以上方法計算得出指標體系權重值的結果,如表5.
從表5可以看出,食品安全供應鏈上,生產、加工、銷售、貯藏環(huán)節(jié)中的農藥殘留、重金屬殘留、微生物污染、化學污染等對食品安全影響占較大比重,并且很大程度上受環(huán)境衛(wèi)生的影響,不同維度,構成不同的指標影響度.我們對基于AHP的權重計算方法與Nguyen-Widrow算法對網絡權值初始化對比發(fā)現,如圖1,兩次構建網絡時,初始化指標輸入層的權重分布圖,利用Nguyen-Widrow算法計算所得權值,雖基本覆蓋了整個樣本輸入空間,但權值分布比較分散,并沒有呈現各指標的重要性程度關系.而采用的AHP權重計算方法如圖2,利用定量與定性結合的層次分析優(yōu)勢,比較客觀地,根據各環(huán)節(jié)指標的影響度大小得出相應權值,權值圍繞上層指標規(guī)則排列.網絡初始化后,對神經網絡模型進行訓練,用sim()函數仿真,最后驗證測試評價結果,分析訓練結果.
表5 食品安全評價指標權重值Tab.5 Weight of food safety evaluation index
圖1 Nguyen-Widrow初始化網絡的權重分布Fig.1 Initializing weights of network distribution by Nguyem-Widrow algorithm
圖2 AHP初始化網絡的權重分布Fig.2 Initializing weights of network distribution by AHP
圖3和圖4中使用MATLAB 7.0神經網絡工具箱,動量梯度下降反向傳播算法中的訓練函數實現,其中縱坐標均為參數的誤差級別,橫坐標表示訓練過程中向前迭代的n次迭代步數;曲線描述誤差性能走勢,直線為期望誤差目標;訓練過程采用同樣的樣本訓練集與測試集,不同的是圖3中采用BP神經網絡默認初始化算法Nguyen-Widrow,未改進網絡模型的初始化權重值.此外,從圖3中可觀察得出曲線在達到最大步長時,仍未達到目標期望誤差.而本文通過AHP改進的神經網絡模型權值初始化方法設計的神經網絡模型如圖4,使用AHP初始化權重后,在將近100迭代步時已經以1/2的速率快速接近,按照預期誤差水準1e-4經過350次左右迭代,達到了期望的誤差目標.
圖3 原始的帶動量梯度下降算法的BP網絡誤差性能變化Fig.3 Original traingdm algorithm of BP network deviation performance
圖4 改進后帶動量梯度下降算法的BP網絡誤差性能變化Fig.4 Improved traingdm algorithm of BP network deviation performance
食品的安全狀況因為受到自然環(huán)境、加工衛(wèi)生環(huán)境、農業(yè)以及檢測檢驗值的準確性等多重影響,安全評價的結果往往與預想的結果差距較大,利用改進的神經網絡進行信息處理,并對食品安全狀況評價、評估是本課題研究的重要內容.本文運用層次分析法對指標數據的權重進行預處理優(yōu)化,大大減少了建模過程的計算時間以及誤差偏移量,提高了評價結果的準確率.
結合基于供應鏈的種類食品安全評價體系,通過改進型神經網絡構建了食品安全評價預測模型,實驗結果表明評價的準確率達到了預期目標,方案是可行的,解決了傳統(tǒng)評價模型過度依賴主觀性、自學習能力差等缺點,充分利用了神經網絡推廣性、容錯性強等優(yōu)點,有效地提高了食品安全評價的準確性.但是,測試樣本集與訓練樣本集的選擇、信息的完善度對評價模型建模結果的影響有待進一步探討研究.
[1] Gorris LG M.Food safety objective:an integral part of food chainmanagement[J].Food Control,2005,16:801 -809.
[2] Karl Ropkins,Beck A J.Evaluation ofworldwide approaches to the use of HACCP to control food safety[J]. Trends in Food Science&Technology,2000(11):10-21.
[3] 肖靜.基于供應鏈的食品安全保障研究[D].長春:吉林大學,2009.
[4] 肖玫,袁界平,陳連勇.食品安全的影響因素與保障措施探討[J].農業(yè)工程學報,2007,23(2):286-289.
[5] 陳輝.食品安全概論[M].北京:中國輕工業(yè)出版社,2011:35-199.
[6] 都偉東,石玉月,田巍.國內外食品安全評價綜述[J].食品工程,2007(2):3-5.
[7] Zhu Ming,Liu Hengjiang.Study on evaluation index model and hierarchicalmanagementof food safety[R].Shanghai:ShanghaiMunicipal Bureau of Quality and Technical Supervision,2009.
[8] 張慶英,馬楓,范海芹,等.基于J2EE和XML的食品安全數據系統(tǒng)設計[J].東南大學學報:自然科學版,2007(Z2):431-433.
[9] 毛薇,張慧,崔劍,等.基于供應鏈的食品安全評價指標體系構建的研究——以浙江省為例:中國,2010C35046[P].2012-06-14.
[10] 劉磚勛.食品安全綜合評價指標體系的灰關聯(lián)分析[J].華北水利水電學院學報,2007,28(4):100-103.
[11] Zhang Yan,Zhang Hong,Gao Xiang,et al.Improved AHPmethod and its appliacation in lake environmental comprehensive quality evaluation—a case study of Xuanwu Lake,Nanjing,China[J].Chinese Journal of Oceanology and Limnology,2007,25(4):427-433.
[12] Saaty T L.A scalingmethod for priorities in hierarchical structures[J].JMath&Psych.,1977,15(3):234-281.
[13] He Yong,Ge Xiaofeng,Chen Lineng,et al.Improved AHPmethod and itsapplication in the evaluation of agriculturalmechanization[J].Journal of Systems Science and Systems Engineering,2001,10(4):403-408.
[14] 楊月華,杜軍平.基于神經網絡的旅游突發(fā)事件預警研究[J].北京工商大學學報:自然科學版,2008,26 (2):63-66.
[15] 黨香俊,姜同敏.基于相關分析和組合神經網絡的退化預測[J].北京航空航天大學學報,2013,39(1):43-46.
[16] 章德賓,徐家鵬,許建軍,等.基于監(jiān)測數據和BP神經網絡的食品安全預警模型[J].農業(yè)工程學報,2010,26(1):221-226.
Research on Establishment of Food Safety Evaluation M odel Based on Neural Network
CAIQiang, WANG Jun-jun, LIHai-sheng, MAO Dian-hui
(School of Computer Science and Information Engineering,Beijing Technology and Business University,Beijing 100048,China)
The accuracy of the food safety evaluation model directly influences the accuracy of food safety situation assessment and forecast.Based on the hazard analysis critical control point theory(HACCP),a food safety evaluation index system was established from the perspective of the food supply chain.In order to detect the convergence speed and fitting degree of the model’s deviation,the analytic hierarchy processwas utilized to improve the random initialization calculating weightmethod in the backward propagation neural network algorithm.Meanwhile,the sample data were trained and the test data were validated.The results showed that the BP neural network combined with AHP was high-precision,fast,and objective,which could be used to food safety evaluation of circulation links of production,processing,and sales.
food safety;neural network;calculation of weight;evaluation model
檀彩蓮)
TS201.6;TP391.7;R155
A
10.3969/j.issn.2095-6002.2014.01.013
2095-6002(2014)01-0069-08
蔡強,王君君,李海生,等.基于神經網絡的食品安全評價模型構建研究.食品科學技術學報,2014,32(1):69-76. CAIQiang,WANG Jun-jun,LIHai-sheng,et al.Research on establishment of food safety evaluationmodelbased on neural network.Journal of Food Science and Technology,2014,32(1):69-76.
2013-04-26
蔡 強,男,教授,博士,主要從事智能信息處理與可視化方面的研究;王君君,女,碩士研究生,研究方向為智能信息處理.