夏阿林,夏霞明,吉琳琳,趙良忠
(邵陽(yáng)學(xué)院食品與化學(xué)工程學(xué)院,邵陽(yáng) 422000)
休閑豆干是以大豆為原料,經(jīng)過(guò)熏制、鹵制、調(diào)味等工藝加工而成的小包裝食品,其味美可口,營(yíng)養(yǎng)豐富,越來(lái)越受消費(fèi)者喜愛(ài)[1]。近年來(lái),中國(guó)休閑豆干加工企業(yè)發(fā)展已經(jīng)初具規(guī)模,其生產(chǎn)量和消費(fèi)量呈現(xiàn)快速增長(zhǎng)的趨勢(shì)。然而從行業(yè)發(fā)展的整體以及衛(wèi)生安全上看,休閑豆干企業(yè)規(guī)模以及結(jié)構(gòu)發(fā)展還不完善、產(chǎn)業(yè)化程度較低、標(biāo)準(zhǔn)化和規(guī)?;a(chǎn)企業(yè)少、小作坊加工點(diǎn)大量存在、生產(chǎn)加工不夠規(guī)范等諸多問(wèn)題。消費(fèi)者買(mǎi)到有質(zhì)量問(wèn)題的休閑豆干,一般只能通過(guò)品牌產(chǎn)品包裝進(jìn)行廠家追溯,而廠家往往會(huì)以消費(fèi)者買(mǎi)到的是假冒產(chǎn)品而拒絕擔(dān)責(zé)。如果產(chǎn)品不是從專(zhuān)門(mén)渠道(如專(zhuān)賣(mài)店或大型超市等)購(gòu)買(mǎi),消費(fèi)者維權(quán)一般比較困難。因此為了保障消費(fèi)者可以買(mǎi)到貨真價(jià)實(shí)的品牌豆干,并且能夠通過(guò)產(chǎn)品本身就可以對(duì)其廠家進(jìn)行追溯,迫切需要一種方法能夠快速地對(duì)休閑豆干產(chǎn)品進(jìn)行品牌歸屬判斷。這不僅對(duì)廠家而言可以減少糾紛煩惱,對(duì)消費(fèi)者而言也可以提供了一種維權(quán)依據(jù),同時(shí)也可為建立完善的豆干質(zhì)量保障和監(jiān)督體系提供有用的技術(shù)支持。
低場(chǎng)核磁共振(low field nuclear magnetic resonance, LF-NMR)是應(yīng)用于食品領(lǐng)域的一項(xiàng)新技術(shù),與目前可知的其他技術(shù)相比,具有快速、無(wú)損、準(zhǔn)確,且無(wú)需任何化學(xué)試劑等優(yōu)點(diǎn),現(xiàn)已廣泛應(yīng)用于食品行業(yè)[2-7]。其檢測(cè)原理是通過(guò)對(duì)處于恒定磁場(chǎng)中的樣品施加射頻脈沖,使氫質(zhì)子發(fā)生共振后再以非輻射的方式釋放所吸收的射頻波能量后返回到基態(tài),此過(guò)程稱(chēng)為弛豫過(guò)程,將描述弛豫過(guò)程的時(shí)間常數(shù)稱(chēng)為弛豫時(shí)間。弛豫過(guò)程包括橫向弛豫和縱向弛豫 2種形式,分別用 T1和 T2表示。弛豫時(shí)間與氫質(zhì)子的存在狀態(tài)以及所處物理化學(xué)環(huán)境有關(guān)[8]。因此可以通過(guò)分析樣品的弛豫時(shí)間和共振信號(hào)振幅,即低場(chǎng)核磁共振譜,就可以獲得許多樣品內(nèi)部信息,從而達(dá)到對(duì)樣品的定性定量分析。然而休閑豆干的低場(chǎng)核磁共振譜之間重疊嚴(yán)重,譜圖差異小,這就使用常規(guī)方法無(wú)法對(duì)不同品牌豆干進(jìn)行判別。
化學(xué)計(jì)量學(xué)是當(dāng)代化學(xué)與分析化學(xué)的重要發(fā)展前沿,是復(fù)雜樣品體系解析的重要工具[9-15]。該方法引入食品領(lǐng)域[16-18],為休閑豆干的快速分析提供了新的血液?;瘜W(xué)模式識(shí)別是化學(xué)計(jì)量學(xué)研究中的一個(gè)十分重要的內(nèi)容,它從化學(xué)量測(cè)數(shù)據(jù)出發(fā),自動(dòng)將樣本集按樣本的某些性質(zhì)進(jìn)行分類(lèi)和特征提取,揭示隱含于化學(xué)量測(cè)數(shù)據(jù)內(nèi)部規(guī)律的一種多元分析技術(shù),可為化學(xué)家提供了十分有用的決策性信息。常用的化學(xué)模式識(shí)別方法包括無(wú)監(jiān)督的聚類(lèi)分析(如最小生成樹(shù)、K-均值聚類(lèi)法等)、有監(jiān)督的判別分析(如人工神經(jīng)網(wǎng)絡(luò)、偏最小二乘判別法、線性學(xué)習(xí)機(jī)、K-最近鄰判別法、支持向量機(jī)等)、基于特征投影的降維顯示方法(如主成分分析法、SIMCA方法等)等[19]。近年來(lái)化學(xué)模式識(shí)別在農(nóng)業(yè)及食品領(lǐng)域得到了相當(dāng)廣泛的應(yīng)用[20-23]。
對(duì)于低場(chǎng)核磁共振信號(hào),多數(shù)存在背景信號(hào)和干擾信號(hào),而化學(xué)模式識(shí)別方法的這一特性正好可較好地解決了這一影響。不同品牌的休閑豆干由于其生產(chǎn)原料及生產(chǎn)工藝一般存在著差異性從而導(dǎo)致低場(chǎng)核磁共振信號(hào)的差異,因此可以利用低場(chǎng)核磁共振譜結(jié)合化學(xué)模式識(shí)別方法對(duì)不同品牌豆干進(jìn)行判別。本文利用低場(chǎng)核磁共振分析儀,以不同品牌休閑豆干為研究對(duì)象,結(jié)合主成分分析法、偏最小二乘判別法和人工神經(jīng)網(wǎng)絡(luò)等化學(xué)模式識(shí)別方法對(duì)其進(jìn)行識(shí)別,為休閑豆干的快速品牌識(shí)別或產(chǎn)品的廠家追溯提供試驗(yàn)依據(jù)。
休閑豆干樣品全部購(gòu)于某大型超市。4個(gè)月內(nèi)分5批次購(gòu)買(mǎi) 4個(gè)知名品牌的休閑豆干作為研究對(duì)象,各品牌來(lái)自不同地方,包裝袋標(biāo)識(shí)的生產(chǎn)日期如表1。豆干都為獨(dú)立包裝,每小包質(zhì)量大約 20~30 g,在各品牌之間豆干外形相似,消費(fèi)者一般難以從外形和口感區(qū)分各品牌。從各個(gè)品牌的每個(gè)批次中隨機(jī)選擇16小包,5批次,每小包作為1個(gè)樣品,共獲得320個(gè)樣品。
表1 4個(gè)品牌的5個(gè)批次標(biāo)記的生產(chǎn)日期Table 1 Date of production marking each batch of dried tofu for four brands
MQC-23臺(tái)式核磁共振儀(氫共振頻率為23 MHz,配套數(shù)據(jù)分析軟件WinDXP和26 mm核磁共振專(zhuān)用樣品管),英國(guó)牛津公司(Oxford-instruments)。梅特勒-托利多儀器(上海)有限公司生產(chǎn)的電子天平,精度0.000 1 g。
1.3.1 低場(chǎng)核磁共振檢測(cè)
將要測(cè)量的小包豆干(20~30 g)的包裝拆開(kāi),取出豆干,切成5 mm左右的小塊,混合后用電子天平稱(chēng)取約5 g作為測(cè)量樣品,再將該樣品裝入26 mm核磁樣品管,放入儀器的測(cè)量池中,在32 ℃(儀器磁體溫度)下放置10 min后,開(kāi)始采樣,采用 Carr-Purcell-Meiboom-Gill(CPMG)脈沖序列測(cè)量樣品的橫向弛豫時(shí)間(T2)。儀器參數(shù)設(shè)置如下:90°硬脈沖寬度為5.45 μs,180°硬脈沖寬度為10.9 μs,采樣頻率為1 000 kHz,重復(fù)采樣時(shí)間為1 000 ms,累加次數(shù)為16次,半回波時(shí)間為3 000 μs,回波個(gè)數(shù)為256個(gè)。每個(gè)樣品重復(fù)測(cè)量3次,測(cè)得的回波曲線經(jīng)反演后獲得橫向弛豫時(shí)間反演譜(T2譜),取均值作為測(cè)量結(jié)果,共獲得320個(gè)樣品的T2譜。用于化學(xué)模式識(shí)別的分析數(shù)據(jù)為T(mén)2譜數(shù)據(jù)。T2譜是由核磁共振儀自帶的WinDXP軟件運(yùn)行反演算法對(duì)原始回波信號(hào)進(jìn)行多指數(shù)弛豫譜反演計(jì)算而獲得的曲線(默認(rèn)輸出 128個(gè)數(shù)據(jù)點(diǎn))。
1.3.2 主成分分析法(principal component analysis, PCA)
在使用統(tǒng)計(jì)方法處理數(shù)據(jù)時(shí),經(jīng)常會(huì)遇到高維數(shù)據(jù)。維數(shù)越高,變量越多,就會(huì)增加計(jì)算量,同時(shí)使得問(wèn)題分析變得更加復(fù)雜。主成分分析是考察多個(gè)變量間相關(guān)性的一種多元統(tǒng)計(jì)方法,屬于基于特征投影的降維顯示方法。其基本思路是基于主成分分析所得的主成分軸是該數(shù)據(jù)矩陣的最大方差方向,且它們相互正交,這樣就可保證高維數(shù)據(jù)以盡可能保留有用的信息而投影到低維空間,從而降低了量測(cè)數(shù)據(jù)維數(shù),實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)化。通過(guò)直接對(duì)樣本量測(cè)矩陣進(jìn)行奇異值分解,用主成分分析的方法,取最大的2(或3)個(gè)特征值所對(duì)應(yīng)的得分矢量,可在二維空間(或三維空間)顯示樣本在模式空間的分布,用人眼即能進(jìn)行分類(lèi)和判別[19]。
1.3.3 偏最小二乘判別分析(partial least squaresdiscriiminate analysis, PLS-DA)
偏最小二乘方法本質(zhì)上是一種基于特征變量的回歸方法,在多元校正中得到了廣泛地應(yīng)用[24-26]。它與主成分分析的不同之處在于它不僅對(duì)量測(cè)矩陣進(jìn)行正交分解,而且在分解量測(cè)矩陣的同時(shí)對(duì)響應(yīng)矩陣也進(jìn)行正交分解,為一同時(shí)進(jìn)行分解的特征變量回歸法[19]。偏最小二乘判別分析就是將偏最小二乘方法用于模式識(shí)別,即將已知類(lèi)別的響應(yīng)變量設(shè)為0或1(對(duì)2類(lèi)模型),或其他整數(shù),如-1、0、1、…等(對(duì)多類(lèi)模型)。
本研究為對(duì) 4個(gè)品牌的判別,因此響應(yīng)變量期望值可設(shè)計(jì)為:“-3”對(duì)應(yīng)品牌1;“-1”對(duì)應(yīng)品牌2;“1”對(duì)應(yīng)品牌3;“3”對(duì)應(yīng)品牌4。
運(yùn)用留一交互驗(yàn)證法[26]來(lái)確定最佳主成分?jǐn)?shù)。評(píng)價(jià)標(biāo)準(zhǔn)采用交互驗(yàn)證均方根誤差(root mean square error of cross validation, RMSECV),表達(dá)式如式(1)。
式中Kp表示交互驗(yàn)證集樣本數(shù);~iC 表示第 i個(gè)樣本的預(yù)測(cè)值;Ci表示第 i個(gè)樣本的期望值。
采用偏最小二乘方法對(duì)訓(xùn)練集樣本進(jìn)行訓(xùn)練后,建立 PLS-DA模型,并用預(yù)測(cè)樣本進(jìn)行測(cè)試。用 PLS-DA模型對(duì)豆干品牌進(jìn)行判別預(yù)測(cè)時(shí),根據(jù)預(yù)測(cè)值 yi大小按下式的判別區(qū)間來(lái)判別品牌類(lèi)別。
1.3.4 正則化誤差反傳人工神經(jīng)網(wǎng)絡(luò)(bayesian regularization back-propagation artificial neural network, BR-BP-ANN)
人工神經(jīng)網(wǎng)絡(luò)具有自適應(yīng)、自組織和自學(xué)習(xí)的特點(diǎn),信息并行處理及分布式地存儲(chǔ)于各連接權(quán)重中,進(jìn)而具有很強(qiáng)的容錯(cuò)和非線性映照能力。它采用的機(jī)理完全不同于傳統(tǒng)人工智能和信息處理技術(shù),克服了傳統(tǒng)的基于邏輯符號(hào)的人工智能在處理直覺(jué)、非結(jié)構(gòu)化信息方面的缺陷,用于模式識(shí)別具有一定優(yōu)勢(shì)。然而對(duì)于傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)方法,訓(xùn)練樣本所包含的信息內(nèi)容通常不能充分地由自身唯一地重構(gòu)出未知的輸入輸出映射。因此就產(chǎn)生了機(jī)器學(xué)習(xí)的過(guò)擬合的可能性[27]。為了克服這個(gè)問(wèn)題,常采用貝葉斯正則化方法(bayesian regularization)[28]作為人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練函數(shù),該方法能最大限度地避免過(guò)擬合的發(fā)生。
誤差反傳人工神經(jīng)網(wǎng)絡(luò)是應(yīng)用最廣的人工神經(jīng)網(wǎng)絡(luò)方法,一般由輸入層、隱含層和輸出層 3部分構(gòu)成。本研究采用誤差反傳人工神經(jīng)網(wǎng)絡(luò)方法,使用貝葉斯正則化方法作為訓(xùn)練函數(shù),即BR-BP-ANN方法。學(xué)習(xí)函數(shù)采用帶動(dòng)量梯度下降的權(quán)值和偏置值學(xué)習(xí)函數(shù)。輸入和輸出層的節(jié)點(diǎn)數(shù)是按照分析的要求來(lái)設(shè)計(jì)的。對(duì)于判別分類(lèi)分析,其類(lèi)別數(shù)是m個(gè),那么輸出層一般取m個(gè)節(jié)點(diǎn)數(shù)。訓(xùn)練樣本集中的 xi屬于第 j 類(lèi),那么期望輸出值 Y為式(2)。
式中1j表示第j類(lèi)期望輸出為1,m表示類(lèi)別數(shù)。
本研究為 4個(gè)品牌的判別,因此期望輸出值編碼可設(shè)計(jì)為:[1-0-0-0]為品牌1, [0-1-0-0]為品牌2,[0-0-1-0]為品牌 3,[0-0-0-1]為品牌 4。神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)訓(xùn)練后,獲得優(yōu)化的權(quán)值和偏置值,并用這些參數(shù)對(duì)預(yù)測(cè)樣本進(jìn)行驗(yàn)證。用人工神經(jīng)網(wǎng)絡(luò)對(duì)豆干品牌進(jìn)行判別預(yù)測(cè)時(shí),若輸出值 y1,y2,y3,y4同時(shí)滿足式(3)[29]。
如ym= y1,則判別屬于品牌一,若ym= y2,則屬品牌2,其他類(lèi)似,如不滿足以上條件則判別為不能識(shí)別。
輸入層節(jié)點(diǎn)數(shù)可以按照需要求解的問(wèn)題和數(shù)據(jù)表示的方式而定。一般來(lái)說(shuō),問(wèn)題確定之后,輸入與輸出層的節(jié)點(diǎn)數(shù)就可以確定了。本研究的輸入層節(jié)點(diǎn)數(shù)為核磁共振譜橫向弛豫時(shí)間反演曲線(T2譜)數(shù)據(jù)點(diǎn)數(shù)(即128個(gè)點(diǎn))。
隱含層單元數(shù)的選擇是神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)中非常重要的一個(gè)環(huán)節(jié),也是一個(gè)十分復(fù)雜的問(wèn)題。往往根據(jù)前人的經(jīng)驗(yàn)和多次試驗(yàn)來(lái)確定,迄今為止還未找到一個(gè)理想的解析式來(lái)表示。一般在選擇隱含層節(jié)點(diǎn)數(shù)時(shí),都會(huì)參考式(4)~式(6)3個(gè)經(jīng)驗(yàn)公式[30]。
式中k為樣本數(shù),n1為隱含層節(jié)點(diǎn)數(shù),n為輸入層節(jié)點(diǎn)數(shù),i為[0, n]之間的常數(shù),當(dāng)i > n1時(shí),取 C)= 0。
1.3.2.3 運(yùn)動(dòng)干預(yù)指導(dǎo)管理 合理的運(yùn)動(dòng)是提高冠心病病人身體機(jī)能的有效途徑,但冠心病病人要避免競(jìng)爭(zhēng)性較強(qiáng)的文娛活動(dòng),要注意運(yùn)動(dòng)的時(shí)間、節(jié)奏和運(yùn)動(dòng)的強(qiáng)度,注意保持平和心情狀態(tài)。運(yùn)動(dòng)的方式主要是以有氧運(yùn)動(dòng)為主,注意運(yùn)動(dòng)的環(huán)境,保持運(yùn)動(dòng)場(chǎng)所空氣新鮮,適當(dāng)?shù)倪\(yùn)動(dòng)有利于提高心肌的修復(fù),促進(jìn)側(cè)支血管循環(huán)形成[4] 。運(yùn)動(dòng)過(guò)程中出現(xiàn)身體的異常變化,如意識(shí)、頭部感官、心律、視力等情況的變化,應(yīng)立即停止運(yùn)動(dòng),情況嚴(yán)重者及時(shí)就醫(yī)。
式中m為輸出層節(jié)點(diǎn)數(shù),常數(shù)a=1~10。
在實(shí)際問(wèn)題中,最佳隱含層節(jié)點(diǎn)數(shù)選擇就是對(duì)每種方法分別進(jìn)行驗(yàn)證,然后將各方法得出的最佳隱含層節(jié)點(diǎn)數(shù)綜合比較,然后確定神經(jīng)網(wǎng)絡(luò)最終的最佳隱含層節(jié)點(diǎn)數(shù)。本研究采用雙隱含層結(jié)構(gòu),第 1個(gè)隱含層的節(jié)點(diǎn)數(shù)使用公式(6)確定: n1= l og2128 = 7 。第2個(gè)隱含層的節(jié)點(diǎn)數(shù)仍然采用式(6)確定,這時(shí)式中 n=n1,則n2= l og27 ≈ 3 。這樣人工神經(jīng)網(wǎng)絡(luò)各層及節(jié)點(diǎn)數(shù)都已確定,即由1個(gè)輸入層、2個(gè)隱含層和1個(gè)輸出層構(gòu)成。輸入層的節(jié)點(diǎn)數(shù)為核磁共振譜橫向弛豫時(shí)間點(diǎn)數(shù)(即 128個(gè)點(diǎn)),隱含層1的節(jié)點(diǎn)數(shù)為7,隱含層2節(jié)點(diǎn)數(shù)為3,輸出層節(jié)點(diǎn)數(shù)為4。通過(guò)輸出層結(jié)果判別4種品牌。
隱含層和輸出層的轉(zhuǎn)換函數(shù)都采用雙曲線正切函數(shù)(tansig函數(shù))見(jiàn)式(7)。
人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)收斂判別方法采用誤差平方和(sum of square error, SSE)計(jì)算見(jiàn)式(8)。
式中h為訓(xùn)練集中樣本數(shù),m為輸出節(jié)點(diǎn)數(shù),Eef為期望輸出值,Oef為訓(xùn)練實(shí)際輸出值。
NMR測(cè)量采用CPMG脈沖序列測(cè)得樣品的回波信號(hào)衰減數(shù)據(jù)曲線。用 WinDXP軟件對(duì)樣本回波曲線數(shù)據(jù)進(jìn)行反演擬合,可得到橫向弛豫時(shí)間T2譜。PCA-PD和 PLS-DA算法程序?yàn)樽跃幊绦?。BR-BP-ANN算法程序自編,部分調(diào)用MATLAB工具箱程序。所有程序都在MATLAB軟件平臺(tái)上運(yùn)行。作圖軟件使用Origin軟件。
在相同條件下,對(duì) 4個(gè)品牌的所有豆干樣品進(jìn)行低場(chǎng)核磁共振檢測(cè)。豆干樣品的CPMG回波曲線和豆干樣品的橫向弛豫時(shí)間(T2)反演曲線分別如圖1和圖2所示。從圖 1中可見(jiàn),豆干樣品的回波曲線之間差異微小,即使是豆干樣品的反演曲線之間(如圖2)也具有高度的相似性。這些豆干樣品譜圖之間的微弱差異很難直接用肉眼通過(guò)譜圖來(lái)對(duì)豆干的品牌類(lèi)別進(jìn)行判別。因此需要借助其他方法,如化學(xué)模式識(shí)別方法,來(lái)對(duì)這些譜圖進(jìn)行解析。通過(guò)提取有用的、能反映各品牌特征的信息來(lái)辨別品牌類(lèi)別。
圖1 所有豆干樣品的CPMG(Carr-Purcell-Meiboom-Gill)回波曲線Fig.1 CPMG echo curves of all dried tofu samples
圖2 所有豆干樣品的橫向弛豫時(shí)間(T2)反演曲線Fig.2 Inversional curves of transverse relaxation time(T2) for all dried tofu samples
從全部320個(gè)豆干樣品中,對(duì)每個(gè)品牌的80個(gè)樣品隨機(jī)選取60個(gè)作為訓(xùn)練集樣品,4個(gè)品牌共隨機(jī)選取240個(gè)訓(xùn)練集樣品,剩余80個(gè)樣品作為預(yù)測(cè)集樣品用于測(cè)試。對(duì)訓(xùn)練集樣品進(jìn)行編號(hào):1~60號(hào)樣品為品牌1;61~120號(hào)樣品為品牌 2;121~180號(hào)樣品為品牌 3;181~240號(hào)樣品為品牌4。對(duì)預(yù)測(cè)集樣品進(jìn)行編號(hào):1~20號(hào)樣品為品牌 1;21~40號(hào)樣品為品牌 2;41~60號(hào)樣品為品牌3;61~80號(hào)樣品為品牌4。
2.2.1 主成分分析判別
利用主成分分析方法對(duì)所有 320個(gè)豆干樣品的低場(chǎng)核磁共振橫向弛豫時(shí)間反演數(shù)據(jù)進(jìn)行降維,得到各個(gè)主成分的得分矩陣。由于主成分的獲得是以最大方差準(zhǔn)則為基礎(chǔ)的,因此,數(shù)據(jù)方差的絕大部分信息將包含在前面幾個(gè)主成分中,前3個(gè)主成分累計(jì)貢獻(xiàn)率為77.6%(主成分1、主成分2和主成分3的貢獻(xiàn)率分別為55.3%、14.0%和8.3%),包含了大部分信息。選用這3個(gè)主成分的得分矢量做三維散點(diǎn)圖可以直觀的看到聚類(lèi)分析結(jié)果,如圖3所示。從圖 3中可見(jiàn),各個(gè)品牌的樣品在三維圖上看上去有些離散,聚集不明顯,難以用肉眼對(duì) 4個(gè)品牌進(jìn)行識(shí)別。
圖3 所有豆干樣品的三維主成分得分圖Fig.3 Three-dimensional PCA (principal component analysis)scores plot for all dried tofu samples
2.2.2 偏最小二乘判別
使用PLS-DA方法對(duì)4個(gè)品牌共240個(gè)訓(xùn)練集豆干樣品進(jìn)行訓(xùn)練。采用留一交互驗(yàn)證法來(lái)確定最佳主成分?jǐn)?shù)并建模。RMSECV與所選主成分的關(guān)系如圖4所示。由圖4可知,主成分?jǐn)?shù)為18時(shí),RMSECV最小,故選擇18作為模型最佳主成分?jǐn)?shù)。訓(xùn)練完成后,建立 PLS-DA模型。
圖4 交互驗(yàn)證均方根誤差與主成分?jǐn)?shù)的關(guān)系Fig.4 Relationship between RMSECV and number of principal component
運(yùn)用所建模型對(duì)訓(xùn)練集樣品和預(yù)測(cè)集樣本進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如圖5所示。從圖5中可見(jiàn),無(wú)論對(duì)于訓(xùn)練集樣品還是預(yù)測(cè)集樣品,大部分預(yù)測(cè)值都?xì)w屬于相應(yīng)品牌判別區(qū)間。對(duì)豆干樣品的品牌判別結(jié)果如表2所示。由表2可知,對(duì)于訓(xùn)練集,品牌4的樣品的識(shí)別率最高為93.3%,最差為品牌3的樣品,識(shí)別率為76.7%,4個(gè)品牌的總識(shí)別率為 86.3%。對(duì)于預(yù)測(cè)集,仍然是品牌 4的樣品的識(shí)別率最高90.0%,品牌3的樣品識(shí)別率最差為75.0%,4個(gè)品牌的總識(shí)別率為81.3%。顯然,PLS-DA方法對(duì)豆干品牌的識(shí)別率雖然能夠達(dá)到 80%以上,但是用于豆干品牌的判別還是難以接受,因此,需要尋求更適合的方法來(lái)提高識(shí)別率。
圖5 訓(xùn)練集及預(yù)測(cè)集豆干樣品PLS-DA方法預(yù)測(cè)結(jié)果Fig.5 Predicted results by PLS-DA (partial least squares-discriiminate analysis) for dried tofu samples of training and prediction sets
表2 PLS-DA 和 BR-BP-ANN 方法判別結(jié)果Table 2 Identification results for PLS-DA and BR-BP-ANN(bayesian regularization back-propagation artificial neural network)
2.2.3 人工神經(jīng)網(wǎng)絡(luò)方法判別
使用BR-BP-ANN方法對(duì)4個(gè)品牌共240個(gè)訓(xùn)練集豆干樣品進(jìn)行訓(xùn)練。經(jīng)過(guò)訓(xùn)練優(yōu)化后,固定優(yōu)化后的權(quán)值和偏置值參數(shù),用隨機(jī)獲得的預(yù)測(cè)集 80個(gè)豆干樣品進(jìn)行驗(yàn)證,預(yù)測(cè)結(jié)果如圖6所示。從圖6中可見(jiàn),用BR-BP-ANN方法對(duì)訓(xùn)練集豆干樣品進(jìn)行品牌判別預(yù)測(cè)結(jié)果如下:1~60號(hào)樣品的預(yù)測(cè)值與品牌一的期望值(1-0-0-0)高度一致,滿足判別條件,這些樣品歸屬品牌1;61~120號(hào)樣品預(yù)測(cè)值與品牌2的期望值(0-1-0-0)一致,歸屬品牌2;121~180號(hào)樣品預(yù)測(cè)值與品牌3的期望值(0-0-1-0)一致,歸屬品牌 3;181~240號(hào)樣品預(yù)測(cè)值與品牌4的期望值(0-0-0-1)一致,歸屬品牌4。同樣的,對(duì)于預(yù)測(cè)集樣本預(yù)測(cè),仍然獲得了很好的結(jié)果,預(yù)測(cè)值和期望值完美一致。從表 2中可見(jiàn),無(wú)論是對(duì)訓(xùn)練集還是預(yù)測(cè)集,該方法對(duì)各品牌的判別正確率均為100%。
圖6 訓(xùn)練集及預(yù)測(cè)集豆干樣品BR-BP-ANN方法預(yù)測(cè)結(jié)果Fig.6 Predicted results by BR-BP-ANN for dried tofu samples of training and prediction sets
低場(chǎng)核磁共振信號(hào)T2與氫質(zhì)子的存在狀態(tài)以及所處物理化學(xué)環(huán)境有關(guān),因此T2譜包含許多樣品內(nèi)部的信息,這樣可以使用化學(xué)模式識(shí)別的方法對(duì)T2譜進(jìn)行信息提取而實(shí)現(xiàn)對(duì)休閑豆干的品牌判別。選用 4個(gè)常見(jiàn)的豆干品牌作為研究對(duì)象,采用PCA、PLS-DA和BR-BP-ANN方法分析處理低場(chǎng)核磁共振T2譜數(shù)據(jù)。試驗(yàn)結(jié)果顯示PCA方法不能同時(shí)辨別4種豆干品牌;PLS-DA方法對(duì)預(yù)測(cè)集豆干品牌的識(shí)別率只有81.3%;而B(niǎo)R-BP-ANN方法能夠準(zhǔn)確地對(duì)豆干品牌進(jìn)行識(shí)別,識(shí)別正確率為100%。本研究采用的BR-BP-ANN方法雖然只針對(duì)4種休閑豆干品牌進(jìn)行分析,但該方法可以通過(guò)對(duì)更多種品牌豆干的建模,實(shí)現(xiàn)對(duì)更多品牌的識(shí)別。因此,采用低場(chǎng)核磁共振技術(shù)結(jié)合 BR-BP-ANN方法能夠快速而準(zhǔn)確地對(duì)豆干品牌進(jìn)行識(shí)別,也可為產(chǎn)品的廠家追溯以及完善豆干質(zhì)量保障和監(jiān)督體系提供一些理論與技術(shù)支持。
[1] Meera K, In-sook S, Jin-sook H. Evaluation of microbiological physicochemical and sensory qualities of chitosan tofu during storage[J]. Journal of Food Quality,2007, 27(1): 27-40.
[2] Chen L, Tian Y Q, Sun B H, et al. Rapid, accurate, and simultaneous measurement of water and oil contents in the fried starchy system using low-field NMR[J]. Food Chemistry, 2017, 233: 525-529.
[3] Renou J P, Kopp J, Gatellier P, et al. NMR relaxation of water protons in normal and malignant hyperthermia-susceptible pig muscle[J]. Meat Science, 1989, 26(2): 101-114.
[4] Bertram H C. Field gradient CPMG applied on postmortem muscles[J]. Magnetic Resonance Imaging, 2004, 22(4): 557-563.
[5] Sangpring Y, Fukuoka M, Ban N, et al. Evaluation of relationship between state of wheat flour-water system and mechanical energy during mixing by color monitoring and low-field1H NMR technique[J]. Journal of Food Engineering,2017, 211: 7-14.
[6] Carneiro C S, Mársico E T, Ribeiro R O,et al. Low-field nuclear magnetic resonance (LF NMR1H) to assess the mobility of water during storage of salted fish (Sardinella brasiliensis) [J]. Journal of Food Engineering, 2016, 169: 321-326.
[7] Defernez M, Wren E, Watson A D, et al. Low-field1H NMR spectroscopy for distinguishing between arabica and robusta ground roast coffees[J]. Food Chemistry, 2017, 216:106-113.
[8] 阮榕生. 核磁共振技術(shù)在食品和生物體系中的應(yīng)用[M].北京: 中國(guó)輕工業(yè)出版社, 2009.
[9] Booksh K S, Kowalski B R. Theory of analytical chemistry.Analytical Chemistry, 1992, 66(15): 782-791.
[10] Mohammad A, Hadi P, Hassan S,et al. A systematic study on the effect of noise and shift on multivariate figures of merit of second-order calibration algorithms[J]. Analytica Chimica Acta, 2017, 952: 18-31.
[11] Maira D C, Juan A A, Graciela M E. Excitation-emission fluorescence-kinetic data obtained by Fenton degradation.Determination of heavy-polycyclic aromatic hydrocarbons by four-way parallel factor analysis[J]. Talanta, 2017, 165: 52-63.
[12] Hadi P, Nadia A. Multivariate curve resolution based chromatographic peak alignment combined with parallel factor analysis to exploit second-order advantage in complex chromatographic measurements[J]. Analytica Chimica Acta,2014, 816: 18-27.
[13] Róbert R, Nematollah O, Hamid A, et al. On uniqueness of the non-negative decomposition of two and three component three-way data arrays[J]. Chemometrics and Intelligent Laboratory Systems, 2017, 160: 91-98.
[14] Xia A L, Wu H L, Fang D M, et al. Alternating penalty trilinear decomposition for second-order calibration with an application to interference-free analysis of excitationemission matrix fluorescence data[J]. Journal of Chemometrics, 2005, 19(2): 65-76.
[15] Thomas R, Kai U T. Quantification of pH-dependent speciation of organic compounds with spectroscopy and chemometrics[J]. Chemosphere, 2017, 172: 175-184.
[16] Lea L, Ivana Z, Tatjana D, et al. Characterization of cereal flours by fluorescence spectroscopy coupled with PARAFAC[J]. Food Chemistry, 2017, 229: 165-171.
[17] Saioa E, Raquel M C, Jose M A, et al. Fluorescence excitation–emission matrix spectroscopy as a tool for determining quality of sparkling wines[J]. Food Chemistry,2016, 206: 284-290.
[18] Hanne C B, Ida K S, Jens A J, et al. Relationship between water mobility and distribution and sensory attributes in pork slaughtered at an age between 90 and 180 days[J]. Meat Science, 2007, 77(2): 190-195.
[19] 梁逸曾,俞汝勤. 化學(xué)計(jì)量學(xué)(第3版)[M]. 北京: 高等教育出版社, 2003.
[20] 王曉玲,吳 晶,譚明乾. 低場(chǎng)核磁共振結(jié)合化學(xué)計(jì)量學(xué)方法快速檢測(cè)摻假核桃油[J]. 分析測(cè)試學(xué)報(bào), 2015,34( 7) :789-794.Wang Xiaoling, Wu Jing, Tan Mingqian. Rapid detection of adulterated walnut oil by low field-nuclear magnetic resonance combined with chemometric method[J]. Journal of Instrumental Analysis. 2015,34( 7) : 789-794. (in Chinese with English abstract)
[21] 姜潮,韓劍眾,范佳利,等. 低場(chǎng)核磁共振結(jié)合主成分分析法快速檢測(cè)摻假牛乳[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2010, 26(9):340-344.Jiang Chao, Han Jianzhong, Fan Jiali, et al. Rapid detection of adulterated milk by low field-nuclear magnetic resonance coupled with PCA method[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2010, 26(9): 340-344. (in Chinese with English abstract)
[22] 王淼,張晶,賀妍,等. 基于低場(chǎng)核磁共振的柑橘汁胞?;u(píng)級(jí)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2016,32(7):290-295.Wang Miao, Zhang Jing, He Yan, et al. Evaluation of juicy sac granulation in citrus with low field nuclear magnetic resonance[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016,32(7): 290-295. (in Chinese with English abstract)
[23] 劉小丹,馮旭萍,劉飛,等. 基于近紅外高光譜成像技術(shù)鑒別雜交稻品系[J]. 農(nóng)業(yè)工程學(xué)報(bào),2017,33(22): 189-194.Liu Xiaodan, Feng Xuping, Liu Fei, et al. Identification of hybrid rice strain based on near-infrared hyperspectral imaging technology[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE),2017, 33(22): 189-194. (in Chinese with English abstract)
[24] Makoto O, Akira K,Yusuke H. Real-time release monitoring for water content and mean particle size of granules in lab-sized fluid-bed granulator by near-infrared spectroscopy[J]. RSC Advances, 2014, 4: 17461-17468.
[25] Zhao Y, Li M Y, Wei X, et al. Quantitative analysis of the water of crystallization of gypsum by near-infrared spectroscopy in Yungang Grottoes[J]. Analytical Methods,2015, 7: 8271-8276.
[26] 陸婉珍,袁洪福,徐廣通,等. 現(xiàn)代近紅外光譜分析技術(shù)[M]. 北京:石油化工出版社,1999.
[27] Simon H. 申富饒,徐燁,等譯. 神經(jīng)網(wǎng)絡(luò)與機(jī)器學(xué)習(xí) [M].北京:機(jī)械工業(yè)出版社,2017.
[28] Mackay D J C. Bayesian interpolation[J]. Neural Computation. 1992, 4(3): 415-447
[29] 郝秀全. 基于主成分分析和人工神經(jīng)網(wǎng)絡(luò)的酒類(lèi)辨識(shí)[D].西安:西安理工大學(xué),2006.Hao Xiuquan. The Identification of Wine Based on PCA and ANN[D]. Xi’an: Xi’an University of Technology, 2006.
[30] Gutierrez-Osuna R. Pattern analysis for machine olfaction: a review[J]. IEEE Sensors Journal, 2002, 2(3): 189-202.