国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于激光誘導擊穿光譜技術結合機器學習算法的3種干腌火腿產地識別

2022-11-22 07:03黃忠宇周衛(wèi)東
中國食品學報 2022年10期
關鍵詞:火腿金華正確率

郭 茂,黃忠宇,汪 杰,周衛(wèi)東*

(1 浙江省光信息檢測與顯示技術研究重點實驗室 浙江金華 321001 2 浙江師范大學數(shù)學與計算機科學學院 浙江金華 321001)

干腌火腿是我國的傳統(tǒng)肉制品,歷史悠久,風味獨特,種類繁多,受到廣大消費者的喜愛,這其中以浙江金華火腿、云南宣威火腿、江蘇如皋火腿最為著名。火腿品質的好、壞與產地有著緊密的聯(lián)系,如余功雄[1]指出:傳統(tǒng)的金華火腿之所以長盛不衰,最主要的因素是:以中國名豬種“金華兩頭烏”的后腿為原料,加上金華地區(qū)特殊的氣候條件和民間千年世代相傳的腌制工藝,使其具有獨特的地域性,離開這個特定的地域,是腌制不出真正的金華火腿的。說明對干腌火腿進行產地識別具有重要意義。

迄今為止,國內外已有一些科研人員將多種技術手段應用于干腌火腿的分類鑒別上,如:宋雪[2]分別基于電子鼻(一種電化學傳感器陣列)和電子舌(一種味覺傳感器陣列)對金華火腿和宣威火腿進行產地識別與品級評定,取得較好的結果。呂曉雷等[3]采用氣-質譜聯(lián)用技術區(qū)分不同年份的金華火腿。高韶婷[4]通過紅外三級鑒定法分析不同產地和等級間干腌火腿的紅外譜圖,為不同產地干腌火腿及肉制品的鑒別提供了一種新的方法。姚璐[5]利用電子鼻采集試驗數(shù)據(jù),分別結合PCA和LDA 的方法較好地區(qū)分特級、一級和二級的金華火腿,其中PCA 區(qū)分效果好,LDA 顯示一級品和二級品之間有少部分重疊,之后,將高光譜成像系統(tǒng)獲得的數(shù)據(jù)結合數(shù)據(jù)分析軟件建立基于高光譜的金華火腿判別模型,訓練集和驗證集的總體識別率分別為96.19%和89.52%。Laureati 等[6]采用理化分析、電子鼻分析、儀器質構分析、圖像分析、感官評定、統(tǒng)計分析等多種方法將帕爾馬火腿、圣丹尼爾火腿和托斯卡納火腿3 種火腿區(qū)分開來。Santos 等[7]設計一種氧化錫多傳感器系統(tǒng),在結合人工神經網絡后可以鑒別用不同飼料飼養(yǎng)的豬制作的火腿以及不同成熟時間的豬制作的火腿。然而,這些技術方法需對樣品進行預處理,難以實現(xiàn)在線實時檢測,具有一定的局限性。

激光誘導擊穿光譜(Laser-induced breakdown spectroscopy,LIBS)是一種元素分析技術,由一束高能激光激發(fā)樣品表面使之產生等離子體,其會發(fā)射表征樣品組分信息的元素特征譜線。LIBS 技術具有適用范圍廣(可用于固態(tài)、液態(tài)、氣態(tài)),對物質損傷小,檢測速度快,樣品無需預處理或處理簡單等優(yōu)點。目前LIBS 技術廣泛應用于鋼鐵制造及加工[8]、環(huán)境監(jiān)測[9]、生物醫(yī)療[10]、深空探測[11]、食品安全[12-13]等領域,具有極大的發(fā)展前景。

目前,LIBS 技術在物質的分類鑒別上也得到很好的應用。馮中琦等[14]將LIBS 技術與化學計量學方法結合,可以快速、準確識別航空合金牌號。陳興龍等[15]在用LIBS 技術取得試驗數(shù)據(jù)后,以主成分作為自組織映射神經網絡的輸入變量,可對火山灰?guī)r、砂巖、白云巖實現(xiàn)100%的準確分類。於筱嵐等[16]利用LIBS 技術結合LDA 判別分析模型,鑒別了不同廠家生產的抹茶和不同殺青方式制成的綠茶粉。Bilge 等[17]利用LIBS 技術對牛肉、豬肉和雞肉進行研究,在結合PCA 算法后,對3 種肉的識別率達83.37%。目前,將激光誘導擊穿光譜技術應用于干腌火腿的分類鑒別還未見報道。

本文使用激光誘導擊穿光譜技術對國內不同產地的3 種著名干腌火腿進行分類,探究激光誘導擊穿光譜技術結合機器學習算法區(qū)分產地的可行性,為后續(xù)干腌火腿的快速區(qū)分和檢測提供新技術。

1 材料與方法

1.1 樣品制備

浙江金華火腿,金字火腿股份有限公司;江蘇如皋火腿,南通今天食品有限公司;云南宣威火腿,宣威市浦記火腿食品有限公司。

通過人工切片的方式將火腿切成30 mm×30 mm×3 mm 的薄片,盡量選取瘦肉部分。獲得如皋火腿樣品4 片,金華火腿樣品5 片,宣威火腿7片。

1.2 光路圖與試驗儀器

采用裝置如圖1所示,激光光源為Plite 200-Ⅱ型雙脈沖激光器(北京中科思遠光電科技有限公司),輸出激光波長1 064 nm,激光能量50 mJ,脈沖頻率1 Hz,脈沖寬度8 ns。激光脈沖經反射鏡反射后,由1 塊焦距為100 mm 的透鏡聚焦在樣品表面產生等離子體。等離子體發(fā)射的特征光由光纖探頭收集并由光纖傳遞至光譜儀 (AvaSpec-2048-USB2 型光纖光譜儀)中,光譜儀采集范圍為196~510 nm,積分時間2 ms,光譜分辨率0.09~0.10 nm。激光脈沖和光譜儀采集間的延時由數(shù)字信號發(fā)生器控制,經試驗條件優(yōu)化,采集延時設置為650 ns。待測火腿切片樣品被放在二維移動平臺上,可實現(xiàn)激光燒蝕位置的實時調節(jié)。

圖1 LIBS 試驗裝置示意圖Fig.1 The diagram of LIBS experimental device

1.3 試驗步驟

在相同的試驗條件下,先、后采集4 片如皋火腿、5 片金華火腿和7 片宣威火腿的光譜。每片火腿正反面各采集150 個點,最終獲得如皋火腿光譜1 200 個,金華火腿光譜1 500 個,宣威火腿光譜2 100 個。其中,金華火腿和宣威火腿需采集更多數(shù)據(jù)的原因:相比于如皋火腿,這兩種火腿更難獲得有效的LIBS 光譜,因此增加了樣本數(shù)量。

2 結果與討論

2.1 數(shù)據(jù)預處理

為了減少試驗數(shù)據(jù)的波動,盡量排除激光能量不均和樣品表面不平整帶來的影響,采用最大最小歸一化方法(Min-max normalization)對光譜數(shù)據(jù)進行預處理。最大最小歸一化是將原始數(shù)據(jù)線性映射到[0,1]區(qū)間,歸一化公式如下:

式中,x——原光譜數(shù)據(jù);xmax——原光譜數(shù)據(jù)中強度最大值;xmin——原光譜數(shù)據(jù)中強度最小值;x*——最大最小歸一化后的光譜數(shù)據(jù)。

在采集光譜過程中發(fā)現(xiàn)3 種火腿在422.752 nm 處都有較強的信號。依據(jù)此處的信噪比,每種火腿篩選出信噪比最高的100 個光譜,作為之后機器學習的數(shù)據(jù)集。

每種火腿篩選出的100 個光譜經平均得到的光譜圖見圖2??梢园l(fā)現(xiàn),3 種火腿的LIBS 光譜比較相似。

圖2 3 種火腿樣品的LIBS 光譜圖Fig.2 LIBS spectra of three ham samples

2.2 訓練集與測試集的選取

訓練集與測試集的劃分見表1。隨機選取每種樣品70%的光譜數(shù)據(jù)作為訓練集,剩下的30%作為測試集。

表1 訓練集與測試集的劃分Table 1 The division of training set and test set

在此必須指出:訓練集與測試集的選取是隨機的,當選取不同的訓練集和測試集時,最終得到的預測正確率也是不同的。在試驗中,將算法獨立重復多次,以平均正確率作為衡量標準。

2.3 KNN(K 近鄰)

K 近鄰(K-Nearest Neighbor,KNN)是機器學習中一種基本的分類方法,分類時,對于待預測樣本,根據(jù)K 個最近的訓練樣本的類別,通過多數(shù)表決的方式進行預測。光譜數(shù)據(jù)中,每一個波長點對應一個特征。

正如2.2 節(jié)所述,訓練集和測試集的選取是隨機的,由于不同的組合搭配會得出不同的正確率,因此將KNN 算法獨立試驗了100 000 次,每次都隨機選取每種火腿光譜數(shù)據(jù)的70%作為訓練集,30%作為測試集。結果如圖3所示。

圖3中,橫軸代表90個預測樣本中預測正確的個數(shù),縱軸代表100 000 次獨立試驗中某個預測正確個數(shù)出現(xiàn)的次數(shù)??梢钥闯?,結果基本符合正態(tài)分布。對其進行高斯曲線擬合,結果顯示均值為63.48,平均正確率為70.53%。其中最優(yōu)異的一次預測正確77 個樣本,最高正確率為85.56%。

圖3 KNN 算法循環(huán)100 000 次結果圖Fig.3 The results figure of KNN loops 100 000 times

2.4 支持向量機

支持向量機(Support vector machine,SVM)最早在上世紀90年代由Cortes 等[18]提出,是一種二分類模型,它的基本模型是定義在特征空間上的間隔最大的線性分類器。

將SVM 用于多分類問題有多種思路。本文采用一對一(One-versus-one),即每次只針對其中的某兩類構建分類器模型。當有N 個類別時,需要構建的分類器模型數(shù)量為N(N-1)/2。最終由這些分類器投票,由票數(shù)決定最終的類別。該思路不適用于類別數(shù)量較多的情況,這是因為會導致需要構建的分類器數(shù)量急劇上升。本試驗共有3 個類別,只需要構建3 個分類器。

核函數(shù)(Kernel function)是SVM 模型的一個重要參數(shù)。用與KNN 相同的方法將SVM 用于火腿測試樣本的預測。不同核函數(shù)的SVM 模型平均預測正確率見表2。

表2 SVM 模型不同核函數(shù)的平均預測正確率Table 2 The accuracy rate of different kernel functions of the SVM model

本試驗的SVM 模型采用線性核,其獨立試驗100 000 次結果見圖4。

圖4 SVM 算法循環(huán)100 000 次結果圖Fig.4 The results figure of SVM loops 100 000 times

擬合出的高斯曲線均值為71.58,平均正確率為79.53%。其中,最優(yōu)異的一次預測正確85 個樣本,最高正確率為94.44%

2.5 PCA

主成分分析 (Principal component analysis,PCA)是一種常用的無監(jiān)督學習方法,可以實現(xiàn)對數(shù)據(jù)的降維。光譜數(shù)據(jù)常有數(shù)千個光譜點,數(shù)據(jù)量大。利用PCA 處理數(shù)據(jù)可在有效保留光譜數(shù)據(jù)信息的同時,減少數(shù)據(jù)量,增加模型的建立分析速度。

用PCA 處理3 種火腿樣品共計300 個光譜數(shù)據(jù)后,以前3 個主成分得分繪制三維空間散點圖(圖5)。

其中,第1 主成分(PC1)、第2 主成分(PC2)和第3 主成分(PC3)分別包含了70.32%,3.68%和1.27%的方差信息。

從圖5可以看出,3 種火腿存在大量的重疊,難以直接區(qū)分。

選取不同個數(shù)的主成分,在該條件下分別結合KNN 和SVM,獨立重復1 000 次試驗,計算平均預測正確率,PCA+KNN 和PCA+SVM 結果如圖6所示。

圖6 不同主成分數(shù)量下的平均預測正確率Fig.6 The accuracy rate of different number of principal components

PCA+KNN 的平均預測正確率在主成分達到22 個時到達最大。PCA+SVM 的平均預測正確率則在主成分達到23 個后開始趨于穩(wěn)定,在主成分達到79 個時達到最大。

綜上,為保證分類正確率同時提升建模分析速度,對PCA+KNN 和PCA+SVM 分別選取主成分22 個和79 個。隨后獨立重復100 000 次試驗,比較最終結果。前22 個主成分包含的方差信息為80.79%,前79 個主成分包含的方差信息為89.13%。

將KNN、SVM、PCA+KNN、PCA+SVM 4 種方法的結果匯總,見表3。

表3 4 種方法結果匯總表Table 3 Summary of the results of the four methods

KNN 在結合PCA 算法后,不論是平均正確率還是最高正確率,均有小幅提升;PCA+SVM 相比SVM 提升0.89%的平均正確率。這是因為PCA 算法降低了計算的復雜度,避免了過擬合現(xiàn)象。此外,PCA 實現(xiàn)了對數(shù)據(jù)的降維,從而大大加快了建模分析速度,這在物質的快速鑒別中具有重要意義。

2.6 全連接神經網絡

全連接神經網絡 (Deep neural networks,DNN)是最樸素的神經網絡,也是當前廣為運用的神經網絡之一。相比于傳統(tǒng)的神經網絡模型,DNN更強調其隱藏層的深度。DNN 的基本原理如圖7所示。

圖7 DNN 原理示意圖Fig.7 The Schematic diagram of DNN

根據(jù)采集到的光譜數(shù)據(jù)的實際情況,建立由輸入層、隱藏層和輸出層構成的全連接神經網絡。處理初始數(shù)據(jù)并獲取屬性標簽,取學習速率為0.0005,通過ReLU 和Softmax 激活函數(shù)完成多分類任務。該網絡運行結果見圖8。

圖8 DNN 運行結果Fig.8 The result of DNN

通過該網絡的預測結果可看出,在完成150次訓練后,結果收斂到期望的誤差,準確率達85.56%,取得較好的結果。

3 結論

利用激光誘導擊穿光譜技術結合4 種機器學習算法區(qū)分3 種產地不同的火腿。KNN 的平均正確率為70.53%,SVM 為79.53%。對于干腌火腿的LIBS 光譜數(shù)據(jù),SVM 算法比KNN 算法具有更高的分類正確率。用PCA 對3 種火腿的光譜數(shù)據(jù)進行預處理,分別取前22 個主成分和前79 個主成分作為KNN 和SVM 的輸入變量,PCA+KNN 和PCA+SVM 的平均正確率分別為73.50%和80.42%,與直接使用KNN 和SVM 相比,分類正確率均有提升,并且建模分析速度大幅提升。利用全連接神經網絡構建的分類器,在150 次訓練后仍具有最高的分類正確率,為85.56%。本研究結果為干腌火腿的產地快速區(qū)分和檢測提供了新技術手段。

猜你喜歡
火腿金華正確率
張金華
歲朝清供
門診分診服務態(tài)度與正確率對護患關系的影響
生吃帕爾馬火腿
陳金華
蜘蛛王要“吃”藍臉兔
生意
品管圈活動在提高介入手術安全核查正確率中的應用
火腿培根,吃還是不吃?
生意