国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于太赫茲時域光譜的芝麻油品種識別研究

2020-04-01 10:44,2,*,2,2,2
食品工業(yè)科技 2020年4期
關(guān)鍵詞:芝麻油原始數(shù)據(jù)赫茲

,2,*,2,2,2

(1.河南工業(yè)大學(xué)信息科學(xué)與工程學(xué)院,河南鄭州 450001;2.河南工業(yè)大學(xué)糧食信息處理與控制教育部重點實驗室,河南鄭州 450001)

芝麻油是通過加工芝麻得到的一種食用油,可以加入菜肴中進(jìn)行調(diào)味,也可進(jìn)行烹飪、煎炸,香味濃郁,并且含有豐富的微量元素以及人體所需的脂肪酸和氨基酸等,日益受到人們的廣泛關(guān)注[1-2]。由于芝麻油的良好市場價值,個別制造商為了從中牟取利益,將其它成本低的植物油摻雜到芝麻油中,有的甚至將使用剩下的油渣中提取出來的油(如地溝油等)和芝麻油進(jìn)行勾兌,這不僅損害了消費(fèi)者的利益,還有可能會對消費(fèi)者造成一定的身體傷害[3-4]。

傳統(tǒng)的識別芝麻油的方法主要有電導(dǎo)法和色譜法,其中色譜法可以分為氣相色譜法、液相色譜法和薄層色譜法等[5],傳統(tǒng)方法有很多局限性,如樣品需要預(yù)處理、耗時長、操作復(fù)雜、損害樣品等。近年來光譜法成為一種新興的識別食用油的方法,光譜法可以不破壞樣品從而實現(xiàn)無損檢測,主要有近紅外光譜法、拉曼光譜法和熒光光譜法等[6]。馮蘇敏等[7]使用熒光光譜法結(jié)合化學(xué)計量法鑒別食用油和煎炸油,張嚴(yán)等[8]采用近紅外光譜法對花生油、芝麻油等五種油進(jìn)行了定性分析,結(jié)果顯示可以很好的鑒別出不同的食用油。但由于光譜信號重疊或光譜中包含有用信息較少,這些方法有一定的局限性。

圖1 太赫茲系統(tǒng)結(jié)構(gòu)圖Fig.1 Structure diagram of Terahertz system

太赫茲波是一種介于微波和紅外之間的電磁波,頻率范圍在0.3~10 THz,太赫茲輻射具有良好的透視性、安全性和光譜分辨率[9-10]。已經(jīng)在安全檢查、對化學(xué)和生物制劑的檢測、環(huán)境控制、醫(yī)療診斷等領(lǐng)域得到了廣泛的應(yīng)用[11-12]。目前在農(nóng)產(chǎn)品和食品安全領(lǐng)域的應(yīng)用也在不斷增多,如農(nóng)產(chǎn)品和食品含水量檢測、食品內(nèi)部品質(zhì)檢測和種子識別等[13]。廉飛宇等[14]采用THz-TDS對4種食用油進(jìn)行鑒別,結(jié)合化學(xué)計量法對太赫茲光譜進(jìn)行分析,實驗結(jié)果表明太赫茲技術(shù)可以很好的應(yīng)用在食用油鑒別上。李杰[15]將太赫茲技術(shù)應(yīng)用于成品油的混油識別,不同混油比例的油品折射率譜和吸收系數(shù)譜有所差異。殷明[16]采用寬頻太赫茲時域光譜儀結(jié)合化學(xué)計量法對食用油進(jìn)行定量和定性分析,實驗結(jié)果顯示模型分類準(zhǔn)確率可以達(dá)到100%。余俊杰[17]利用太赫茲時域光譜技術(shù)對摻假橄欖油進(jìn)行定性和定量分析,最終模型預(yù)測精度高,能夠快速檢測橄欖油的品質(zhì)。太赫茲光譜技術(shù)在油類鑒別上已經(jīng)有了很好的應(yīng)用,因此本文選用該方法進(jìn)行芝麻油的鑒別研究。

本文采用太赫茲時域光譜技術(shù)結(jié)合主成分分析和支持向量機(jī)來區(qū)分不同品種的芝麻油,分析了芝麻油在太赫茲時域光譜技術(shù)的作用下的特性,建立了一種快速鑒別芝麻油品種的定性分析模型,對比了不同核函數(shù)模型下的鑒別的準(zhǔn)確性,為不同品種芝麻油的鑒別提供了一種快速準(zhǔn)確的方法。

1 材料與方法

1.1 材料與儀器

本次實驗的樣品選自市面上四種不同品種芝麻油,均購于京東網(wǎng)上商城,其具體參數(shù)如表1所示。

表1 樣品信息Table 1 Sample information

本實驗采用的是大恒光電的CIP-TDS時域光譜儀,系統(tǒng)基本光路結(jié)構(gòu)如圖1所示。飛秒激光被分為兩束,一束為泵浦光,一束為探測光,泵浦光用來激發(fā)發(fā)射器產(chǎn)生太赫茲波,探測光則用來激發(fā)探測器來檢測太赫茲光。泵浦脈沖和探測脈沖出自于同一束激光,所以存在一定的時間關(guān)系,其中延遲線用來調(diào)節(jié)泵浦脈沖和探測脈沖之間的相對時間關(guān)系,具體實驗原理可見參考文獻(xiàn)[18-19]。為了防止空氣中水分含量對實驗結(jié)果的影響,測試時需要充氮氣,將儀器內(nèi)部濕度保持在5%以內(nèi)。

1.2 實驗方法

測量時使用光程為1 mm的標(biāo)準(zhǔn)比色皿,容量為0.35 mL,每種品種制備20組樣品。太赫茲儀器以鈦寶石飛秒激光器作為發(fā)射激光的光源,光譜范圍為0.1~3.5 THz,掃描范圍大于500 ps,掃描方式為透射式掃描。

隨機(jī)選擇樣品使用THz-TDS系統(tǒng)采集時域光譜,移動樣品改變測量點,重復(fù)操作三次,每個樣品得到三組光譜信息,取三次測量的平均值得到最終的樣品光譜,記為信號波形。掃描樣品之前測量不裝樣品的空比色皿的光譜作為參考信號,稱為參考波形。

對樣品信號和參考信號進(jìn)行快速傅里葉變換,得到樣品的頻譜As(ω)exp[-iφs(ω)]和參考信號的頻譜Ar(ω)exp[-iφ,(ω)]。本次實驗使用的光譜儀采用的是透射式的掃描方式,樣品的吸收系數(shù)和折射率可以通過與參考光譜的比較中得出來:

式(1)

式(2)

式中:α為吸收系數(shù);n為折射率;d為樣品厚度;c為真空中的光速。利用上述公式可以計算出樣品的吸收系數(shù)和折射率[9,20]。

1.3 模型與方法

1.3.1 主成分分析 主成分分析法(PCA)是一種常用的降維方法,可以在信息損耗很低的情況下減少數(shù)據(jù)集的維數(shù),使用較少的數(shù)據(jù)保留最大的原始數(shù)據(jù)的特性[21]。它的目標(biāo)是通過線性投影將高維數(shù)據(jù)映射到低維空間中,在高維數(shù)據(jù)中找到方差最大的方向,將數(shù)據(jù)映射到比原始數(shù)據(jù)維數(shù)低的空間中去[22]。

PCA的實現(xiàn)步驟包括以下幾點:

假設(shè)數(shù)據(jù)為m條n維。

a.原始數(shù)據(jù)組成矩陣X={X1,…,Xm},Xi={xi1,…,xin}∈Rn,i=1,…,m將樣本去中心化,為了方便表示仍用X表示去中心化后的矩陣。

b.計算協(xié)方差矩陣。

c.計算協(xié)方差矩陣的特征值和特征向量。

構(gòu)造特征方程:

d.將特征值降序排序得:

λa>λb>…>λr

e.選擇k個最大的特征值對應(yīng)的特征向量構(gòu)建到新空間中。

1.3.2 支持向量機(jī) 支持向量機(jī)(SVM)是一種分類器,適合小樣本的分類,它的工作原理是找到一個超平面,這個超平面可以將數(shù)據(jù)集分隔出來,使不同類別的數(shù)據(jù)到超平面的距離最短[23]。因為支持向量機(jī)是一種典型的二分類器,而實際應(yīng)用過程中遇到的問題一般都是多分類問題,因此需要使用間接的方法將支持向量機(jī)拓展應(yīng)用到多分類問題上。主要的方法有一對一法,一對多法和分層支持向量機(jī)的方法[24-25]。

一對一(one versus one)主要的思想是分別在兩個不同的類別之間和建立一個分類器,n個樣本需要建立n(n-1)/2個分類器。一對多(one versus rest)主要的思想是將一個類別作為一個類,其余的類別作為另一個類,n個樣本需要n個分類器。分層支持向量機(jī)主要的思想是將所有的數(shù)據(jù)分為兩個類,然后分別對這兩個類進(jìn)行二分類,直到子類中只剩下一個類為止[26-27]。

當(dāng)數(shù)據(jù)集線性不可分時,需要引用核函數(shù)來進(jìn)行分類。常用的核函數(shù)有線性核函數(shù)(linear)、徑向基核函數(shù)(rbf)、多項式核函數(shù)和(poly)雙曲正切核函數(shù)(sigmod),實驗時需要調(diào)節(jié)懲罰系數(shù)C和核函數(shù)系數(shù)(線性核函數(shù)只需調(diào)節(jié)懲罰系數(shù)C),使分類正確率達(dá)到最大。

1.3.3 PCA-SVM 原始數(shù)據(jù)集的維數(shù)如果很大,直接使用SVM進(jìn)行分類處理的速度會比較慢,因此可以采用PCA和SVM聯(lián)用的方法,即先采用PCA進(jìn)行降維,選擇前幾個基本可以代替原始數(shù)據(jù)集的主成分,使用這幾個主成分作為SVM的輸入,然后進(jìn)行分類[28]。本次實驗中原始太赫茲數(shù)據(jù)的維數(shù)為580,所以選擇PCA-SVM聯(lián)用,即采用PCA將原始數(shù)據(jù)的維度降到4維,再使用前四個主成分作為SVM的輸入。

1.4 數(shù)據(jù)處理

將所有樣品使用太赫茲儀器進(jìn)行檢測之后得到樣品的時域數(shù)據(jù),選取0~2.5 THz范圍內(nèi)的數(shù)據(jù)作為本次實驗的原始數(shù)據(jù),使用Origin軟件處理原始數(shù)據(jù),將光譜數(shù)據(jù)導(dǎo)入到Origin中,畫出時域圖,然后進(jìn)行傅里葉變換得到頻譜圖,輸入吸收系數(shù)和折射率的公式進(jìn)行計算得到相應(yīng)的吸收系數(shù)和折射率;對光譜數(shù)據(jù)進(jìn)行預(yù)處理,并對處理結(jié)果進(jìn)行比較,選取最優(yōu)的預(yù)處理方法;使用Spyder軟件進(jìn)行建模分析,將Origin中處理得到的數(shù)據(jù)輸入到PCA-SVM模型中,使用網(wǎng)格搜索算法尋取最優(yōu)參數(shù),得到最終的最優(yōu)模型。

2 結(jié)果與分析

2.1 頻譜分析

2.1.1 時域和頻域 通過太赫茲時域光譜系統(tǒng)獲得樣品的THz時域波形如下圖2所示。參考信號與樣品信號波形間有一定的時間延遲容易區(qū)分,但樣品信號之間的差異不明顯,樣品的太赫茲時域光譜可以反映不同的脂肪酸分子對太赫茲輻射的響應(yīng)。芝麻油中一般含有6種主要的脂肪酸,包括棕擱酸、硬脂酸、油酸、亞油酸、二十碳烷酸、亞麻酸。不同品種的芝麻油中含有的6中脂肪酸的組成比例沒有太大的差別,但是含量會有差異,如正道脂肪酸的含量為99.9%,蔡林記脂肪酸含量為99.7%,福臨門的脂肪酸含量雖然與正道的含量相同,南陽脂肪酸含量與蔡林記相同,但是由于原料的來源不同,會有細(xì)微的差別,所以需要借助儀器來進(jìn)行區(qū)分。

圖2 四種芝麻油的時域波形Fig.2 Time domain waveform of four kinds of sesame oil

直接觀測波形不能直接看出不同品種的差別,局部放大后可以觀測到在部分區(qū)間不同品種的波形相互分離,可以直接區(qū)分出來。

對時域數(shù)據(jù)進(jìn)行傅里葉變換后得到樣品的頻譜圖如下圖3所示,因為后面波段受到的干擾較大,所以選取0~2.5 THz范圍內(nèi)的波形進(jìn)行觀測。正道黑芝麻油的頻譜與其它三種品種芝麻油的頻譜有明顯的區(qū)分,蔡林記芝麻油、福臨門芝麻油和南陽芝麻油三條頻譜圖混疊在一起不能明顯的區(qū)分。

圖3 四種芝麻油的頻域波形Fig.3 Frequency domain waveform of four kinds of sesame oil

2.1.2 折射率和吸收系數(shù) 因為太赫茲時域數(shù)據(jù)中包含振幅和相位的信息,太赫茲時域光譜可以直接的計算樣品的吸收系數(shù)和折射率,不需要使用Kamers-Kroning關(guān)系進(jìn)行變換得到。所以直接使用公式(1)和公式(2)進(jìn)行計算得到折射率和吸收系數(shù)如下圖4和圖5所示。折射率譜在0~2.5 THz幾乎完全重疊,在2.5 THz之后開始波動分離(圖4)。吸收光譜正道與其它品種相分離,其它三個品種吸收光譜相近(圖5)。折射率與吸收系數(shù)相比,吸收系數(shù)的區(qū)分度相對較大,因此選用吸收系數(shù)作為后面分類的數(shù)據(jù)源。

圖4 四種芝麻油的折射率波形Fig.4 Refractive index waveforms for four types of sesame oil

圖5 四種芝麻油的吸收系數(shù)波形Fig.5 Absorption coefficient waveform of four sesame oils

2.1.3 數(shù)據(jù)預(yù)處理 吸收系數(shù)譜中正道可以明顯區(qū)分,其它三種接近重疊,因此為了更好的區(qū)分不同品種的芝麻油需要對數(shù)據(jù)進(jìn)行預(yù)處理。本次實驗采用了微分、積分和歸一化三種方法分別對數(shù)據(jù)進(jìn)行預(yù)處理,處理后的結(jié)果如圖6~圖8所示,由圖可知采用微分和積分處理后的數(shù)據(jù)依舊不容易區(qū)分,采用歸一化處理后的數(shù)據(jù)可以比較明顯的區(qū)分出不同品種的芝麻油,所以選擇歸一化處理作為最終的預(yù)處理方法,然后對預(yù)處理后的數(shù)據(jù)繼續(xù)采用機(jī)器學(xué)習(xí)的算法進(jìn)一步分類。

圖6 吸收系數(shù)微分預(yù)處理Fig.6 Differential preprocessing of absorption coefficient

圖7 吸收系數(shù)積分預(yù)處理Fig.7 Integral preprocessing of absorption coefficient

圖8 吸收系數(shù)歸一化預(yù)處理Fig.8 Normalization preprocessing of absorption coefficient

2.2 PCA分析

本次實驗原始數(shù)據(jù)為580維,直接使用SVM分類效率會比較低,所以先采用PCA降維,最終保留前4個主成分,使用前4個主成分代替原始數(shù)據(jù)集,作為SVM分類模型的輸入。保留的前4個成分對原始數(shù)據(jù)的貢獻(xiàn)率為99.506%,表1為各成分解釋總方差。為了直觀的觀測聚類效果,選取前兩個主成分畫出得分圖,前兩個主成分累計貢獻(xiàn)率為98.944%,圖9為前兩個主成分的得分圖,從圖中可以看出來四種不同品種的芝麻油有比較好的聚類作用,基本可以區(qū)分出不同品種的芝麻油。為了更加精確快速的區(qū)分,繼續(xù)采用SVM進(jìn)行分類。

表2 各成分解釋總方差Table 2 Each component explains the total variance

圖9 前兩個主成分得分圖Fig.9 Score charts of the first two principal components

2.3 模型分析

采用PCA-SVM聯(lián)用模型對樣品進(jìn)行分類,先對原始數(shù)據(jù)集進(jìn)行劃分,劃分?jǐn)?shù)據(jù)集使用Python中的train_test_split()函數(shù),其中參數(shù)stratify可以保證按照不同種類樣品的比例分配,訓(xùn)練集和測試集的比例為7∶3。為了得到更好的分類效果,實驗采用網(wǎng)格搜索算法得出分類準(zhǔn)確率最高的參數(shù)組合。主要對核函數(shù)(kernel)、懲罰函數(shù)(C)、核函數(shù)系數(shù)(γ)進(jìn)行搜索。不同核函數(shù)的分類準(zhǔn)確率如表3,線性核函數(shù)的總分類正確率為87.3%,分類準(zhǔn)確率在三類核函數(shù)中最低,多項式核函數(shù)總分類正確率為91.5%,比線性核函數(shù)高,徑向基核函數(shù)分類正確率最高,最高可以達(dá)到100%,即可以將全部樣品分類正確,說明在本次實驗中徑向基核函數(shù)是最佳的分類核函數(shù),最佳分類效果的參數(shù)為懲罰函數(shù)C為0.01,核函數(shù)系數(shù)為0.1。

表3 不同核函數(shù)的分類準(zhǔn)確率Table 3 Classification accuracy of different kernel functions

為了證明本文模型的性能,將本文的模型PCA-SVM與常見的分類模型隨機(jī)森林(RF)、K近鄰法(KNN)和邏輯回歸(LR)進(jìn)行對比,這三種算法是常見的機(jī)器學(xué)習(xí)分類算法。如表4所示,使用PCA對數(shù)據(jù)進(jìn)行預(yù)處理后,再進(jìn)行使用SVM進(jìn)行分類效果要優(yōu)于其它三種模型。對于PCA-SVM模型不同的核函數(shù)的分類效果會有一定的差異,由表3可知選擇徑向基作為核函數(shù),且選取參數(shù)懲罰函數(shù)C為0.01,核函數(shù)系數(shù)為0.1得到的模型分類效果最佳??偟膩碚f,PCA-SVM模型識別性能最佳。

表4 不同模型的分類準(zhǔn)確率Table 4 Classification accuracy of different models

3 結(jié)論

采用THz-TDS技術(shù)檢測了四種芝麻油在0~2.5 THz波段的時域和頻域譜,并計算得到折射率和吸收系數(shù)譜。實驗結(jié)果表明太赫茲時域譜結(jié)合化學(xué)計量法在不同品種芝麻油的分類上有很好的效果。不同品種的芝麻油含有不同類型的脂肪酸分子混合物,因此使用太赫茲技術(shù)進(jìn)行檢測時,不同脂肪酸分子的響應(yīng)反應(yīng)在光譜圖上,雖然直接觀測不明顯,但是結(jié)合化學(xué)計量法,分類準(zhǔn)確率在87%~100%。實驗同時表明太赫茲時域光譜技術(shù)在食品安全識別方面具有廣闊的應(yīng)用前景。

猜你喜歡
芝麻油原始數(shù)據(jù)赫茲
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
受特定變化趨勢限制的傳感器數(shù)據(jù)處理方法研究
干咳不止,試試芝麻油炒雞蛋
水酶法芝麻油與其他工藝芝麻油品質(zhì)差異研究
基于雙頻聯(lián)合處理的太赫茲InISAR成像方法
太赫茲低頻段隨機(jī)粗糙金屬板散射特性研究
太赫茲信息超材料與超表面
市售3種白芝麻油摻雜檢測
全新Mentor DRS360 平臺借助集中式原始數(shù)據(jù)融合及直接實時傳感技術(shù)實現(xiàn)5 級自動駕駛
芝麻油生產(chǎn)工藝對細(xì)辛素形成的影響