錢曙,邢建國,王雨,程輝
(浙江工商大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,浙江 杭州,310018)
黃酒是世界上最古老的酒類之一,源于中國,與啤酒、葡萄酒并稱世界三大古酒。黃酒以大米、黍米、粟為原料,含有人體必需的多種氨基酸[1],其中包括有數(shù)種未知氨基酸。黃酒中的檢測(cè)方法主要有人為感官品評(píng)和理化指標(biāo)檢測(cè)。前者主要憑借人的主觀感官感受來判斷,而這種判斷往往只是初步的口味是否純正的判斷,無法做到對(duì)其中化學(xué)物質(zhì)的定量檢測(cè),并且受外界干擾和人為因素影響;后者是通過儀器判斷,方法主要有氣相色譜[2-3]、高效液相色譜[4-6]等,這些方法雖然準(zhǔn)確率較高,但是往往檢測(cè)時(shí)間長并且成本也比較高。
隨著傳感器技術(shù)的發(fā)展和各種分類算法的不斷演進(jìn)完善,目前已經(jīng)應(yīng)用于飲料[7]、酒[8-11]等食品的檢測(cè)。電子鼻的分類大多使用傳感器陣列的穩(wěn)態(tài)值作為特征值和PCA、SVM、BPNN等分類算法[12-14]。由于受傳感器數(shù)量自身物理特性限制,金屬氧化物型氣敏傳感器與氣體反應(yīng)至穩(wěn)態(tài)通常需要幾分鐘以上,恢復(fù)時(shí)間也較長[15],因此檢測(cè)一次往往需要較長時(shí)間,使得電子鼻的應(yīng)用范圍大大受限。
本研究從流速調(diào)制的角度設(shè)計(jì)了一種電子鼻系統(tǒng),通過改變進(jìn)氣流速,進(jìn)而調(diào)節(jié)傳感器陣列中氣體分子的分布,進(jìn)而提高識(shí)別正確率,縮短檢測(cè)時(shí)間。采用不同進(jìn)氣流速下對(duì)應(yīng)的區(qū)間梯度作為特征向量,并且在PCA算法的基礎(chǔ)上設(shè)計(jì)了一種改進(jìn)的自適應(yīng)PCA算法(AD-PCA)。將該系統(tǒng)應(yīng)用于黃酒酒齡分類,對(duì)比了AD-PCA、SVM、BPNN幾種分類算法,以驗(yàn)證此系統(tǒng)的有效性。
本文實(shí)驗(yàn)材料為2017年3月份生產(chǎn)的5種不同酒齡的瓶裝黃酒(每種黃酒5瓶)(見表1),采購自當(dāng)?shù)爻小?/p>
自主設(shè)計(jì)的基于流速調(diào)制的電子鼻系統(tǒng),其硬件模塊包括采樣閥、氣敏傳感器陣列、采樣氣腔、流量計(jì)、流速控制閥、氣泵、STM32F407微控制器、計(jì)算機(jī)和連接導(dǎo)管;其軟件模塊包括采樣控制模塊和數(shù)據(jù)處理模塊。硬件結(jié)構(gòu)框圖如圖1所示。
樣品氣體或潔凈的空氣由采樣閥進(jìn)入氣腔,采樣閥的作用是控制實(shí)驗(yàn)的進(jìn)行和排廢,若采樣閥中通過的是樣品氣體則進(jìn)行的是正常實(shí)驗(yàn)環(huán)節(jié);若采樣閥中通過的是潔凈的空氣則進(jìn)行的是一次實(shí)驗(yàn)結(jié)束后的排廢環(huán)節(jié)。氣體通過采樣閥后進(jìn)入氣腔,氣腔內(nèi)均勻分布有傳感器陣列,傳感器陣列由10個(gè)MOS型氣敏傳感器組成,氣體通過氣腔經(jīng)過流量計(jì)(用來直觀的顯示出當(dāng)前流速)再經(jīng)由流速控制閥以某一進(jìn)氣流速通過,本研究根據(jù)實(shí)驗(yàn)實(shí)際情況設(shè)計(jì)了100、200、300、400 mL/min四種進(jìn)氣流速,流速控制閥根據(jù)程序指令自動(dòng)切換進(jìn)氣流速。氣腔采集到的樣品數(shù)據(jù)值由采樣控制模塊傳輸?shù)綌?shù)據(jù)處理模塊,通過STM32F407微控制器的UART-to-USB發(fā)送到計(jì)算機(jī)端進(jìn)行數(shù)據(jù)處理和分析。
表1 黃酒種類Table 1 Kinds of Chinese yellow wine
圖1 硬件結(jié)構(gòu)示意圖Fig.1 Figure of hardware structure
電子鼻系統(tǒng)采用的氣敏傳感器型號(hào)如表2:
表2 所用氣敏傳感器列表Table 2 List of sensors
在模式識(shí)別和模式分類中,常用的分類算法如PCA和SVM通常采用達(dá)到穩(wěn)態(tài)的數(shù)據(jù)(如平均值,最大值)進(jìn)行降維分類,穩(wěn)態(tài)數(shù)據(jù)需要傳感器信號(hào)穩(wěn)定之后才能得到,而傳感器信號(hào)要達(dá)到穩(wěn)定一般需要較長時(shí)間,實(shí)驗(yàn)完成后的排廢時(shí)間也很長,兩次測(cè)量時(shí)間間隔長,使得檢測(cè)速度慢,檢測(cè)周期長。為了提高檢測(cè)速度,縮短檢測(cè)周期,提出了一種改進(jìn)的自適應(yīng)PCA算法進(jìn)行分類來驗(yàn)證實(shí)驗(yàn)結(jié)果,即使用不同流速下對(duì)應(yīng)的區(qū)間梯度作為特征向量。
組成的特征向量為:
實(shí)驗(yàn)過程中分別取每種酒齡的黃酒100 mL置于250 mL錐形瓶中,傳感器預(yù)熱1 h。樣品檢測(cè)前,先抽取60 s潔凈空氣,排出氣腔和導(dǎo)管內(nèi)的廢氣,待傳感器穩(wěn)定輸出后,依次以100、200、300、400 mL/min的進(jìn)氣流速進(jìn)行測(cè)試,每種流速的測(cè)試時(shí)間為10 s,之后由采樣控制模塊控制流速控制閥自動(dòng)切換到下一進(jìn)氣流速,總的檢測(cè)時(shí)間為40 s,一組檢測(cè)結(jié)束后,以最大進(jìn)氣流速通入潔凈空氣進(jìn)行2.5 min的排廢,每個(gè)樣本檢測(cè)25次。
本研究提出的一種改進(jìn)的自適應(yīng)的PCA算法(AD-PCA),使用不同流速對(duì)應(yīng)的區(qū)間梯度作為特征向量,圖2為傳感器對(duì)三年陳黃酒一次采樣的原始數(shù)據(jù),從圖中可以看出各傳感器對(duì)樣品氣體的響應(yīng)值曲線和響應(yīng)值變化情況,進(jìn)氣流速從小到大依次進(jìn)行切換,在圖中可以看出,隨著時(shí)間的推移,采樣點(diǎn)的增加,流速的每一次切換,曲線均有明顯的斜率上的變化,傳感器與氣體剛開始反應(yīng)時(shí),響應(yīng)值數(shù)據(jù)變化較慢,流速切換后反應(yīng)明顯加快,響應(yīng)值變化幅度明顯變大。
圖3是5種黃酒經(jīng)過AD-PCA算法處理后在不同流速下的三維散點(diǎn)圖,從圖中可以看到不同酒齡的黃酒分布的集中區(qū)域不同,不同流速下對(duì)應(yīng)不同酒齡的黃酒的分布情況不同,100 mL/min流速下,無法區(qū)分酒齡分布,200 mL/min時(shí),六年陳黃酒已經(jīng)區(qū)分開來,300 mL/min流速下,三年陳,六年陳和八年陳的黃酒已經(jīng)可以區(qū)分出來,最后400 mL/min流速下,各年份黃酒均區(qū)分出來。隨著流速的增大,不同酒齡黃酒的集中分布越顯著。相同種類黃酒分布比較集中,不同種類的黃酒分布則有一定距離。
圖2 三年陳黃酒傳感器響應(yīng)值圖Fig.2 Response value of 3 years Chinese yellow wine
圖3 四種流速下的AD-PCA三維散點(diǎn)圖Fig.3 Scatter plot of AD-PCA under four kinds flow rates
AD-PCA的分類正確率如圖4所示,可以看出,隨著流速的增大,4種不同流速下的分類正確率均有提高,最終在400 mL/min流速下達(dá)到最高。
圖5是SVM分類算法得到的分類圖,總的樣本數(shù)為125個(gè),每種黃酒的樣本總數(shù)為25個(gè),將其中的15個(gè)作為訓(xùn)練集,剩下的10個(gè)作為測(cè)試集。訓(xùn)練集總數(shù)為75個(gè),編號(hào)1~75;測(cè)試集總數(shù)為50個(gè),編號(hào)為1~50。其中1~10為三年陳,11~20為五年陳,21~30為六年陳,31~40為八年陳,41~50為十年陳。
圖4 不同流速下AD-PCA分類正確率Fig.4 Correct classification rate of AD-PCA underdifferent flow rates
從圖5中可以看出,50個(gè)測(cè)試集數(shù)據(jù)中有4個(gè)分類錯(cuò)誤,對(duì)應(yīng)不同酒齡黃酒的正確率為:五年陳、六年陳、十年陳黃酒的分類正確率為100%;三年陳、八年陳黃酒的分類正確率為80%,平均分類正確率為92%。
圖5 SVM分類圖Fig.5 Classification graph of SVM
BP神經(jīng)網(wǎng)絡(luò)構(gòu)建根據(jù)系統(tǒng)輸入輸出特點(diǎn)確定BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),由于樣本氣體輸入信號(hào)有40維(即4種流速下傳感器陣列中10個(gè)傳感器的響應(yīng)值,共40維),待分類信號(hào)共有5類(即5種不同酒齡黃酒),所以神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)為40-41-5,即輸入層有40個(gè)節(jié)點(diǎn),隱含層有41個(gè)節(jié)點(diǎn)(40維輸入信號(hào)和1維分類信號(hào)),輸出層有5個(gè)節(jié)點(diǎn)。
從原始數(shù)據(jù)中提取125個(gè)樣本數(shù)據(jù),其中100個(gè)作為訓(xùn)練樣本,剩下的25個(gè)作為預(yù)測(cè)樣本。圖6為測(cè)試集樣本的預(yù)測(cè)類別與實(shí)際類別的對(duì)比圖,得到的5種酒齡的黃酒分類正確率均為100%,可見使用BPNN算法能夠準(zhǔn)確的分類出黃酒酒齡。平均分類正確率為100%。一方面該結(jié)果也驗(yàn)證了AD-PCA中采用平均值作為特征向量得到的結(jié)果是比較準(zhǔn)確的,另一方面也可能是因?yàn)閿?shù)據(jù)樣本數(shù)較少,使得正確率結(jié)果較高。
圖6 預(yù)測(cè)分類和實(shí)際分類對(duì)比圖Fig.6 Comparison of forecast classification andactual classification
表3是3種算法的分類正確率表。采用AD-PCA算法,三年陳和六年陳黃酒最大分類正確率為100%,五年陳,八年陳和十年陳黃酒分別為88%,84%,96%,平均正確率為93.6%。采用SVM算法,五年陳,六年陳和十年陳正確率為100%,三年陳和八年陳為80%,平均正確率為92%。采用BPNN算法,三年陳,五年陳,六年陳,八年陳和十年陳正確率均為100%,平均正確率為100%。
表3 三種算法的分類正確率表Table 3 The correct classification rates of AD-PCA SVM and BPNN
自主設(shè)計(jì)了一種基于流速調(diào)制的電子鼻系統(tǒng),通過改變進(jìn)氣流速來最大程度擴(kuò)大傳感器對(duì)不同成分和不同濃度氣體的響應(yīng)范圍。使用改進(jìn)的自適應(yīng)主成分分析算法(AD-PCA)、支持向量機(jī)算法(SVM)、誤差反向傳播神經(jīng)網(wǎng)絡(luò)算法(BPNN)進(jìn)行分類識(shí)別。用黃酒酒齡分類驗(yàn)證該電子鼻系統(tǒng),AD-PCA得到93.6%的平均分類正確率,SVM得到92%的平均分類正確率,BPNN得到100%的平均分類正確率,證明本系統(tǒng)可以有效縮短檢測(cè)時(shí)間,提高分類正確率,做到快速分類。
[1]陳佩仁,陳江萍,王林秋,等.黃酒產(chǎn)業(yè)發(fā)展的前世今生和未來淺析[J].釀酒,2015,42(4):111-114.
[2]嚴(yán)冬霞,高紅波. 靜態(tài)頂空—?dú)庀嗌V法分析不同年份黃酒中主要香氣成分[J]. 釀酒科技,2011(7):114-117,120.
[3]胡健,池國紅,吳苗葉,等. 利用風(fēng)味物質(zhì)鑒別黃酒產(chǎn)地[J]. 釀酒科技,2009(6):17-19.
[4]江偉,蘭玉倩,黃毅,等. 固相微萃取與氣相色譜—質(zhì)譜聯(lián)用法對(duì)不同酒齡黃酒的微量風(fēng)味分析與應(yīng)用[J]. 食品與發(fā)酵工業(yè),2011,37(2):144-150.
[5]鮑忠定,孫培龍,許榮年. 動(dòng)態(tài)頂空進(jìn)樣GC/MS法測(cè)定不同酒齡紹興酒的揮發(fā)性醛類化合物[J]. 釀酒科技,2007(1):97-98.
[6]諸葛慶,李博斌,鄭云峰,等. 反相高效液相色譜法測(cè)定黃酒中的β-苯乙醇[J]. 食品科學(xué),2009,30(14):175-177.
[7]楊智, 王楠, NIAMAT U, 等. 電子鼻對(duì)紅棗乳酸發(fā)酵飲料的品質(zhì)分析[J]. 西北農(nóng)業(yè)學(xué)報(bào), 2015, 24(11): 149-156.
[8]楊利軍,湯旭祥,張千金,等. 基于智能電子鼻系統(tǒng)對(duì)不同品牌啤酒區(qū)分[J]. 食品科學(xué), 2011,32(22):184-187.
[9]徐晚秀, 李臻峰, 張振, 等. 基于電子鼻的中國白酒酒齡檢測(cè)[J]. 食品與發(fā)酵工業(yè), 2016, 42(2): 144-149.
[10]張振, 李臻鋒, 宋飛虎, 等. 電子鼻結(jié)合化學(xué)計(jì)量法用于檢測(cè)黃酒酒齡[J]. 食品與機(jī)械, 2015(3): 57-61.
[11]繆璐, 何善廉, 莫佳琳, 等. 電子鼻技術(shù)在朗姆酒分類及原酒識(shí)別中的應(yīng)用研究[J]. 中國釀造, 2015, 34(8): 106-110.
[12]SHI Z,YU T,ZHAO Q,et al.Comparison of algorithms for an electronic nose in identifying liquors[J]. Journal of Bionic Engineering,2008,5(3):253-257.
[13]FANY,XUE Y,LI Z, et al. Analyzing the flavor compounds in Chinese traditional fermented shrimp pastes by HS-SPME-GC/MS and electronic nose[J]. Journal of Oceanic University of China,2017,16(2):311-318.
[14]TANG X W, HE H J, GENG L H, et al. Evaluation of maturity and flavor of melons usingan electronic nose[J]. Agricultura l Science & Technology, 2011, 12(3): 447-450.
[15]周宇,孟慶浩,亓培鋒,等. 基于單類支持向量機(jī)的電子鼻在白酒真假識(shí)別中的應(yīng)用[J]. 傳感技術(shù)學(xué)報(bào),2015,28(12):1 741-1 746.