劉 旭,余 雋,李中洲,魏廣芬,黃正興,朱慧超
(1.大連理工大學(xué) 電子信息與電氣工程學(xué)部 遼寧省集成電路與生物醫(yī)學(xué)電子系統(tǒng)重點實驗室,遼寧 大連 116024;2.山東工商學(xué)院 信息與電子工程學(xué)院,山東 煙臺 264005)
蘋果的新鮮程度與其氣味有著密切聯(lián)系,研究表明蘋果存儲過程中產(chǎn)生氣體主要成分有酯類、醇類、乙烯等氣體,蘋果在變質(zhì)(如出現(xiàn)爛疤、損傷)或腐敗時其散發(fā)的乙烯濃度增加,并且可能產(chǎn)生的硫化氫(H2S)、烷烴、氨類等氣體[1,2]。這些氣體大都具有一定的還原性,所以,使用金屬氧化物半導(dǎo)體式傳感器可以探測到貯藏蘋果氣味的變化,進而通過電子鼻技術(shù)識別變質(zhì)蘋果的出現(xiàn)。
Ghasemi-Varnamkhasti M等人采用基于8個金屬氧化物半導(dǎo)體(MOS)傳感器陣列的電子鼻系統(tǒng),結(jié)合主成分分析(principal component analysis,PCA)、線性判別分析(linear discriminant analysis,LDA)和支持向量機(support vector machine,SVM)等模式識別方法,研究草莓的分類問題[3]。另外有學(xué)者使用電子鼻測試不同狀態(tài)的水果氣味變化,進而預(yù)測水果的壓損程度或新鮮程度[4,5]。而具有多傳感器的電子鼻系統(tǒng),常面臨高功耗、復(fù)雜的傳感電路等問題。同時,研究表明,改變單只傳感器的工作溫度等方法能夠產(chǎn)生多維響應(yīng)信號[6,7],從而構(gòu)筑虛擬傳感器陣列以減少實際傳感器數(shù)量,進而降低功耗和系統(tǒng)復(fù)雜度。
本文開發(fā)了一種基于虛實融合微熱板氣體傳感器陣列的便攜式電子鼻。微熱板氣體傳感器陣列中的4 只傳感器均工作在溫度掃描模式下,監(jiān)測蘋果在貯藏期間的氣體信息。通過溫度掃描測試大幅擴展傳感器信號陣列規(guī)模的同時采集了更多樣本信息。對于在不同品質(zhì)的蘋果氣氛實驗測得數(shù)據(jù),提出了高低工作溫度特征值混合的提取樣本方法,然后對提取樣本進行LDA 算法降維和K 最近鄰(Knearest neighbor,KNN)算法分類。最后,分別將本文研究與傳統(tǒng)單一溫度下工作方式以及多溫度非穩(wěn)態(tài)工作的電子鼻進行了對比,討論了方法的可行性和分類效果。
傳感器采用課題組內(nèi)自主研發(fā)基于互補金屬氧化物半導(dǎo)體(complementary metal-oxide semiconductor,CMOS)+MEMS工藝的四陣列微熱板傳感器芯片,如圖1 所示。每只微熱板氣體傳感器由懸空介質(zhì)薄膜、加熱電極、氣敏電極以及氣敏材料組成[8]。氧化錫(SnO2)和三氧化鎢(WO3)為金屬氧化物氣敏材料研究熱點,且對于還原性氣體有良好響應(yīng)[9]。所以,1#、2#涂敷了SnO2氣敏材料,3#、4#涂敷了WO3材料。因為懸空結(jié)構(gòu)具有良好的絕熱性能,所以微熱板氣體傳感器僅需十幾毫瓦(mW)的功耗就能達到氣敏材料所需的數(shù)百攝氏度(℃)的工作要求[10]。
圖1 傳感器工作原理
如圖1(b)所示,傳感器的加熱電阻和氣敏電阻分別等效為可變加熱電阻Rh和可變氣敏電阻RS。VH和VCC分別為加熱電壓和氣敏測試電壓,采集模塊采集負載電阻RL的電壓值作為輸出,體現(xiàn)了氣敏電阻值RS的實時變化
Vout=(RL×VCC)/(RL+RS) (1)
RL為10 MΩ,VCC為3.3 V,測定Rh的I-VH曲線得到在不同加熱電壓值下的Rh大小。計算微熱板傳感器的工作溫度TS如下
式中 電阻溫度系數(shù)(temperature coefficient of resistance,TCR)經(jīng)標(biāo)定為1.95×10-3/℃,T0為室溫21 ℃,R0為216 Ω。
被測樣品為100 個富士蘋果,包括品質(zhì)良好和有瑕疵的蘋果各50 個。表皮狀態(tài)無缺陷、果徑大于70 mm 的為“品質(zhì)良好”,如圖2(a)所示;果徑小于55 mm,并且表皮上出現(xiàn)多處果銹的為“有瑕疵”,如圖2(b)所示?!盎旌咸O果”樣本則是從2 種蘋果樣本中分別隨機抽取合并組成。將電子鼻置于5 L 的密閉玻璃容器內(nèi),設(shè)置恒溫和多溫度2種電子鼻的工作模式分別進行氣氛采集實驗。
圖2 測試用富士蘋果照片
恒溫條件下微熱板傳感器工作溫度為200 ℃,每個測試周期持續(xù)10 min;多溫度工作模式下,設(shè)定100,150,200,250,300,350 ℃6個微熱板工作溫度,每個溫度持續(xù)10 min,共計1 h為1個測試周期。分別在實驗室空氣氣氛、品質(zhì)良好的富士蘋果氣氛、有瑕疵富士蘋果氣氛以及混合2 種富士蘋果氣氛下進行數(shù)據(jù)采集。為了產(chǎn)生穩(wěn)定的氣體樣本,從待測蘋果樣本中隨機取2個富士蘋果放置于玻璃容器之中,使其氣味在密封容器內(nèi)自然擴散,等待0.5 h 后氣氛穩(wěn)定,再進行傳感器測試。1 個周期傳輸數(shù)據(jù)完成后,將蘋果取出,待玻璃容器敞開放置0.5 h后進行下一次實驗。
將氣敏電阻RS在反應(yīng)氣氛中的阻值Rg與在空氣中的阻值Ra之比作為響應(yīng)值RES,由式(1)得
式中 Voutg為傳感器在反應(yīng)氣氛中的傳輸電壓值,Vouta為傳感器在空氣氣氛中的傳輸電壓值。并且對響應(yīng)值RES進行了歸一化,如式(4)
式中 RESmax為所有樣本數(shù)據(jù)的最大值,RES 為所有樣本數(shù)據(jù)的最小值,這樣就能得到標(biāo)準(zhǔn)化后的數(shù)據(jù)RESnew。首先根據(jù)其曲線特點進行了特征值點的選取,然后采用LDA算法對特征矩陣進行了降維。最后采用KNN 算法對降維后標(biāo)準(zhǔn)化的數(shù)據(jù)進行分類,并使用3 折交叉驗證分類的準(zhǔn)確率。
1)特征降維
采用LDA 算法[11]將傳感器標(biāo)準(zhǔn)化后的n 維數(shù)據(jù)RESnew向2 維投影,尋找投影到2 維最佳的投影基向量(ω1,ω2),為了使不同類別的數(shù)據(jù)的類別中心之間的距離盡可能大,同時同一種類別數(shù)據(jù)的投影點盡可能接近。定義了Sb為類間散度矩陣,Sw為類內(nèi)散度矩陣。其定義式如下
式中 Nj(j =1,2,3)為第j類樣本的個數(shù),μj為第j類樣本的均值向量,Σj為第j類樣本的協(xié)方差。求解目標(biāo)式最大值問題,如式(7)
進而求解廣義瑞利商的特征值問題,如式(8)
此時的最佳投影向量(ω1,ω2)為SSb的前2 個最大特征值(λ1,λ2)所對應(yīng)的特征向量構(gòu)成的矩陣。
2)蘋果狀態(tài)分類算法
在KNN算法[12]中,本文采用3 次閔氏距離計算點與點之間的距離,若n維空間有兩點x,y,計算公式如式(9)
最后對于不同的K 值進行了訓(xùn)練,從而得到最適宜K值條件下的最高準(zhǔn)確率。
電子鼻系統(tǒng)的整體架構(gòu)如圖3所示。
圖3 系統(tǒng)整體架構(gòu)
系統(tǒng)軟件分為集成在下位機硬件系統(tǒng)上的程序和用于接收和處理數(shù)據(jù)的上位機電腦軟件算法流程,如圖4所示。
圖4 整體軟件與算法流程
系統(tǒng)一個測試周期內(nèi)所采集到的負載電阻RL的電壓值Vout數(shù)據(jù)如圖5所示,從100 ℃到350 ℃對傳感器進行溫度掃描。單個溫度對應(yīng)的600 s 周期內(nèi),響應(yīng)值在前300 s呈現(xiàn)增加或減少趨勢,在后300 s趨于穩(wěn)定。取每個溫度第300,400,500 s 的響應(yīng)值作為穩(wěn)定階段初始、中間和后期3類特征點,對原始曲線的穩(wěn)定階段進行表征。4只傳感器在6種工作溫度下相當(dāng)于構(gòu)成4 ×6 的虛實結(jié)合傳感器陣列,每只傳感器又包含3類特征。
圖5 傳感器在不同氛圍下的典型響應(yīng)曲線
使用軟件對在6種溫度下不同氣氛中的特征樣本進行單因素方差分析,結(jié)果表明,200,250,300,350 ℃溫度下不同氣氛的特征樣本差異較大,所以選用了這4 種溫度下的數(shù)據(jù)進行后續(xù)處理。經(jīng)檢驗的多重比較結(jié)果表明,350 ℃的特征樣本品質(zhì)良好的蘋果和混合蘋果差異不大。為了進一步增大不同氣氛特征樣本的差異,將200 ℃和300 ℃的同種特征點、250 ℃和350 ℃的特征點進行混合。如圖6 為不同氣氛中,混合溫度所提取的歸一化響應(yīng)值特征樣本,每條曲線為4只傳感器在2個溫度下采集的同種特征點。取10 個測試周期的數(shù)據(jù)作為訓(xùn)練集,簡稱為多溫度穩(wěn)態(tài)訓(xùn)練集。
圖6 4 種溫度的穩(wěn)態(tài)混合特征值樣本
取200,250,300,350 ℃各自第50 s和150 s的響應(yīng)值以及300~500 s的平均響應(yīng)值作為初始、中間和穩(wěn)定3類特征點,對原始線進行表征,進一步驗證取每種溫度所有階段對分類結(jié)果的影響,簡稱為多溫度非穩(wěn)態(tài)訓(xùn)練集。
單因素方差分析的多重比較結(jié)果表明在200 ℃工作模式下,4只傳感器對不同品質(zhì)的蘋果表現(xiàn)的顯著性差異最大。因此,作為對比,只取200 ℃下20個測試周期的數(shù)據(jù)作為訓(xùn)練集,簡稱為單一溫度穩(wěn)態(tài)訓(xùn)練集。
圖7(a)為多溫度穩(wěn)態(tài)訓(xùn)練集進行LDA降至2 維后的效果,前2個特征LD1 與LD2 包含了98%以上特征值信息。對于4種特征值混合樣本的LDA降維,品質(zhì)良好的蘋果、有瑕疵的蘋果以及混合蘋果的樣本各自的聚類效果較好。不同品質(zhì)的蘋果樣本重疊較少,LDA 算法降維的整體效果較好。相較于多溫度穩(wěn)態(tài)訓(xùn)練集,多溫度非穩(wěn)態(tài)樣本的LDA降維結(jié)果如圖7(b)所示。前2 個特征LD1 與LD2包含了98%以上特征值信息,整體上取得了較好的降維效果,有瑕疵的蘋果樣本與其他2 種氣氛下的樣本的類間間距較大,但部分混合蘋果和品質(zhì)良好的蘋果樣本有混疊。單一溫度穩(wěn)態(tài)訓(xùn)練集的前2 個特征LD1 與LD2 包含了97%以上特征值信息,降維效果如圖7(c)。不同氣氛的蘋果聚類效果不明顯,有瑕疵的蘋果樣本類內(nèi)間距較大,不同氣氛的蘋果樣本混疊較多,尤其是品質(zhì)良好的蘋果樣本與混合蘋果樣本存在大量混疊情況。
圖7 LDA降維結(jié)果
由LDA的降維結(jié)果可見,在微熱板4 種工作溫度穩(wěn)定階段混合的特征樣本,相較于多溫度非穩(wěn)定階段混合特征樣本以及單一溫度的特征樣本進行LDA降維后的效果更優(yōu)。
將LDA 降至二維過后的樣本進行KNN 算法分類決策。多溫度穩(wěn)態(tài)混合特征樣本、非穩(wěn)態(tài)樣本和單一溫度的穩(wěn)態(tài)樣本的KNN分類混淆矩陣分別如圖8(a)~(c)所示。其中,1、2、3 類分別為品質(zhì)良好、有瑕疵和混合蘋果樣本。各種氣氛樣本數(shù)量為60、總樣本數(shù)量為180一致的條件下,使用4種穩(wěn)態(tài)溫度下混合的特征樣本進行分類。結(jié)果表明,對于品質(zhì)良好的蘋果、有瑕疵的蘋果以及混合氛圍中的蘋果的分類準(zhǔn)確率都有不同程度的提升,尤其相較于其他2種方法減少了品質(zhì)良好的蘋果被判定為有瑕疵的蘋果和混合蘋果的數(shù)量。
圖8 不同樣本KNN算法分類混淆矩陣
當(dāng)K值(近鄰樣本數(shù))在1~60 變化時,使用三折交叉驗證KNN算法的準(zhǔn)確率如圖9 所示。多溫度穩(wěn)態(tài)的混合特征樣本的最高準(zhǔn)確率為98.3%,相較于多溫度非穩(wěn)態(tài)混合特征樣本的90%以及單一穩(wěn)態(tài)溫度的76.13%的最高準(zhǔn)確率有了大幅提升,進而驗證了方法的有效性。
圖9 不同溫度樣本準(zhǔn)確率隨K值變化
本文設(shè)計的集成4 只傳感器陣列的便攜式電子鼻系統(tǒng),采用了溫度掃描工作模式采集蘋果的氣味信息,使用虛實融合的傳感器陣列增加樣本數(shù)量。對在不同品質(zhì)的蘋果氣氛中用多微熱板工作溫度采集的實驗數(shù)據(jù),提出了利用其穩(wěn)定階段提取特征樣本進行高低溫度混合的特征值提取方法。并對于提取的特征樣本進行了LDA 降維和KNN 算法分類,與常規(guī)的單一溫度加熱以及多溫度非穩(wěn)態(tài)的方式相比,最高分類準(zhǔn)確率達到了98.3%。并設(shè)計了用于人機交互的圖形用戶界面上位機軟件,能夠有效地對于蘋果品質(zhì)進行監(jiān)測,對于貯藏品質(zhì)良好的蘋果中出現(xiàn)有瑕疵的蘋果實現(xiàn)準(zhǔn)確“報警”。實現(xiàn)了用于蘋果品質(zhì)監(jiān)測的簡單、可視化電子鼻系統(tǒng)設(shè)計。