拱健婷 鄒慧琴 王佳宇 吳浩忠 王大仟 李佳慧 劉長(zhǎng)利 李莉
[摘要] 目的 建立不同產(chǎn)地當(dāng)歸的氣味指紋圖譜,挖掘其氣味的差異性并據(jù)此建立判別模型,并建立一種快速、準(zhǔn)確、可靠的鑒別不同產(chǎn)地當(dāng)歸藥材的方法。 方法 采用電子鼻對(duì)不同產(chǎn)地當(dāng)歸樣品進(jìn)行氣味分析,提取傳感器信號(hào)的最大值、平均值、最大斜率和積分值作為特征參數(shù),分別利用主成分分析法和支持向量機(jī)對(duì)特征參數(shù)進(jìn)行數(shù)據(jù)分析并建立判別模型,并考察組合特征對(duì)不同產(chǎn)地當(dāng)歸的鑒別效果。 結(jié)果 主成分分析無法有效區(qū)別當(dāng)歸產(chǎn)地。支持向量機(jī)能夠?qū)崿F(xiàn)當(dāng)歸產(chǎn)地的快速準(zhǔn)確鑒別,當(dāng)采用單一特征作為特征參數(shù)時(shí)鑒別效果一般,在測(cè)試集上的平均正判率為86.03%;當(dāng)采用組合特征作為特征參數(shù)時(shí)效果較好,兩特征組合、三特征組合平均正判率分別為86.76%、89.71%,四特征組合正判率最高,為91.18%。 結(jié)論 電子鼻技術(shù)可以準(zhǔn)確鑒別不同產(chǎn)地當(dāng)歸樣品,為中藥材產(chǎn)地快速鑒別提供新技術(shù)和新方法,不同模式識(shí)別算法和特征參數(shù)的篩選與優(yōu)化為電子鼻的數(shù)據(jù)挖掘在中醫(yī)藥研究中的應(yīng)用提供更多思路。
[關(guān)鍵詞] 電子鼻;當(dāng)歸;產(chǎn)地;主成分分析;支持向量機(jī);特征組合
[中圖分類號(hào)] R282.5 ? ? ? ? ?[文獻(xiàn)標(biāo)識(shí)碼] A ? ? ? ? ?[文章編號(hào)] 1673-7210(2019)10(a)-0039-05
Rapid identification research on Angelica sinensis from different producing areas based on electronic nose technology
GONG Jianting1,2 ? ZOU Huiqin3 ? WANG Jiayu4 ? WU Haozhong3 ? WANG Daqian1,2 ? LI Jiahui3 ? LIU Changli5 ? LI Li1,2
1.Beijing Institute of Chinese Medicine,Beijing ? 100035, China; 2.Beijing Chinese Medicine Hospital, Capital Medical University, Beijing ? 100010, China; 3.School of Chinese Materia Medica, Beijing University of Chinese Medicine, Beijing ? 102488, China; 4.Changchun Medical College, Jilin Province, Changchun ? 130031, China; 5.School of Traditional Chinese Medicine, Capital Medical University, Beijing ? 100069, China
[Abstract] Objective To establish a fast, accurate and reliable method for identification of Angelica sinensis of different origin, based on the odor fingerprint of Angelica sinensis of different origin, and the discrimination model was established based on the difference odor. Methods Odor analysis of Angelica sinensis samples from different habitats was carried out by electronic nose. The maximum, average, maximum slope and integral values of sensor signals were extracted as characteristic parameters. Principal component analysis and support vector machine were used to analyze the characteristic parameters. The discriminant model was established. And examine the identification effect of combination characteristics on Angelica sinensis from different habitats. Results Principal component analysis could not distinguish the origin of Angelica sinensis. Support vector machine could quickly and accurately identify the habitat of Angelica sinensis. When a single feature was used as a feature parameter, the identification effect was general, and the average positive detection rate on the test set was 86.03%. When combined features were adopted as the feature parameters, the effect was better. The average positive detection rate of the combination of two features and three features was 86.76% and 89.71% respectively, and the positive detection rate of the combination of four features was the highest, which was 91.18%. Conclusion Electronic nose technology can accurately identify Angelica sinensis samples from different regions, providing new technologies and methods for rapid identification of the origin of traditional Chinese medicine. The selection and optimization of different pattern recognition algorithms and characteristic parameters provide more ideas for the application of electronic nose data mining in traditional Chinese medicine research.
[Key words] Electronic nose; Angelica sinensis; Habitats; Principal component analysis; Support vector machine;Feature combination
當(dāng)歸來源于傘形科植物Angelica sinensis(Oliv.)Diels.的干燥根[1],始載于《神農(nóng)本草經(jīng)》[2],為中醫(yī)藥臨床常用大宗中藥材。當(dāng)歸主產(chǎn)于甘肅,目前云南、四川、湖北、青海、陜西、湖南、貴州等地亦有栽培[2-3]。道地性是當(dāng)歸質(zhì)量評(píng)價(jià)的重要內(nèi)容之一,可從源頭保證臨床療效,而產(chǎn)地作為中藥道地性的重要影響因素之一,隨著地理區(qū)域的改變,光照、環(huán)境溫度、降水量、土壤條件等生態(tài)因子會(huì)影響藥材質(zhì)量[4]。目前藥材產(chǎn)地區(qū)分主要依靠傳統(tǒng)性狀鑒別[5]和指紋圖譜技術(shù)[6]、分子鑒定技術(shù)[7],前者主觀性和經(jīng)驗(yàn)性較強(qiáng),不利于推廣應(yīng)用,其余兩種技術(shù)存在操作復(fù)雜、成本較高等局限性。因此,探尋準(zhǔn)確而快速鑒別不同產(chǎn)地當(dāng)歸的新方法十分必要。
電子鼻是一種智能仿生儀器,基于特定的氣敏傳感器陣列能夠分析、識(shí)別和檢測(cè)復(fù)雜氣味并全面地反映整體氣味特征[8]。與傳統(tǒng)檢測(cè)方法相比,電子鼻具有檢測(cè)速度快、操作簡(jiǎn)單、靈敏度高等優(yōu)點(diǎn),在食品、工業(yè)、農(nóng)業(yè)、環(huán)境監(jiān)測(cè)、醫(yī)藥等領(lǐng)域極具開發(fā)潛力[9]。近年來電子鼻也逐漸應(yīng)用到中藥產(chǎn)地區(qū)分中,借助電子鼻技術(shù)成功鑒別出喜馬拉雅紫茉莉[10]、黃連[11]、砂仁[12]、枳殼[13]的產(chǎn)地。此外,嚴(yán)輝等[14]發(fā)現(xiàn)我國不同產(chǎn)地當(dāng)歸藥材揮發(fā)油含量為0.28%~0.55%,王洮惠等[15]研究表明甘肅渭源、岷縣、四川3個(gè)產(chǎn)地當(dāng)歸揮發(fā)油含量和組成存在顯著差異,運(yùn)用電子鼻技術(shù)區(qū)分當(dāng)歸產(chǎn)地具有可行性。本研究分別選取當(dāng)歸氣味響應(yīng)曲線中的最大值、平均值、最大斜率、積分值作為特征參數(shù),應(yīng)用主成分分析和支持向量機(jī)建立判別模型,優(yōu)選不同特征參數(shù)和分類器的最優(yōu)組合,并考察組合特征對(duì)當(dāng)歸產(chǎn)地的鑒別效果,實(shí)現(xiàn)當(dāng)歸產(chǎn)地的快速、準(zhǔn)確鑒別,為電子鼻技術(shù)應(yīng)用于中藥研究領(lǐng)域提供參考。
1 材料與方法
1.1 材料
2017年10~12月,收集產(chǎn)自甘肅岷縣的3批當(dāng)歸樣品和青海西寧、四川北川、湖北神農(nóng)架、云南曲靖當(dāng)歸樣品各1批,經(jīng)北京市衛(wèi)生局臨床藥學(xué)研究所李莉研究員鑒定為傘形科植物Angelica sinensis(Oliv.)Diels.的干燥根。
1.2 實(shí)驗(yàn)儀器
研究選用法國Alpha M.O.S. α-FOX3000電子鼻測(cè)定當(dāng)歸氣味,儀器主要由HS-100自動(dòng)進(jìn)樣系統(tǒng)、氣體傳感器陣列以及模式識(shí)別系統(tǒng)組成,其12根金屬氧化物氣敏傳感器。見表1。
1.3 試驗(yàn)方法
當(dāng)歸粉碎過2號(hào)篩,精密稱取0.3 g置于10 mL頂空進(jìn)樣瓶,放入電子鼻自動(dòng)進(jìn)樣器樣品盤中。電子鼻孵化溫度設(shè)定為35℃,攪拌速度250 r/min,孵化時(shí)間360 s,進(jìn)樣體積1500 μL,注射溫度45℃,數(shù)據(jù)采集時(shí)間120 s,采集周期1 s,延滯時(shí)間600 s。各批次樣品平行采集氣味16次。
1.4 統(tǒng)計(jì)學(xué)方法
以12根傳感器的最大響應(yīng)值、平均值、最大斜率、積分值建立當(dāng)歸產(chǎn)地鑒別模型,數(shù)據(jù)采用SPSS 21.0和Python 2.7軟件進(jìn)行分析。
2 結(jié)果與分析
2.1 不同產(chǎn)地當(dāng)歸氣味雷達(dá)圖分析
采用電子鼻對(duì)5個(gè)產(chǎn)地當(dāng)歸進(jìn)行分析,不同產(chǎn)地當(dāng)歸揮發(fā)性氣味的電子鼻傳感器響應(yīng)雷達(dá)圖輪廓存在一定差別,最大斜率作為當(dāng)歸特征參數(shù)時(shí)甘肅產(chǎn)當(dāng)歸與其他樣品差距較大(圖1)。但從整體來看各產(chǎn)地樣品在氣味組成上比較一致,無法使用雷達(dá)圖直觀區(qū)分不同產(chǎn)地當(dāng)歸,需用統(tǒng)計(jì)學(xué)方法對(duì)其進(jìn)行處理。
2.2 主成分分析
主成分分析是電子鼻構(gòu)建判別模型時(shí)常用的統(tǒng)計(jì)方法,能消除數(shù)據(jù)中相互重疊的信息,實(shí)現(xiàn)用少數(shù)關(guān)鍵變量表征原變量的數(shù)據(jù)特征[16-18]。分別利用12根傳感器的最大值、平均值、最大斜率、積分值作為特征參數(shù)進(jìn)行主成分分析。以最大值作為當(dāng)歸的特征參數(shù)時(shí),主成分分析區(qū)分效果較好(圖2a);四川產(chǎn)當(dāng)歸均可以區(qū)分開,但其余4個(gè)產(chǎn)地樣品有重疊;平均值作為當(dāng)歸的特征參數(shù)主成分分析區(qū)分效果最差(圖2b);甘肅和四川產(chǎn)當(dāng)歸可以區(qū)分開,但云南、湖北、青海樣品有部分重疊,最大斜率、積分值作為當(dāng)歸特征參數(shù)主成分分析區(qū)分效果次之(圖2c~d)。在分類過程中主成分分析側(cè)重于提取樣本的描述特征,所以使用主成分分析直接處理當(dāng)歸產(chǎn)地的判別問題效果不理想。圖2是當(dāng)歸取不同特征參數(shù)的主成分分析圖,第1主成分和第2主成分累積方差百分比均大于90%,即前兩個(gè)主成分可以表征原始數(shù)據(jù)特征。
2.3 支持向量機(jī)
支持向量機(jī)是Vapnik和Corinna Cortes于1995年首先提出的[19],基于“結(jié)構(gòu)風(fēng)險(xiǎn)最小化”原理,擁有堅(jiān)實(shí)的理論基礎(chǔ)和良好的泛化能力,在解決小樣本、非線性和高維模式識(shí)別方面具有許多特有的優(yōu)勢(shì)[11,20]。對(duì)每個(gè)產(chǎn)地分別隨機(jī)抽取70%樣本構(gòu)成訓(xùn)練集,30%構(gòu)成測(cè)試集以評(píng)估所建支持向量機(jī)判別模型的性能,采用網(wǎng)格搜索方法尋找支持向量機(jī)最優(yōu)參數(shù),最終確定參數(shù)為:核函數(shù)為徑向基核函數(shù),核函數(shù)系數(shù)為0.4,懲罰項(xiàng)系數(shù)C為100,最大迭代次數(shù)為500次,訓(xùn)練停止誤差為1e-5。
支持向量機(jī)判別模型經(jīng)訓(xùn)練樣本訓(xùn)練之后,對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè),4種特征參數(shù)的訓(xùn)練集正判率均高于90%,從大到小依次為:最大值>平均值、積分值>最大斜率;最大值作為特征參數(shù)時(shí)的測(cè)試集正判率最高(表2)。綜合來看,用平均值、最大斜率、積分值表征電子鼻測(cè)試信號(hào)時(shí)其鑒別能力基本相同,而用最大值表征時(shí)鑒別能力效果較好。
2.4 多特征融合的支持向量機(jī)判別模型
電子鼻中氣敏傳感器的響應(yīng)是樣品多種成分的綜合反映,單一特征既不能全面有效地表征電子鼻對(duì)檢測(cè)樣品的響應(yīng)信息,也不能準(zhǔn)確體現(xiàn)樣品的差異性,降低了電子鼻檢測(cè)結(jié)果的準(zhǔn)確率[21]。在用各自單一類型特征結(jié)合支持向量機(jī)判別分析鑒別不同產(chǎn)地當(dāng)歸的基礎(chǔ)上,保持訓(xùn)練集和測(cè)試集不變,嘗試將特征組合以構(gòu)建電子鼻響應(yīng)信息的表征模式提升鑒別效果。為了排除隨機(jī)性影響,分別求取單特征、組合特征的平均預(yù)測(cè)準(zhǔn)確率。結(jié)果顯示:四特征組合>三特征組合>兩特征組合>單特征,提示特征組合的效果優(yōu)于單特征,特征組合支持向量機(jī)鑒別正確率總體上也有較為明顯的提高。此外,三特征組合測(cè)試集正判率為89.71%,效果相對(duì)于單特征和兩特征組合正判率分別提升3.68%和2.95%。因此,在用電子鼻鑒別產(chǎn)地時(shí)可以考慮采用三特征組合或四特征組合建模。
3 討論
在不同產(chǎn)地的當(dāng)歸區(qū)分研究中發(fā)現(xiàn),傳統(tǒng)的線性模式識(shí)別方法主成分分析對(duì)云南曲靖、湖北神農(nóng)架、青海西寧3個(gè)產(chǎn)地區(qū)分效果不佳,采用更先進(jìn)的模式識(shí)別算法支持向量機(jī)進(jìn)行建模分析提高電子鼻的識(shí)別能力,測(cè)試集識(shí)別準(zhǔn)確率均大于86%優(yōu)于主成分分析。由此來看,電子鼻技術(shù)聯(lián)合模式識(shí)別算法可以鑒別當(dāng)歸產(chǎn)地,為中藥材產(chǎn)地快速、客觀、綠色的鑒別提供新技術(shù)和新方法。
信號(hào)的準(zhǔn)確表征或提取有用信號(hào)是實(shí)現(xiàn)電子鼻準(zhǔn)確檢測(cè)的重要一環(huán),研究為探索有效表征不同產(chǎn)地當(dāng)歸氣味信息的特征參數(shù),提取了4種不同特征參數(shù)對(duì)不同產(chǎn)地當(dāng)歸進(jìn)行主成分分析及支持向量機(jī)判別,以最大響應(yīng)值作為特征參數(shù)時(shí)的區(qū)分效果較好,平均值作為特征參數(shù)主成分分析區(qū)分效果最差,最大斜率作為特征參數(shù)支持向量機(jī)判別效果最差,可見不同的特征參數(shù)適合不同的模型。
此外,對(duì)比了單一特征、組合特征表征電子鼻響應(yīng)信息時(shí)的鑒別效果,結(jié)果顯示,組合特征的鑒別效果優(yōu)于單特征值,四特征組合的鑒別效果更佳,用多特征融合模式可更有效地表征電子鼻對(duì)當(dāng)歸產(chǎn)地的響應(yīng)信息,有利于提高當(dāng)歸產(chǎn)地的鑒別正確率,為電子鼻信號(hào)表征提供了一種新思路。
[參考文獻(xiàn)]
[1] ?國家藥典委員會(huì).中華人民共和國藥典[S].一部.北京:中國醫(yī)藥科技出版社,2015:133.
[2] ?張瑛,王亞麗,潘新波.當(dāng)歸歷史資源分布本草考證[J].中藥材,2016,39(8):1908-1910.
[3] ?南海軍,滕希峰,王峰.不同產(chǎn)地當(dāng)歸藥材中藁本內(nèi)酯含量調(diào)查分析[J].食品與藥品,2015,17(6):393-395.
[4] ?廖保生,宋經(jīng)元,謝彩香,等.道地藥材產(chǎn)地溯源研究[J].中國中藥雜志,2014,39(20):3881-3888.
[5] ?陳有智,羅文蓉.侯嘉.不同產(chǎn)地當(dāng)歸的鑒定學(xué)研究[J].西部中醫(yī)藥,2012,25(5):25-30.
[6] ?胡傳芹,徐嘉良.不同產(chǎn)地當(dāng)歸指紋圖譜及聚類分析[J].中國食品學(xué)報(bào),2017,17(12):272-278.
[7] ?朱田田,晉玲,張裴斯,等.基于ISSR的甘肅不同產(chǎn)區(qū)栽培當(dāng)歸遺傳多樣性研究[J].中草藥,2015,46(23):3549-3557.
[8] ?Gardner JW,PN Bartlett. Electronic Noses:Principles and Applications [D]. New York:Oxford University Press,1999.
[9] ?鄒慧琴,劉勇,閆永紅,等.電子鼻技術(shù)及應(yīng)用研究進(jìn)展[J].傳感器世界,2011,17(11):6-11.
[10] ?林輝,趙婷,鄒慧琴,等.基于電子鼻技術(shù)的不同產(chǎn)地栽培及野生喜馬拉雅紫茉莉的鑒別研究[J].中華中醫(yī)藥雜志,2014,29(6):1834-1837.
[11] ?陶夢(mèng)琳,顧文濤,汪子青,等.基于支持向量機(jī)的黃連飲片產(chǎn)地識(shí)別研究[J].中草藥,2015,46(21):3173-3178.
[12] ?劉夢(mèng)楚,鄒曉紅,藍(lán)倫禮,等.基于電子鼻及頂空-氣質(zhì)聯(lián)用技術(shù)結(jié)合化學(xué)計(jì)量學(xué)區(qū)分不同產(chǎn)地的砂仁[J].中國實(shí)驗(yàn)方劑學(xué)雜志,2017,23(6):35-42.
[13] ?周華英,李鐘,駱德漢.基于仿生嗅覺技術(shù)的不同產(chǎn)地枳殼鑒別研究[J].中草藥,2017,48(19):4068-4072.
[14] ?嚴(yán)輝,段金廒,錢大瑋,等.我國不同產(chǎn)地當(dāng)歸藥材質(zhì)量的分析與評(píng)價(jià)[J].中草藥,2009,40(12):1988-1992.
[15] ?王洮惠,程自銀.不同產(chǎn)地當(dāng)歸揮發(fā)油的成分研究[J].藥物生物技術(shù),2013,20(6):535-537.
[16] ?Eriksson L,Johansson E,Kettaneh-Wold N,et al. Multi- and megavariate data analysis part 1:Basic principles and applications [J]. Umea,Sweden:Umetrics AB,2006.
[17] ?Costache GN,Coloran P. Combining pca-based datasets without retraining of the basis vector set [J]. Pattern Recognition Letters,2009,30(16):1441-1447.
[18] ?徐銳,張雪絨,郭巧生,等.9個(gè)產(chǎn)地夏枯草主要化學(xué)成分的比較分析[J].成都醫(yī)學(xué)院學(xué)報(bào),2017,12(5):551-554,566.
[19] ?Cortes C,Vapnik V. Support-vector networks,Proc. of the 25th Machine Leaning,1995,20:273-297.
[20] ?吳莎,劉啟安,李云,等.最小二乘支持向量機(jī)和偏最小二乘法在梔子中間體純化工藝近紅外定量分析中的應(yīng)用[J].中草藥,2015,46(7):990-997.
[21] ?殷勇,郝銀鳳,于慧春.基于多特征融合的電子鼻鑒別玉米霉變程度[J].農(nóng)業(yè)工程學(xué)報(bào),2016,32(12):254-260.
(收稿日期:2019-03-27 ?本文編輯:劉永巧)