于瑋,周卓彥,孫仲謀,張興龍,劉玉柱,2,3?
(1南京信息工程大學(xué),江蘇省大氣海洋光電探測(cè)重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210044;2江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,江蘇 南京 210044;3南京信息工程大學(xué),江蘇省氣象光子學(xué)與光電探測(cè)國(guó)際合作聯(lián)合實(shí)驗(yàn)室,江蘇 南京 210044)
薔薇屬植物在日常生活中較為常見(jiàn),主要包括玫瑰、薔薇和月季。薔薇屬植物不僅可以用于園林觀(guān)賞[1],同時(shí)也具有重要的食用價(jià)值[2]、經(jīng)濟(jì)價(jià)值[3]和藥用價(jià)值[4]。例如,在香料行業(yè)中,薔薇屬植物是重要的花香來(lái)源,從薔薇屬植物中提取的精油具有重要的香料價(jià)值[5]。而我國(guó)薔薇屬芳香資源具有多樣性,因此,快速、準(zhǔn)確地辨別薔薇屬植物具有重要意義。
辨別薔薇屬植物的方法有很多,如細(xì)胞學(xué)[6]通常利用染色體的結(jié)構(gòu)、數(shù)目和核型來(lái)進(jìn)行區(qū)分,孢粉學(xué)[7]借助光鏡和掃描電子顯微鏡對(duì)花粉的孔、溝數(shù)目、花粉壁以及紋飾等特點(diǎn)進(jìn)行探討,形態(tài)學(xué)[8]通過(guò)觀(guān)察葉片或種皮的微形態(tài)來(lái)探討和劃分植物間的親緣關(guān)系,分子生物學(xué)[9]在DNA序列的基礎(chǔ)上為植物辨別提供了可靠證據(jù)。但這些方法大都比較復(fù)雜,需要對(duì)樣品進(jìn)行預(yù)處理,過(guò)程繁瑣,且檢測(cè)時(shí)間較長(zhǎng),對(duì)實(shí)驗(yàn)環(huán)境要求也較高。
激光誘導(dǎo)擊穿光譜(LIBS)技術(shù)是一種全新的物質(zhì)元素分析方法,其可以分析元素周期表中幾乎所有的元素,同時(shí)又具有實(shí)時(shí)、原位、在線(xiàn)、靈敏度高、可多元素同時(shí)分析的優(yōu)點(diǎn)[10,11],可用于定性[12,13]和定量[14]分析,在多個(gè)領(lǐng)域得到了廣泛應(yīng)用[15?18]。廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)是一種神經(jīng)網(wǎng)絡(luò)模型,最早由Specht[19]提出。GRNN是徑向基神經(jīng)網(wǎng)絡(luò)的一種,具有很強(qiáng)的非線(xiàn)性映射能力和學(xué)習(xí)速度,網(wǎng)絡(luò)最后收斂于樣本聚集較多的優(yōu)化回歸[20]。在樣本數(shù)據(jù)量少時(shí),GRNN也能達(dá)到不錯(cuò)的預(yù)測(cè)效果,還可以處理不穩(wěn)定數(shù)據(jù)。
本文將LIBS技術(shù)與GRNN相結(jié)合,用于檢測(cè)和辨別薔薇屬植物。首先,利用LIBS技術(shù)原位在線(xiàn)探測(cè)薔薇屬花,從光譜數(shù)據(jù)中可觀(guān)察到三種花共有的元素包括C、H、O、N、Mg、Ca、Na和K,并且在月季和玫瑰的光譜中還可以觀(guān)測(cè)到Mn的特征譜線(xiàn)。此外,在玫瑰、薔薇和月季的光譜中都觀(guān)察到了CN,通過(guò)計(jì)算三種花光譜中CN的振動(dòng)溫度和轉(zhuǎn)動(dòng)溫度,驗(yàn)證了實(shí)驗(yàn)條件的相似性。其次,通過(guò)對(duì)比分析玫瑰、薔薇和月季的光譜圖,選取強(qiáng)度差異較顯著的特征譜線(xiàn)作為變量。本研究基于Mn、Ca、Na的15條特征譜線(xiàn)建立非線(xiàn)性判別模型GRNN。挑選玫瑰、薔薇和月季的各100個(gè)光譜數(shù)據(jù),其中90個(gè)作為訓(xùn)練集,剩余10個(gè)作為測(cè)試集。結(jié)果顯示,GRNN可以很好地區(qū)分三種花,預(yù)測(cè)判別的正確率可達(dá)93.3%。
實(shí)驗(yàn)裝置示意圖如圖1所示。本研究采用Continuum公司的Nd:YAG單脈沖激光器。激光器波長(zhǎng)為1064 nm,脈沖持續(xù)時(shí)間為6 ns,調(diào)Q時(shí)間為1.5μs,脈沖重復(fù)頻率為10 Hz。實(shí)驗(yàn)樣品為購(gòu)買(mǎi)于商店的玫瑰、薔薇和月季,如圖2所示。其中,玫瑰和薔薇產(chǎn)自云南,月季產(chǎn)自江蘇。樣品僅作烘干處理,未經(jīng)任何化學(xué)處理。調(diào)節(jié)激光脈沖能量到260.34 mJ,使信號(hào)穩(wěn)定并達(dá)到理想的實(shí)驗(yàn)效果。激光通過(guò)三個(gè)反射鏡改變光路,再通過(guò)聚焦透鏡(焦距為150 mm)聚焦于花瓣上,產(chǎn)生高溫等離子體,通過(guò)光纖探頭耦合進(jìn)入光纖,傳輸?shù)剿耐ǖ拦庾V儀,再將信號(hào)傳送到計(jì)算機(jī)進(jìn)行光譜分析。采用的光譜儀產(chǎn)自Avantes公司,光譜窗口范圍是200~890 nm,分辨率為0.1 nm。
圖1 實(shí)驗(yàn)裝置示意圖Fig.1 Schematic diagram of experimental setup
圖2 實(shí)驗(yàn)樣品圖(玫瑰,薔薇,月季)Fig.2 Picture of experimental samples(Rosa rugosa Thunb.,Rosa sp.and Rosa chinensis Jacq.)
將激光打在玫瑰、薔薇和月季的花瓣內(nèi)側(cè),得到三種花的光譜信息。由于光譜儀存在漂移現(xiàn)象,要對(duì)得到的光譜數(shù)據(jù)進(jìn)行校正。與NIST數(shù)據(jù)庫(kù)中的特征譜線(xiàn)進(jìn)行比對(duì)后,對(duì)光譜進(jìn)行標(biāo)定。薔薇屬植物的花香成分主要是醇類(lèi)、萜烯類(lèi)和芳香烴類(lèi)物質(zhì)。因此,玫瑰、薔薇和月季的光譜圖中都有C、H、O的特征譜線(xiàn),分別如圖3、圖4和圖5所示。此外,三種花中都含有N、Mg、Ca、Na和K元素。圖6將玫瑰、薔薇和月季的光譜圖進(jìn)行對(duì)比,由圖可見(jiàn)玫瑰和月季的光譜中都有Mn的特征譜線(xiàn),而薔薇的光譜圖中未曾發(fā)現(xiàn)。其中,玫瑰中有257.61、259.37、260.57、293.31、293.93、294.92、403.08、403.31、403.45 nm這9條Mn的特征譜線(xiàn),月季中只有257.61、259.37、260.57、403.08、403.31、403.45 nm這6條特征譜線(xiàn)。通過(guò)對(duì)比,還可觀(guān)察到玫瑰中Mn特征譜線(xiàn)的相對(duì)強(qiáng)度要高于月季中的。以上差異表明利用LIBS技術(shù)來(lái)辨別薔薇屬植物是可行的。不同植物具有不同的生長(zhǎng)習(xí)性,因此本實(shí)驗(yàn)所選用的三種花并不是產(chǎn)自同一地區(qū)的。而通過(guò)圖3和圖4可以看出,同一產(chǎn)地的玫瑰和薔薇的光譜具有一定差異。本實(shí)驗(yàn)設(shè)計(jì)作為一種研究方法存在一定的局限性,涉及后續(xù)的應(yīng)用,還可考慮產(chǎn)地氣候、土壤等因素,從而來(lái)提高檢測(cè)的準(zhǔn)確率。
圖3 玫瑰在240~875 nm波段的LIBS光譜。(a)240~300 nm;(b)350~440 nm;(c)500~675 nm;(d)700~875 nmFig.3 LIBS spectrum of Rosa rugosa Thunb. in the band of 240-875 nm (a) 240-300 nm;(b)350-440 nm;(c)500-675 nm;(d)700-875 nm
圖4 薔薇在240~875 nm波段的LIBS光譜。(a)240~300 nm;(b)350~440 nm;(c)500~675 nm;(d)700~875 nmFig.4 LIBS spectrum of Rosa sp. in the band of 240-875nm.(a)240-300 nm;(b)350-440 nm;(c)500-675 nm;(d)700-875 nm
圖5 月季在240~875 nm波段的LIBS光譜。(a)240~300 nm;(b)350~440 nm;(c)500~675 nm;(d)700~875 nmFig.5 LIBS spectrum of Rosachinensis Jacq. in the band of 240-875 nm(a)240-300 nm;(b)350-440 nm;(c)500-675 nm;(d)700-875 nm
圖6 玫瑰(a)、薔薇(b)和月季(c)的光譜對(duì)比圖Fig.6 Spectral comparison of Rosa rugosa Thunb.(a),Rosa sp.(b)and Rosa chinensis Jacq.(c)
如圖3(b)、4(b)、5(b)所示,實(shí)驗(yàn)在玫瑰、薔薇和月季的光譜中探測(cè)到了CN。為了更好地說(shuō)明探測(cè)過(guò)程的物理參數(shù),還進(jìn)一步研究了CN的振動(dòng)溫度和轉(zhuǎn)動(dòng)溫度。CN形成的主要過(guò)程如下:
而薔薇屬植物中的CN是由花中的C元素和N元素反應(yīng)以及由花中的C元素和空氣中的N2反應(yīng)形成的。利用雙原子分子光譜仿真軟件LIFBASE對(duì)薔薇屬植物光譜中的CN進(jìn)行模擬,校正基線(xiàn)和波長(zhǎng)偏移,調(diào)節(jié)振動(dòng)溫度和轉(zhuǎn)動(dòng)溫度,使得模擬值盡可能地接近實(shí)驗(yàn)值。最終得到玫瑰、薔薇和月季光譜中CN的振動(dòng)溫度分別為7600、7800、7600 K,而轉(zhuǎn)動(dòng)溫度分別為7700、7800、7800 K。該結(jié)果表明測(cè)量三種花的光譜時(shí)實(shí)驗(yàn)條件具有相似性。其中,月季中CN的模擬和實(shí)驗(yàn)光譜如圖7所示。
圖7 月季中CN的模擬光譜(a)和實(shí)驗(yàn)光譜(b)Fig.7 Simulation spectrum(a)and experimental spectrum(b)of CN in the Rosa chinensis Jacq.
本研究利用玫瑰、薔薇和月季光譜中的特征譜線(xiàn)并結(jié)合GRNN來(lái)識(shí)別三種花。GRNN是一種有監(jiān)督學(xué)習(xí)、非線(xiàn)性回歸的神經(jīng)網(wǎng)絡(luò),其使用徑向基函數(shù)作為激活函數(shù),具有良好的泛化性能和較高的正確率。傳統(tǒng)的鑒別薔薇屬植物的方法都過(guò)于繁雜,因此,將GRNN應(yīng)用到薔薇屬植物的分類(lèi)識(shí)別中具有重要意義。
首先采集薔薇屬植物的光譜數(shù)據(jù),選擇特征譜線(xiàn)作為特征變量,接著產(chǎn)生訓(xùn)練集和測(cè)試集并創(chuàng)建GRNN模型,然后通過(guò)仿真測(cè)試,最后輸出性能評(píng)價(jià),得到預(yù)測(cè)正確率。從玫瑰、薔薇和月季的光譜數(shù)據(jù)中各選擇單個(gè)花朵的100個(gè)測(cè)量光譜作為樣本。在光譜選擇過(guò)程中要注意篩查是否存在純空氣譜,從而避免這些異常數(shù)據(jù)對(duì)模型建立產(chǎn)生影響,模型建立的好壞會(huì)直接影響預(yù)測(cè)結(jié)果的接近程度。由于等離子體的不穩(wěn)定性和背景噪聲的干擾,直接分析整個(gè)波段的數(shù)據(jù)會(huì)導(dǎo)致辨別效果不佳。此外,一個(gè)光譜包含8192個(gè)數(shù)據(jù),數(shù)據(jù)量較大,直接計(jì)算耗時(shí)較長(zhǎng)。因此,對(duì)比三種花的光譜圖,選擇差異較明顯的15個(gè)特征峰作為變量,如表1所示。本研究采用隨機(jī)法產(chǎn)生訓(xùn)練集和測(cè)試集,從三類(lèi)中隨機(jī)挑選90個(gè)樣本作為訓(xùn)練集,每類(lèi)中剩下10個(gè)樣本則自動(dòng)成為測(cè)試集,這種方法不失一般性。因?yàn)镚RNN隱含層節(jié)點(diǎn)的激活函數(shù)采用了高斯函數(shù),它對(duì)輸入信息具有局部激活特性,所以對(duì)接近于局部神經(jīng)元特征的輸入信息具有較強(qiáng)的吸引力,準(zhǔn)確率會(huì)大大提高。
表1 選取的15條特征譜線(xiàn)Table 1 The selected 15 characteristic spectral lines
30個(gè)測(cè)試集的預(yù)測(cè)結(jié)果如圖8所示,其中標(biāo)簽1、2、3分別表示玫瑰、薔薇和月季,從圖中可看出1個(gè)薔薇數(shù)據(jù)集和1個(gè)月季數(shù)據(jù)集被誤判為玫瑰,正確率可達(dá)93.3%。
圖8 玫瑰、薔薇和月季的預(yù)測(cè)結(jié)果Fig.8 Forecast results for Rosa rugosa Thunb.,Rosa sp.and Rosa chinensis Jacq.
利用LIBS技術(shù)探測(cè)玫瑰、薔薇和月季這三種薔薇屬植物,實(shí)驗(yàn)觀(guān)察到三種花中都含有C、H、O、N、Mg、Ca、Na和K元素。此外,還在玫瑰和月季中探測(cè)到了Mn元素。薔薇屬植物中的CN是由花中的C元素和N元素反應(yīng)以及由花中的C元素和空氣中的N2反應(yīng)形成的。通過(guò)LIFBASE軟件模擬CN光譜,得到了玫瑰、薔薇和月季中CN的振動(dòng)溫度和轉(zhuǎn)動(dòng)溫度。三種花振動(dòng)溫度和轉(zhuǎn)動(dòng)溫度的近似證明了探測(cè)過(guò)程中實(shí)驗(yàn)條件具有相似性。GRNN不同于反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN),其權(quán)值和閾值只與訓(xùn)練樣本有關(guān),無(wú)需迭代,計(jì)算量小,計(jì)算速度快,且具有良好的預(yù)測(cè)能力,在識(shí)別薔薇屬植物方面有一定的優(yōu)越性。將LIBS技術(shù)與GRNN相結(jié)合,選取光譜中的15條特征譜線(xiàn)作為變量,三種花各挑選100個(gè)測(cè)量光譜,90個(gè)作為訓(xùn)練集,10個(gè)作為測(cè)試集,得到預(yù)測(cè)結(jié)果的正確率達(dá)到93.3%。綜上所述,本實(shí)驗(yàn)將LIBS技術(shù)和GRNN相結(jié)合應(yīng)用到薔薇屬植物的識(shí)別中進(jìn)行方法研究是具有可行性的。實(shí)際上,具體應(yīng)用于探測(cè)薔薇屬植物時(shí),還需考慮樣品產(chǎn)地的氣候、土壤等因素對(duì)光譜產(chǎn)生的影響。