黃富榮,周泳欣,鄭海平,陳嘉澤,熊 征,劉霓紅
(1.暨南大學(xué)理工學(xué)院光電工程系,廣東 廣州 510632;2.廣東省現(xiàn)代農(nóng)業(yè)裝備研究所,廣東 廣州 510630)
在農(nóng)作物的生長環(huán)境中,一切對(duì)于作物生長不利的環(huán)境因素都可以被稱作脅迫。一般而言,根據(jù)脅迫的來源,可以將作物脅迫分為生物脅迫與非生物脅迫2 類;而隨著日益嚴(yán)峻的氣候問題與人類工業(yè)的不斷發(fā)展,非生物脅迫的來源正逐漸增加,非生物脅迫對(duì)于農(nóng)作物生長的不利影響也在日益擴(kuò)大,被認(rèn)為比生物脅迫更具有威脅性[1]。
在所有類型的農(nóng)作物非生物脅迫中,重金屬脅迫已然成為全世界都值得關(guān)注的問題。自從人類社會(huì)進(jìn)入工業(yè)時(shí)代以來,工業(yè)水平不斷發(fā)展,人們開礦冶金,金屬加工等活動(dòng)日益頻繁,外加各類農(nóng)業(yè)化肥的過度使用,大量未經(jīng)處理的重金屬污染物被排放到自然環(huán)境中。據(jù)統(tǒng)計(jì),全球每年排放到自然環(huán)境中的污染物主要有:汞(Hg)、銅(Cu)、鉻(Cd)、鉛(Pb)等,其中重金屬銅排放量約為3.5×106t/年,為三大重金屬污染物之一[2]。
銅元素污染自然環(huán)境的方式主要分為3 類:水體污染、大氣污染與土壤污染[3],而這3 類污染方式都能夠?qū)虿⑽廴巨r(nóng)作物的生長環(huán)境,從而對(duì)農(nóng)作物產(chǎn)生銅脅迫。受到銅脅迫的農(nóng)作物,其生理性質(zhì)與結(jié)構(gòu)都會(huì)受到影響:過量的銅元素會(huì)阻礙農(nóng)作物根系生長,影響葉片葉綠素含量,抑制葉片的光合作用,從而對(duì)農(nóng)作物的質(zhì)量與產(chǎn)量產(chǎn)生極大的負(fù)面影響;其次,由于重金屬的富集特性與難降解特性,大量銅元素會(huì)在農(nóng)作物中進(jìn)行累積,并且能夠通過食物鏈對(duì)其他生物造成傷害,倘若這類農(nóng)作物進(jìn)入到人們的飲食生活中,將會(huì)對(duì)人類的飲食安全帶來極大的威脅[4]。因此,在銅污染日益嚴(yán)重的今天,需要建立快速且有效的農(nóng)作物銅脅迫檢測(cè)方法。
早期的重金屬檢測(cè)方法主要以實(shí)驗(yàn)室化學(xué)檢測(cè)法為主,通過對(duì)農(nóng)作物生長環(huán)境的土壤或者對(duì)農(nóng)作物本身進(jìn)行化學(xué)檢測(cè),這類方法由于外界干擾因素多,檢測(cè)準(zhǔn)確率并不高。而目前實(shí)驗(yàn)室中高靈敏度的檢測(cè)方法有:原子吸收光譜法、原子熒光光譜法等。雖然原子吸收光譜法等實(shí)驗(yàn)室測(cè)量方法能夠準(zhǔn)確且靈敏地檢測(cè)農(nóng)作物是否受到銅脅迫,但其檢測(cè)周期較長,檢測(cè)流程繁瑣,對(duì)樣品有損且無法進(jìn)行實(shí)時(shí)檢測(cè),無法滿足人們快速且無損的檢測(cè)需求。因此,人們開始將目光轉(zhuǎn)向能夠?qū)崿F(xiàn)無損且實(shí)時(shí)檢測(cè)的光譜技術(shù)。目前運(yùn)用于快速檢測(cè)重金屬脅迫的光譜技術(shù)主要有:近紅外光譜技術(shù)[13]、激光誘導(dǎo)擊穿光譜技術(shù)[14]、高光譜成像技術(shù)[15]等。其中高光譜成像技術(shù)由于能夠?qū)⒐庾V信息與圖像信息結(jié)合提取,在得到圖像的同時(shí),能夠獲取圖像上每個(gè)像素點(diǎn)的光譜信息,為之后的光譜特征響應(yīng)分析提供了較為完整且充分的信息。目前,高光譜成像技術(shù)已經(jīng)開始運(yùn)用到農(nóng)作物重金屬快速檢測(cè)研究中,ANNEM RUFFING 等[6]使用高光譜成像技術(shù),結(jié)合多元曲線分辨技術(shù)(MCR),實(shí)現(xiàn)了對(duì)擬南芥在2 種重金屬脅迫(銅與銫)下的鑒定。張雙印等[7]利用高光譜成像技術(shù),結(jié)合SG 平滑等預(yù)處理,分別基于支持向量機(jī)(SVM)和BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行診斷,實(shí)現(xiàn)了對(duì)水稻2種重金屬脅迫(鉛與隔)的分類診斷,其中SVM 有較好的診斷結(jié)果。孫君等[8]利用高光譜成像技術(shù),結(jié)合WT-LSSVR 算法選取特征波段,并建立相應(yīng)的檢測(cè)模型,用于檢測(cè)番茄葉片中的重金屬鎘的含量,其模型決定系數(shù)為0.943 7,均方根誤差為0.098 8 mg/kg,擁有較好的檢測(cè)性能。
因此運(yùn)用高光譜成像技術(shù)實(shí)現(xiàn)對(duì)農(nóng)作物重金屬脅迫的快速檢測(cè)是可行的,并且能夠達(dá)到較高的檢測(cè)準(zhǔn)確率,有極大的研究意義。目前基于高光譜成像技術(shù)的菜心銅脅迫檢測(cè)研究較少,本文的研究對(duì)于精準(zhǔn)農(nóng)業(yè)的發(fā)展有一定的應(yīng)用價(jià)值。
菜心是我國南方常見的農(nóng)作物,一年四季都可播種,生長周期較短,是我國南方地區(qū)重要的蔬菜來源。菜心本身易受重金屬污染,重金屬富集作用顯著,且在銅脅迫早期,葉片表面沒有明顯特征,無法通過肉眼進(jìn)行分辨[5];因此,利用高光譜技術(shù)實(shí)現(xiàn)對(duì)菜心銅脅迫的早期快速檢測(cè)對(duì)我國食品安全與農(nóng)業(yè)安全有著重要的意義。
本實(shí)驗(yàn)以菜心幼苗作為研究對(duì)象,選用的菜心幼苗健康狀態(tài)與生長態(tài)勢(shì)基本一致,且葉片展開狀況良好,采用水培的方式對(duì)菜心幼苗進(jìn)行培養(yǎng)與脅迫,為了作物得到足夠的生長所需營養(yǎng),采用霍格蘭營養(yǎng)液進(jìn)行培養(yǎng)[9],產(chǎn)生銅脅迫的銅離子由CuSO4溶液提供。其中標(biāo)準(zhǔn)霍格蘭營養(yǎng)液的成分如表1 所示。
表1 標(biāo)準(zhǔn)霍格蘭營養(yǎng)液組成成分
根據(jù)標(biāo)準(zhǔn)霍格蘭營養(yǎng)液的成分組成,分別配置濃度為標(biāo)準(zhǔn)值200 倍的營養(yǎng)液A 液與B 液,即母液;將配置好的營養(yǎng)液A、B 母液分別與不同濃度的CuSO4母液按一定比例混合,并加入一定量的水進(jìn)行稀釋,最終獲得CuSO4濃度分別為0.08(CK)、8、16、24、32 mg/L 的霍格蘭營養(yǎng)液。根據(jù)我國《農(nóng)業(yè)灌溉水質(zhì)標(biāo)準(zhǔn)》,含銅量在1 mg/L 以上的水質(zhì),便會(huì)對(duì)農(nóng)作物產(chǎn)生銅脅迫,因此可使用上述后4 種營養(yǎng)液對(duì)菜心進(jìn)行銅脅迫處理。
選取40 株健康且生長狀況相似的菜心幼苗,將40 株菜心平均分為5 組,每組8 株菜心。將5 組幼苗分別放置在40 cm×28 cm×6 cm 的塑料淺盒中進(jìn)行培育,其中1 組使用標(biāo)準(zhǔn)的霍格蘭營養(yǎng)液進(jìn)行正常水培,作為實(shí)驗(yàn)的空白組;另外4 組分別用CuSO4濃度為8、16、24、32 mg/L 的霍格蘭營養(yǎng)液進(jìn)行脅迫水培。
1.2.1 圖像采集
本次實(shí)驗(yàn)采用芬蘭SPECIM 公司所生產(chǎn)的SPECIM IQ 便攜式高光譜成像系統(tǒng),如圖1 所示,系統(tǒng)包括高光譜相機(jī)、鹵素?zé)艄庠础⑷_架以及校正白板。該相機(jī)便于攜帶且操作簡單,影像分辨率為512×512,所采集的圖像光譜范圍為400~1 000 nm,光譜分辨率為3 nm,可提供204個(gè)光譜波段信息,能夠提供有效的光譜數(shù)據(jù)進(jìn)行分析。
圖1 高光譜成像系統(tǒng)
將5 組菜心幼苗進(jìn)行培育與脅迫處理后的第1、3、5、7 d 進(jìn)行樣品的高光譜圖像拍攝工作。在高光譜圖像采集之前,應(yīng)使周邊環(huán)境處于一個(gè)較暗的狀態(tài),防止拍攝過程中,除鹵素?zé)艄庠赐獾钠渌麩o關(guān)光源的干擾。拍攝過程中應(yīng)使三腳架兩側(cè)對(duì)稱的鹵素?zé)艄庠磳?duì)準(zhǔn)樣品,保證光線充足,模擬自然環(huán)境下的太陽光。樣品的拍攝背景應(yīng)為黑色,便于之后的樣品光譜數(shù)據(jù)提取工作。拍攝時(shí),將菜心幼苗放置于黑色的塑料杯中,并使上層葉片展開,上層葉片與高光譜相機(jī)之間保持20 cm 的垂直距離,高光譜相機(jī)選用默認(rèn)的拍攝模式,曝光時(shí)間設(shè)置為25 ms。拍攝時(shí)可將99%反射率的校正白板置于鏡頭下,高光譜相機(jī)會(huì)根據(jù)校正白板對(duì)圖像進(jìn)行自動(dòng)校正,從而獲得校正后的高光譜圖像。
通過高光譜圖像采集系統(tǒng),能夠獲得1 個(gè)樣品204 個(gè)波段下的高光譜圖像。經(jīng)過4 d 的圖像采樣工作,共獲得160 個(gè)菜心高光譜圖像。
1.2.2 數(shù)據(jù)提取
獲得樣品的高光譜圖像后,需要對(duì)高光譜圖像進(jìn)行處理,并從中獲取樣品的高光譜信息。通過ENVI5.3 軟件,將高光譜圖像文件格式轉(zhuǎn)換為TIF格式,并將其導(dǎo)入Matlab 軟件。針對(duì)高光譜單波段圖像,根據(jù)樣品反射率與背景反射率的差異,基本能夠?qū)⒉诵挠酌鐦悠窂膱D片背景中提取出來,并通過二值化,建立掩膜圖像,通過選取感興趣區(qū)域,得到該區(qū)域中所需樣品的高光譜數(shù)據(jù)。在實(shí)驗(yàn)過程中,通常選取1 片完整的葉片作為感興趣區(qū)域進(jìn)行數(shù)據(jù)提取。本實(shí)驗(yàn)通過對(duì)160 個(gè)樣品高光譜圖像進(jìn)行數(shù)據(jù)提取,剔除部分無法獲得正常葉片的異常圖片,最終能夠獲取140 個(gè)總樣品的原始光譜數(shù)據(jù)。
在光譜數(shù)據(jù)采集的過程中,由于采集環(huán)境、儀器性能、樣品狀態(tài)等干擾因素,容易在光譜數(shù)據(jù)中引入噪聲,從而影響后續(xù)的光譜特性分析。因此,在進(jìn)行光譜分析之前,需要對(duì)原始光譜進(jìn)行一定的預(yù)處理,從而減少原始光譜中的干擾信息。本實(shí)驗(yàn)采取一階微分(First Derivative,F(xiàn)D)、多元散射校正(Multiplicative Scatter Correction,MSC)、標(biāo)準(zhǔn)正態(tài)變換(Standard Normal Variate,SNV)3 種預(yù)處理方法,同時(shí)結(jié)合建模分析方法,對(duì)比建模后模型的準(zhǔn)確率,從而確定最佳預(yù)處理方法。
1.4.1 偏最小二乘判別分析
偏最小二乘判別分析(Partial least squares Discriminant Analysis,PLS-DA)是一種線性判別算法,通過PLS技術(shù)得到樣本的分類信息,并建立自變量與分類信息間的回歸模型,從而獲取與分類信息相關(guān)性強(qiáng)的特征變量,實(shí)現(xiàn)對(duì)樣品的分類工作[11]。
1.4.2 支持向量機(jī)
支持向量機(jī)(Support Vector Machine,SVM)是一種根據(jù)監(jiān)督學(xué)習(xí),對(duì)樣品進(jìn)行二元分類的算法。其主要思想是尋找能夠正確劃分樣本數(shù)據(jù)、幾何間隔最大的分離超平面,對(duì)于難以劃分的樣本數(shù)據(jù)可映射到高維空間上,從而實(shí)現(xiàn)對(duì)樣本的分類[12]。對(duì)于高維空間的數(shù)據(jù)運(yùn)算需要引入核函數(shù),常用的核函數(shù)為徑向基核函數(shù)(REF),并且在建模過程中需要尋找支持向量機(jī)的懲罰系數(shù)c與徑向基核函數(shù)中正則化系數(shù)g的最優(yōu)解,提高模型性能。
分別對(duì)原始光譜采用一階微分(FD)、標(biāo)準(zhǔn)正態(tài)分布(SNV)、多元散射校正(MSC)進(jìn)行預(yù)處理工作,原始光譜曲線圖與進(jìn)行預(yù)處理后的光譜曲線圖如圖2 所示。
圖2 原始光譜與預(yù)處理后的光譜
通過對(duì)比原始光譜曲線與預(yù)處理后的光譜曲線圖,可以發(fā)現(xiàn)經(jīng)過預(yù)處理后的光譜曲線相比于原始光譜曲線,噪聲信息與冗余信息都得到了一定程度的消除。其中,經(jīng)過一階微分處理的光譜曲線能夠反映原始光譜的變化率,能夠展現(xiàn)出更為深層的信息,但在900~1 000 nm波段存在一定的噪聲,在后續(xù)分析處理時(shí)可進(jìn)行剔除;經(jīng)過標(biāo)準(zhǔn)正態(tài)分布與多元散射校正處理后的光譜曲線,在保留原始光譜趨勢(shì)的同時(shí),使光譜曲線更為平滑,并且較好地消除了基線平移與非線性偏移的影響,使光譜信息更為緊密,但1 000 nm波段附近依舊存在一定量的噪聲,可在后續(xù)分析時(shí)進(jìn)行剔除。
后續(xù)建模過程將分別對(duì)不同預(yù)處理的光譜進(jìn)行分析,從而選擇較好的光譜預(yù)處理方法。
在高光譜數(shù)據(jù)采集過程中,對(duì)于總樣品一共采集了140 組高光譜數(shù)據(jù)。在這140 個(gè)總樣品中,受到脅迫的樣品存在不同脅迫程度與不同脅迫時(shí)間的雙變量,未受脅迫的樣本也存在培養(yǎng)時(shí)間的差異,比較貼近自然環(huán)境中農(nóng)作物受到銅脅迫時(shí)自身狀態(tài)的差異性與復(fù)雜性。針對(duì)總樣品光譜數(shù)據(jù)建立銅脅迫檢測(cè)模型,對(duì)比不同預(yù)處理時(shí)模型的準(zhǔn)確率,選出效果較好的預(yù)處理方法。
在建立模型之前,需要對(duì)樣品進(jìn)行訓(xùn)練集與測(cè)試集的劃分。其中訓(xùn)練集為104 個(gè)樣品,測(cè)試集為36 個(gè)樣品。
2.2.1 PLS-DA 模型
分別將經(jīng)過預(yù)處理的光譜,對(duì)訓(xùn)練集進(jìn)行K 折交互驗(yàn)證,從而選擇出適合建模的最優(yōu)主成分?jǐn)?shù),根據(jù)所選的最優(yōu)主成分?jǐn)?shù)、訓(xùn)練集與訓(xùn)練標(biāo)簽,建立判斷菜心是否受到銅脅迫的檢測(cè)模型,并使用測(cè)試集對(duì)建立好的檢測(cè)模型進(jìn)行模型準(zhǔn)確率評(píng)估。表2 為不同預(yù)處理光譜數(shù)據(jù)所建立的PLS-DA 模型測(cè)試結(jié)果。
表2 PLS-DA模型分類結(jié)果
通過表2 可知,在上述3 種預(yù)處理方法中,使用SNV 預(yù)處理后的數(shù)據(jù)建模的效果較好,其最優(yōu)主成分?jǐn)?shù)為10,訓(xùn)練集準(zhǔn)確率為84.62%,預(yù)測(cè)集準(zhǔn)確率為80.56%,但對(duì)比原始數(shù)據(jù)所建立的模型,整體的提升幅度較小。
2.2.2 SVM 模型
本次研究所使用的SVM 模型以徑向基核函數(shù)作為核函數(shù),根據(jù)訓(xùn)練集與訓(xùn)練標(biāo)簽建立銅脅迫檢測(cè)模型,并使用網(wǎng)格搜索算法GS 尋找最優(yōu)的懲罰系數(shù)c與核函數(shù)參數(shù)g,通過測(cè)試集對(duì)所建立的SVM 模型進(jìn)行準(zhǔn)確率評(píng)估,如表3 所示。
表3 不同預(yù)處理下的SVM模型分類結(jié)果
通過表3 可知,經(jīng)FD 預(yù)處理后的光譜數(shù)據(jù)建立的SVM 模型性能較好,相比于原始數(shù)據(jù)所建立的模型,準(zhǔn)確率有較大的提升。
針對(duì)4 d 總樣品光譜數(shù)據(jù)進(jìn)行建模分析,對(duì)比PLS-DA 模型與SVM 模型的測(cè)試準(zhǔn)確率,可以看出,SVM 模型的檢測(cè)性能較好,能夠有效地檢測(cè)出菜心幼苗是否受到銅脅迫。因此,在自然環(huán)境下,由于農(nóng)作物受到銅脅迫時(shí)自身狀態(tài)的差異性與復(fù)雜性,面對(duì)脅迫天數(shù)與培育天數(shù)不同的農(nóng)作物時(shí),使用非線性的SVM 算法建立的檢測(cè)模型效果更好。
分別于菜心培育與脅迫處理后的第1、3、5、7 d對(duì)菜心進(jìn)行圖像采集,可以分別對(duì)每天采集的樣本光譜數(shù)據(jù)進(jìn)行分析,得出在不同培養(yǎng)天數(shù)下對(duì)于菜心是否受到銅脅迫的檢測(cè)準(zhǔn)確率,研究菜心受到銅脅迫后多長時(shí)間內(nèi)可被準(zhǔn)確檢測(cè)。
在對(duì)同一天的樣品進(jìn)行數(shù)據(jù)分析之前,可以在高光譜圖像處理環(huán)節(jié),每個(gè)樣品選擇多個(gè)感興趣區(qū)域用于獲取高光譜數(shù)據(jù),增加樣本容量,使每天的光譜數(shù)據(jù)約為60 個(gè)。
2.3.1 PLS-DA 模型
通過分別對(duì)光譜做MSC、SNV、FD 預(yù)處理,將同一天的樣品數(shù)據(jù)劃分訓(xùn)練集與測(cè)試集,使用PLS-DA算法分別對(duì)每一天的樣品數(shù)據(jù)進(jìn)行建模分析。表4 為經(jīng)不同預(yù)處理的光譜數(shù)據(jù)的PLS-DA 模型的檢測(cè)結(jié)果。
表4 PLS-DA模型對(duì)不同培養(yǎng)天數(shù)的菜心分類結(jié)果
由表4 所顯示的分析結(jié)果可以得知,使用原始光譜數(shù)據(jù)進(jìn)行PLS-DA 建模,檢測(cè)培育時(shí)間相同的樣品是否受到銅脅迫時(shí),已經(jīng)達(dá)到了較好的效果,測(cè)試集的平均準(zhǔn)確率為90%。對(duì)比不同預(yù)處理后的建模結(jié)果,可知經(jīng)MSC 與SNV 預(yù)處理后建立的檢測(cè)模型的穩(wěn)定性不高,而經(jīng)過FD 預(yù)處理后建立的檢測(cè)模型穩(wěn)定性較高,且相比于原始數(shù)據(jù)建立的模型,其準(zhǔn)確性有一定的提高,能夠?qū)崿F(xiàn)對(duì)菜心是否受到銅脅迫的早期快速檢測(cè)。
2.3.2 SVM 模型
按照PLS-DA 模型劃分的訓(xùn)練集與測(cè)試集結(jié)果,首先利用原始NIR 光譜數(shù)據(jù)及3 種不同預(yù)處理(FD、SD、MSC)后的數(shù)據(jù)建立SVM 判別模型,比較不同預(yù)處理方法建立的SVM 模型對(duì)預(yù)測(cè)數(shù)據(jù)集的預(yù)測(cè)準(zhǔn)確率的高低來選取最佳的預(yù)處理方式,其中通過網(wǎng)格搜索算法GS 尋找最優(yōu)的懲罰系數(shù)c與核函數(shù)參數(shù)g,得到表5。
由表5 可以看出,相比與原始光譜數(shù)據(jù)所建立的SVM 模型,經(jīng)過預(yù)處理后的SVM 模型在準(zhǔn)確率上有明顯的提升,其中經(jīng)FD 預(yù)處理后的SVM 模型準(zhǔn)確率最佳。但在菜心受到銅脅迫后的第1 d,SVM模型的檢測(cè)準(zhǔn)確率并不理想。
通過對(duì)比PLS-DA 模型與SVM 模型的檢測(cè)結(jié)果,可以發(fā)現(xiàn)在菜心受到銅脅迫后的第1 d,使用PLSDA 模型進(jìn)行檢測(cè)的準(zhǔn)確率更高,而在后3 d,經(jīng)FD預(yù)處理的SVM 模型的檢測(cè)準(zhǔn)確率略高于PLS-DA 模型。在實(shí)際的農(nóng)作物種植活動(dòng)中,由于重金屬脅迫在早期無法從農(nóng)作物的表面所觀測(cè)到,可以同時(shí)使用SVM 模型與PLS-DA 模型對(duì)農(nóng)作物進(jìn)行檢測(cè),通過兩者的優(yōu)勢(shì)互補(bǔ),能夠?qū)崿F(xiàn)對(duì)農(nóng)作物銅脅迫的早期快速檢測(cè),從而及時(shí)進(jìn)行干預(yù),對(duì)農(nóng)業(yè)的生產(chǎn)有著極大的意義。
1)利用CuSO4濃度不同的霍格蘭營養(yǎng)液培育菜心樣品。分4 d 完成樣品高光譜圖像的采集工作,建立掩膜圖像,分割樣品與圖像背景,選取感興趣區(qū)域提取樣品的高光譜數(shù)據(jù)。
2)針對(duì)不同脅迫程度不同脅迫時(shí)間進(jìn)行建模分析,分別使用一階微分、標(biāo)準(zhǔn)正態(tài)變換、多元散射校正對(duì)原始光譜進(jìn)行預(yù)處理。分別使用PLS-DA 算法與SVM 算法進(jìn)行建模分析,比較2 種模型的性能。經(jīng)過FD 預(yù)處理后的SVM 模型檢測(cè)準(zhǔn)確率較高,可達(dá)到86.11%。
3)針對(duì)同一脅迫程度不同脅迫時(shí)間進(jìn)行建模分析,使用不同的光譜預(yù)處理方法,分別使用PLS-DA算法與SVM 算法進(jìn)行建模分析。經(jīng)過FD 預(yù)處理的PLS-DA 模型穩(wěn)定性較高,平均準(zhǔn)確率可達(dá)95%;經(jīng)過FD 預(yù)處理的SVM 模型在脅迫早期的檢測(cè)準(zhǔn)確率不如PLS-DA 模型,但隨著脅迫時(shí)間推移,該模型檢測(cè)準(zhǔn)確率略優(yōu)于PLS-DA 模型。