孫 俊,張 林,周 鑫,武小紅,沈繼鋒,戴春霞
(江蘇大學(xué)電氣信息工程學(xué)院,鎮(zhèn)江 212013)
水稻是中國(guó)主要的糧食作物之一,其種植面積大約在3 000萬hm2,年產(chǎn)量在2億t左右[1-2]。水稻種子是水稻產(chǎn)量和品質(zhì)的決定性因素,也是農(nóng)業(yè)生產(chǎn)的源頭。種子活力決定水稻種子能否正常發(fā)芽,出苗整齊程度以及最終長(zhǎng)成的植株的抗病害能力等,常用作評(píng)價(jià)水稻種子品質(zhì)的關(guān)鍵性指標(biāo)[3]。因此,在水稻種子的播種之前對(duì)其活力進(jìn)行準(zhǔn)確檢測(cè),有效篩選高活力的水稻種子用于種植,可以大幅度提高水稻的產(chǎn)量以及品質(zhì),從而保障糧食安全[4]。
依靠人感官并基于種子外部特征如顏色、紋理和形狀等信息難以對(duì)種子活力水平進(jìn)行準(zhǔn)確判斷。生理生化方法和發(fā)芽測(cè)試法檢測(cè)結(jié)果可靠,但是這些方法需要消耗特殊試劑,對(duì)樣本具有破壞性且耗費(fèi)大量人力物力[5]。高光譜圖像技術(shù)具有快速、無損等優(yōu)勢(shì),基于其開展的種子活力檢測(cè)一直是當(dāng)前的研究熱點(diǎn)[6]。李美凌等[7]采集老化和未老化水稻種子的高光譜圖像,基于獲取的光譜信息建立水稻種子活力分級(jí)模型,分類準(zhǔn)確率達(dá)到97.22%以上。Zhang等[8]基于高光譜圖像技術(shù)對(duì)經(jīng)過不同凍害程度處理的 6組水稻種子樣本進(jìn)行活力分類檢測(cè),搭建了準(zhǔn)確率為 99.33%的分類模型。許思等[9]采用人工加速老化方法制備了 3個(gè)老化等級(jí)的水稻種子,獲取并分析種子光譜信息,對(duì)不同活力等級(jí)水稻種子的分類準(zhǔn)確率達(dá)到98.75%。以上研究雖然取得了良好的檢測(cè)效果,但其對(duì)于種子活力等級(jí)定義是依據(jù)種子老化程度,未考慮到同一老化等級(jí)中依然存在活力高低的種子。因此,本文采用高光譜圖像技術(shù)獲取不同老化程度單粒水稻種子高光譜圖像,在此基礎(chǔ)上按照種子發(fā)芽速度對(duì)其進(jìn)行三等級(jí)劃分,進(jìn)而實(shí)現(xiàn)對(duì)單粒種子活力的高精度檢測(cè)。
高光譜圖像中光譜數(shù)據(jù)維度較高,含有大量的冗余信息和干擾信息,將其直接用于建模會(huì)導(dǎo)致建模時(shí)間長(zhǎng)和模型準(zhǔn)確率低等問題。堆疊自動(dòng)編碼器(Stacked Auto-Encoder,SAE)擁有良好的特征提取能力,能準(zhǔn)確獲取數(shù)據(jù)中的高階非線性特征[10-12]。因此,本文使用SAE對(duì)光譜數(shù)據(jù)進(jìn)行深度數(shù)據(jù)挖掘,該方法在水稻種子活力檢測(cè)研究中還未見報(bào)道。
本文基于高光譜圖像技術(shù),結(jié)合化學(xué)計(jì)量學(xué)方法和深度學(xué)習(xí)算法,針對(duì)不同老化條件獲取的高活力、低活力和無活力的水稻種子開展分類檢測(cè)研究,以期為制作水稻種子活力檢測(cè)設(shè)備提供有效參考。
為擴(kuò)充不同活力的水稻種子樣本規(guī)模,需要對(duì)水稻種子進(jìn)行人工加速老化。首先從沭陽縣真誠(chéng)農(nóng)資經(jīng)營(yíng)部(江蘇省宿遷市)購買2 kg年份為2020年的綠旱1號(hào)水稻種子,將其稱量等分成為4部分,每部分0.5 kg分別裝在4個(gè)尼龍袋中。然后將1個(gè)尼龍袋作為參照組放置于室溫條件下:溫度為 25 ℃,相對(duì)濕度為 33%(RH,Relative Humidity),其他3個(gè)尼龍袋依次放入智能恒溫恒濕箱,順序?yàn)椋旱?天放入第1袋,第2天放入第2袋,第3天放入第3袋,設(shè)置智能恒溫恒濕箱溫度為43 ℃,RH為90%[13]。第4天取出所有樣本,獲得未老化(AA0)、老化1 d(AA1),2 d(AA2)和3 d(AA3)的水稻種子。最后,將樣本放置于室溫條件下持續(xù)2 d以使其含水率達(dá)到相似水平,隨后放于低溫箱中備用。
高光譜圖像采集設(shè)備具體如圖1所示。整個(gè)分光模塊(芬蘭Spectral Imaging 公司):TE-cooled InGaAs CCD相機(jī)、ImspectorN17E分光光計(jì)和OLES30變焦鏡頭;鹵素光源(2900-ER+9596-E,美國(guó)Illumination公司),光源功率為 150W;電動(dòng)位移平臺(tái)(MTS120,北京光學(xué)儀器廠),暗箱(SC100,北京光學(xué)儀器廠)。該系統(tǒng)采集的光譜范圍為871~1 766 nm,包含256個(gè)波段。
在圖像采集試驗(yàn)之前先對(duì)儀器預(yù)熱30 min,然后對(duì)儀器進(jìn)行調(diào)校并確定相機(jī)曝光時(shí)間為20 ms,位移平臺(tái)移動(dòng)速度為1.25 mm/s。將水稻種子樣本按照5行5列的方式單粒擺放在樣本托盤上的黑色紙板上。計(jì)算機(jī)控制平臺(tái)從左向右移動(dòng),高光譜成像儀器捕捉樣本的高光譜圖像并傳輸?shù)接?jì)算機(jī)中存儲(chǔ)。每個(gè)老化梯度掃描300個(gè)水稻種子樣本,共掃描1 200個(gè)樣本。之后按照公式(1)[14]對(duì)原始高光譜圖像進(jìn)行黑白板校正,去除相機(jī)中引入的暗電流噪聲。將每次圖像采集結(jié)束的樣本(5×5排列)按順序擺放,4個(gè)批次構(gòu)成一個(gè)10×10的樣本陣列,記錄樣本位置并與高光譜圖像中的樣本對(duì)應(yīng),準(zhǔn)備后續(xù)發(fā)芽試驗(yàn)。
式中IS為原始圖像,IW為白板圖像,IB為黑板圖像,I為校正后圖像。
為獲取樣本代表性的光譜信息,將單粒種子區(qū)域作為感興趣區(qū)域并從中提取光譜信息。如圖2所示,已有研究表明將樣本光譜極大值處波長(zhǎng)下圖像與光譜極小值處波長(zhǎng)圖像相除,能夠獲得樣本與背景具有較大差異的比值圖像[15]。因此,將高光譜圖像中1 100 nm下圖像除以1 230 nm下的圖像,得到比值圖像(灰度圖像)。然后對(duì)灰度圖像設(shè)置閾值1.2,灰度值大于閾值的像素點(diǎn)置1,灰度值小于閾值的像素點(diǎn)置 0,灰度圖像轉(zhuǎn)換為掩膜圖像。應(yīng)用掩膜圖像到原始高光譜圖像上將樣本區(qū)域的高光譜圖像從背景中分離,最后計(jì)算樣本高光譜圖像上所有像素點(diǎn)的光譜平均值作為該樣本光譜。
在發(fā)芽盒中平鋪上 3層浸濕的濾紙,將經(jīng)過圖像采集的種子按照 10×10的排列方式擺放在發(fā)芽盒中并記錄其位置,噴灑少量清水后閉上盒子并放置于智能恒溫恒濕箱中,設(shè)置光照(28 ℃,8 h)和黑暗(20 ℃,16 h)條件。每天取出發(fā)芽盒并對(duì)種子進(jìn)行噴灑補(bǔ)水,并記錄發(fā)芽結(jié)果。發(fā)芽結(jié)果如表1所示,3 d發(fā)芽數(shù)是指在第1到第3天發(fā)芽的種子數(shù),5 d發(fā)芽數(shù)是指第4到第5天發(fā)芽的種子數(shù),在第 5天之后發(fā)芽或者不發(fā)芽的種子視作未發(fā)芽(實(shí)際上第 5天之后發(fā)芽的種子因?yàn)榕哐可L(zhǎng)異常最終霉變死亡了)。
表1 不同老化梯度下水稻種子活力情況Table 1 Vigor of rice seeds under different aging gradients
表1記錄不同老化梯度下水稻種子樣本發(fā)芽情況,可以發(fā)現(xiàn)隨著老化天數(shù)的增加,種子發(fā)芽率呈現(xiàn)不同程度的下降。而且,老化天數(shù)越高,3 d發(fā)芽數(shù)在下降,5 d發(fā)芽數(shù)和不發(fā)芽種子個(gè)數(shù)在上升。這些現(xiàn)象說明老化條件通過影響水稻種子的生理功能進(jìn)而影響到種子的活力,導(dǎo)致水稻種子的發(fā)芽速度受到影響。因此,根據(jù)已有研究可以將 4個(gè)老化梯度下的水稻種子按照發(fā)芽的快慢分為高活力(3 d發(fā)芽),低活力(5 d發(fā)芽)和無活力(未發(fā)芽)三類[16-17]。
自動(dòng)編碼器(Auto Encoder,AE)[18]是一種典型的三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),包含輸入層、隱含層和輸出層。AE的輸入層和隱含層構(gòu)成編碼部分,隱含層和輸出層構(gòu)成解碼部分。但是單個(gè)AE難以提取到數(shù)據(jù)中深層特征,可以考慮將多個(gè)AE逐層堆疊,形成一個(gè)多層編解碼結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型,即堆疊自動(dòng)編碼器(Stacked Auto-Encoder,SAE)[19]。具體操作為第一個(gè)AE的隱含層的輸出直接作為第二個(gè)AE的隱含層輸入,依此類推,得到隱含層個(gè)數(shù)不同的SAE。
支持向量機(jī)(Support Vector Machine,SVM)是一種經(jīng)典的機(jī)器學(xué)習(xí)方法,可以解決小樣本規(guī)模的分類問題[20-21]。SVM是基于統(tǒng)計(jì)學(xué)原理且遵循結(jié)構(gòu)風(fēng)險(xiǎn)最小化為目標(biāo)而設(shè)計(jì)的,通過對(duì)樣本進(jìn)行監(jiān)督學(xué)習(xí)從而達(dá)到模式識(shí)別的作用。SVM不僅計(jì)算簡(jiǎn)單訓(xùn)練時(shí)間短,而且具有良好的泛化性能與魯棒性。因此本文采用SVM作為分類器對(duì)不同活力等級(jí)的水稻種子樣本進(jìn)行分類,在此設(shè)置SVM核函數(shù)為RBF核函數(shù)。
將準(zhǔn)確率作為分類模型的評(píng)價(jià)指標(biāo),其定義如公式 (2)[22]所示。
式中ACC為準(zhǔn)確率,n1為模型判別正確的樣本個(gè)數(shù),n2為樣本總數(shù)。
1 200 個(gè)種子樣本中高活力、低活力和無活力樣本個(gè)數(shù)分別為481、368和351。將每個(gè)活力等級(jí)樣本按照2∶1的比例隨機(jī)劃分訓(xùn)練集和預(yù)測(cè)集,用于訓(xùn)練分類模型以及測(cè)試模型性能,樣本集劃分結(jié)果如表2所示。
表2 訓(xùn)練集和測(cè)試集劃分結(jié)果Table 2 Partition of training set and test set
為了解基于老化種子數(shù)據(jù)搭建的活力分級(jí)模型對(duì)于實(shí)際生產(chǎn)過程是否具有指導(dǎo)作用,需應(yīng)用一批未經(jīng)老化的原種子(300)數(shù)據(jù)對(duì)模型的泛化性能進(jìn)行測(cè)試。首先進(jìn)行原種子高光譜圖像采集,然后對(duì)原種子進(jìn)行發(fā)芽試驗(yàn)。按照發(fā)芽天數(shù)原種子被劃分為高活力、低活力和無活力三類,樣本個(gè)數(shù)分別為228、42和30。
2.1.1 預(yù)處理方法選擇
圖3展示4個(gè)不同老化梯度的1 200個(gè)種子樣本光譜,因?yàn)槭孜泊嬖趦x器噪聲,故保留914~1 704 nm范圍內(nèi)的230個(gè)波段作為原始光譜用于后續(xù)分析。
由圖3看出原始光譜中存在明顯的高頻噪聲,需要對(duì)其進(jìn)行預(yù)處理。小波閾值去噪(Wavelet Threshold Denoising,WTD)是一種可以準(zhǔn)確去除光譜中高頻噪聲的方法,WTD先將光譜信號(hào)分解為高頻細(xì)節(jié)部分和低頻近似部分,然后對(duì)高頻信號(hào)系數(shù)進(jìn)行閾值處理,最終重構(gòu)去除噪聲的信號(hào)[23]。在本文中WTD被用來對(duì)原始光譜信號(hào)去噪,設(shè)置小波基函數(shù)為db4[24]。此外,一階導(dǎo)數(shù)(First/1stDerivative,F(xiàn)D)可以有效降低光譜曲線的基線漂移效應(yīng),消除重疊峰并且提高光譜分辨率[25]。因此,在進(jìn)行 WTD基礎(chǔ)上再進(jìn)行FD預(yù)處理,可以進(jìn)一步增加數(shù)據(jù)可用性。
2.1.2 預(yù)處理結(jié)果評(píng)價(jià)
WTD在不同的小波分解層數(shù)下會(huì)帶來具有差異性的降噪效果,為了確定最佳小波分解層數(shù),本文選擇對(duì)原始信號(hào)進(jìn)行1~5層分解并逐一討論。此外,為了評(píng)估WTD結(jié)合FD預(yù)處理的效果,在原始信號(hào)經(jīng)過WTD處理的基礎(chǔ)上再次進(jìn)行FD預(yù)處理,獲取多組預(yù)處理光譜?;诘玫降拿拷M預(yù)處理數(shù)據(jù),對(duì)1 200個(gè)樣本采用五折交叉驗(yàn)證[26]方法劃樣本集并建立SVM模型,求取模型交叉驗(yàn)證準(zhǔn)確率,結(jié)果如表3所示,根據(jù)結(jié)果評(píng)估最佳的預(yù)處理方法。
表3 基于WTD和FD預(yù)處理之后的光譜的建模結(jié)果Table 3 The model results based on the spectra after WTD and FD pretreatment
根據(jù)表3結(jié)果可知,基于原始光譜建立的模型準(zhǔn)確率為74.57%,其難以滿足活力準(zhǔn)確分級(jí)需求。WTD在對(duì)原始光譜 1~5層分解時(shí),模型準(zhǔn)確率分別為 76.38%,77.61%,79.62%,79.99%和71.58%。相較于原始光譜建模結(jié)果,分解層數(shù)為 1~4時(shí)模型準(zhǔn)確率得到不同程度提升,且在分解層數(shù)為4時(shí)達(dá)到較高的準(zhǔn)確率??芍琖TD能有效降低原始光譜中存在的噪聲干擾,使模型性能提升。FD預(yù)處理光譜建模準(zhǔn)確率為85.68%,相較于原始光譜提升了11.11個(gè)百分點(diǎn),效果較為明顯,說明FD有效降低基線漂移等因素對(duì)原始光譜的影響。組合算法WTD1-FD,WTD2-FD和 WTD3-FD模型準(zhǔn)確率相比于WTD和FD均得到提高了,且WTD3-FD實(shí)現(xiàn)了較高的準(zhǔn)確率(89.86%)。分析可知,WTD-FD在分解層數(shù)達(dá)到 3時(shí)最大程度降低了高頻噪聲的影響,當(dāng)分解層數(shù)高于3時(shí)丟失了部分低頻有用信號(hào)。以上結(jié)果說明WTD和FD對(duì)于光譜的預(yù)處理是有效的,組合方法(WTD-FD)效果相比于單一方法效果更好,且WTD3-FD效果較佳。因此,接下來的分析基于WTD3-FD預(yù)處理的光譜數(shù)據(jù)展開,WTD3-FD預(yù)處理光譜如圖4所示。
試驗(yàn)中通過設(shè)置不同老化條件獲取 3個(gè)活力等級(jí)的水稻種子樣本。計(jì)算每個(gè)活力水平的水稻種子樣本的平均光譜(基于WTD3-FD預(yù)處理光譜),繪制如圖5所示的平均光譜曲線圖。
從圖5可以發(fā)現(xiàn),高活力、低活力和無活力水稻種子的平均光譜之間整體的趨勢(shì)是相似的,在一些波峰波谷的地方展示了較為明顯的區(qū)別。水稻種子在老化過程中由于抗氧化酶活性的降低,累積的活性氧(Reactive Oxygen Species,ROS)與細(xì)胞膜脂質(zhì)發(fā)生氧化反應(yīng),導(dǎo)致細(xì)胞膜透性增加,細(xì)胞內(nèi)物質(zhì)外滲從而引發(fā)細(xì)胞結(jié)構(gòu)發(fā)生變化[27]。微觀結(jié)構(gòu)變化能導(dǎo)致水稻種子的光譜反射率呈現(xiàn)變化[28]。此外,由于種子自身呼吸作用導(dǎo)致其內(nèi)部可溶性糖和可溶性蛋白等有機(jī)物的消耗,使得這些有機(jī)物的含量下降[29]。1 000 nm附近與蛋白質(zhì)中的N-H的三倍頻有關(guān),1 300 nm附近與淀粉的C-H的二倍頻有關(guān),1 400 nm附近的區(qū)域與蛋白質(zhì)中的O-H組合頻吸收有關(guān),1 660 nm附近的吸收谷與脂肪含量有關(guān)[30]。光譜曲線上的差異一方面證明了不同活力等級(jí)的水稻種子之間的差異,另一方面又證明了高光譜圖像技術(shù)用于水稻種子活力的檢測(cè)是可行的。
2.3.1 基于主成分分析的特征變量提取
全光譜中包含的大量冗余信息和共線性信息不利于建立準(zhǔn)確的活力分級(jí)模型,需進(jìn)行特征變量提取。首先使用主成分分析(Principal Component Analysis,PCA)[31]對(duì)原始數(shù)據(jù)通過正交變換轉(zhuǎn)換成為主成分,并計(jì)算每個(gè)主成分的貢獻(xiàn)率。從第一個(gè)主成分開始累計(jì)其貢獻(xiàn)率,當(dāng)累計(jì)貢獻(xiàn)率達(dá)到 99%時(shí)選取所統(tǒng)計(jì)的所有主成分作為特征變量[32]?;赑CA特征變量提取的結(jié)果如圖6所示,前15個(gè)主成分的個(gè)數(shù)達(dá)到了99.20%,因此選擇前15個(gè)主成分作為光譜的特征變量。
2.3.2 基于堆疊自動(dòng)編碼器的特征變量提取
使用SAE對(duì)全光譜進(jìn)行特征提取,通過逐層訓(xùn)練,采用五折交叉驗(yàn)證法劃分樣本集,反復(fù)測(cè)試不同神經(jīng)元個(gè)數(shù)情況下的SVM建模結(jié)果,根據(jù)模型精度確定最佳隱含層個(gè)數(shù)和神經(jīng)元個(gè)數(shù)。在此,將預(yù)處理之后的 230維光譜數(shù)據(jù)作為SAE的輸入層,設(shè)置Sigmoid函數(shù)為激活函數(shù),學(xué)習(xí)率為0.1。因?yàn)镾AE會(huì)將隱含層神經(jīng)元個(gè)數(shù)降低到一個(gè)小的數(shù),因此設(shè)置第 1個(gè)隱含層的神經(jīng)元個(gè)數(shù)為170,第2個(gè)隱含層神經(jīng)元個(gè)數(shù)設(shè)置為1~170。通過算法的迭代,最終輸出圖7a顯示的結(jié)果。根據(jù)圖7a可知當(dāng)?shù)?個(gè)隱含層神經(jīng)元個(gè)數(shù)為127時(shí),測(cè)試集準(zhǔn)確率達(dá)到了最高的93.95%。因此,127被作為第2個(gè)隱含層較佳的神經(jīng)元個(gè)數(shù)。為繼續(xù)降低數(shù)據(jù)維度,設(shè)置第 3個(gè)隱含層的神經(jīng)元個(gè)數(shù)為1~127并進(jìn)行測(cè)試。當(dāng)?shù)?個(gè)隱含層的神經(jīng)元個(gè)數(shù)為 62時(shí)取得較佳的測(cè)試集準(zhǔn)確率為96.23%,如圖7b所示。依此類推,繼續(xù)增加隱含層,獲取較佳神經(jīng)元個(gè)數(shù),結(jié)果記錄在表4。
從表4可以發(fā)現(xiàn),當(dāng)隱含層個(gè)數(shù)為 3,網(wǎng)絡(luò)規(guī)模為230-170-127-62時(shí),SAE得到較佳的建模結(jié)果。當(dāng)隱含層個(gè)數(shù)大于 3時(shí),數(shù)據(jù)的維度雖然得到降低,但模型準(zhǔn)確率發(fā)生下降。說明SAE在網(wǎng)絡(luò)規(guī)模為230-170-127-62時(shí)已經(jīng)充分地獲取230維光譜數(shù)據(jù)中的關(guān)鍵性特征。因此,設(shè)置網(wǎng)絡(luò)規(guī)模為230-170-127-62,將獲取的62維變量作為較優(yōu)化特征。
表4 基于SAE特征提取結(jié)果Table 4 Results of feature extraction based on SAE
建模方法采用SVM,SVM的懲罰因子C和核函數(shù)參數(shù)g設(shè)置為默認(rèn)值。為檢驗(yàn)?zāi)P头€(wěn)定性和魯棒性,按照表2訓(xùn)練集和測(cè)試集樣本比例隨機(jī)劃分樣本集并建立模型,重復(fù)10次,結(jié)果如表5所示。
表5 基于PCA與SAE特征的SVM建模結(jié)果Table 5 SVM model results based on feature extracted by PCA and SAE
從表5中可以發(fā)現(xiàn),PCA特征變量個(gè)數(shù)為15,SAE特征變量為62,都遠(yuǎn)遠(yuǎn)低于全光譜的變量個(gè)數(shù),PCA和SAE特征變量建模準(zhǔn)確率均高于全光譜??芍?,特征提取降低了全光譜中的干擾信息和冗余信息的影響,使得所建立的模型復(fù)雜程度降低,模型性能提高。SAE和PCA特征變量建立的SAE-SVM和PCA-SVM模型準(zhǔn)確率分別為96.47%和92.33%,很明顯SAE-SVM模型準(zhǔn)確率更高。因?yàn)镾AE是一種深層神經(jīng)網(wǎng)絡(luò)降維方法,相較于PCA其能夠準(zhǔn)確獲取原始數(shù)據(jù)中的高階非線性特征。
盡管基于SAE-SVM模型取得了良好的檢測(cè)效果,仍然可以使用智能算法對(duì)該模型的參數(shù)C和g進(jìn)行優(yōu)化,以期取得更好的分類結(jié)果。為此,使用具有良好的參數(shù)尋優(yōu)能力的灰狼優(yōu)化算法(Grey Wolf Optimizer,GWO)[33-34]對(duì)SVM參數(shù)進(jìn)行優(yōu)化。為了驗(yàn)證GWO的有效性,基于表5中 10次隨機(jī)劃分的樣本集分別構(gòu)建GWO-SVM模型,表6記錄了GWO-SVM模型結(jié)果??梢园l(fā)現(xiàn),相較于表5模型,GWO-SVM模型的準(zhǔn)確率均呈現(xiàn)不同程度上升。其中SAE-GWO-SVM性能最高,其訓(xùn)練集和測(cè)試集準(zhǔn)確率平均值分別達(dá)到100%和98.75%,相較于優(yōu)化前分別提高了0.92和2.28個(gè)百分點(diǎn)。綜合分析可知 GWO對(duì) SVM 的優(yōu)化是有效的,將建立的SAE-GWO-SVM模型作為最終的水稻種子活力分級(jí)模型是可行的。
表6 GWO優(yōu)化SVM模型結(jié)果Table 6 Results of SVM model optimized by GWO
獲取 300個(gè)原種子光譜數(shù)據(jù),對(duì)其進(jìn)行預(yù)處理之后將其輸入SAE-GWO-SVM模型得到分類結(jié)果。在此,所用模型為表6中準(zhǔn)確率與平均值準(zhǔn)確率最為接近的SAE-GWO-SVM模型,分類結(jié)果以混淆矩陣展示,如圖8所示。圖8中真實(shí)標(biāo)簽為每個(gè)活力等級(jí)下實(shí)際樣本個(gè)數(shù),對(duì)角線數(shù)值為每個(gè)活力等級(jí)中模型判別正確樣本個(gè)數(shù),網(wǎng)格顏色與其中的數(shù)值大小相關(guān),右側(cè)顏色條為其具體對(duì)應(yīng)關(guān)系。對(duì)角線上網(wǎng)格相較兩側(cè)顏色深,說明絕大部分樣本得到準(zhǔn)確分類。全樣本準(zhǔn)確率為 98%,其與表6結(jié)果接近,225個(gè)高活力樣本、39個(gè)低活力樣本和30個(gè)無活力樣本正確分類,類內(nèi)準(zhǔn)確率分別為98.68%、92.86%和100%。模型對(duì)于每類樣本的識(shí)別準(zhǔn)確率都大于90%,表現(xiàn)出較強(qiáng)的泛化性能,說明建立的SAE-GWO-SVM模型對(duì)于實(shí)際生產(chǎn)具有意義。
本文使用高光譜圖像技術(shù)對(duì)水稻種子進(jìn)行活力分級(jí),采用閾值分割的方式獲取感興趣區(qū)域并從中提取光譜信息。首先使用WTD(Wavelet Threshold Denoising)結(jié)合 FD(First/1stDerivative)的方法降低光譜中的高頻噪聲和重疊峰效應(yīng)。然后分別使用 SAE(Stacked Auto-Encoder,SAE)和 PCA(Principal Component Analysis,PCA)提取光譜數(shù)據(jù)中的特征變量,SAE因其強(qiáng)大的非線性深層次特征提取能力使得基于 SVM(Support Vector Machine)建立的SAE-SVM模型性能表現(xiàn)更好,模型準(zhǔn)確率為 96.47%。最后使用 GWO(Grey Wolf Optimizer)對(duì)SAE-SVM模型進(jìn)行優(yōu)化,模型準(zhǔn)確率達(dá)到98.75%。本文所建立的SAE-GWO-SVM活力分級(jí)模型為高精度檢測(cè)水稻種子活力提供了新的思路,為更好地維護(hù)糧食安全提供了強(qiáng)有力的手段。