劇森 邱道尹 張紅濤 王季琴
【摘 要】近紅外光譜技術(shù)是一種新型的分析技術(shù),它具有高效、快速、操作簡單、穩(wěn)定性好、無污染等優(yōu)點,更重要的是它含有C-H、N-H、O-H等含氫基團基頻和倍頻的吸收帶,可以用來檢測淀粉含H化合物含量的變化;米象和谷蠧的幼蟲在麥粒內(nèi)部生長,使麥粒內(nèi)部的淀粉和蛋白質(zhì)等含量發(fā)生了變化,而這些變化必然會引起近紅外反射光譜吸收率發(fā)生變化,因此,用近紅外光譜是可以檢測到麥粒內(nèi)部是否有害蟲。
【關(guān)鍵詞】近紅外;檢測;麥粒
0.引言
我國不僅是世界上最大糧食生產(chǎn)國,也是是糧食儲藏大國,每年庫存量高達(dá)年產(chǎn)量的一半以上[1],因此,做好糧食儲備具有非常重大的意義。米象、谷蠹等蛀食性害蟲直接危害完整粒,成蟲不僅蠶食麥粒,其幼蟲在麥粒內(nèi)部侵蝕胚乳和胚,很難從外部可視化檢測,而且其排泄物、尸體、皮殼等還會對糧食產(chǎn)生嚴(yán)重的污染。由此可見,麥粒內(nèi)部害蟲造成的危害是非常大的,并且,檢測比較困難的。
麥粒中含有蛋白質(zhì)、脂肪、糖、淀粉和纖維等有機成分,它們在近紅外區(qū)域有豐富的吸收光譜,每種成分都有特定的吸收特征,這些吸收特征為近紅外光譜定量分析提供了依據(jù)。
1.材料和方法
1.1試驗材料準(zhǔn)備
試驗以米象和谷蠧為試驗對象,試驗所用小麥?zhǔn)切孪男←?,淘洗干凈后放入烘烤箱里烘到含水?5%左右。把200頭健康的米象成蟲與300克小麥混合,放在30攝氏度、濕度70%恒溫恒濕箱里培養(yǎng)15天,然后把成蟲和小麥分離出來。從培養(yǎng)用的麥粒中每份挑選出300顆完整和300顆受害蟲用于近紅外相機拍攝,其中每份樣品的80%用做試驗,20%用做測試。
1.2試驗方法
從一個樣品中隨機挑選出300粒麥粒,用近紅外相機進(jìn)行掃描。每五個麥粒為一組,擺放在黑色塑料板上,擺放的時候應(yīng)該注意小麥不能有疊加,以免在分析時產(chǎn)生干擾,然后把塑料板移到近紅外相機拍攝區(qū)域進(jìn)行掃描,掃描的波長在1000~1600nm。
2.數(shù)據(jù)分析
由于傳感器的缺點,大部分相機都有幾個不敏感的像素點,可以導(dǎo)致獲取的高光譜圖像存在噪聲,但是采用1×5窗口的中值濾波可以予以去除。通過執(zhí)行MATLAB碼,查看原圖像。已掃描的高光譜圖像的數(shù)據(jù)的保存形式是矩陣形式,這時需要轉(zhuǎn)換成灰度圖像。使用MATLAB中的bwlabe函數(shù)功能,通過自動設(shè)置臨界值,把每個圖像轉(zhuǎn)換成二值圖像。MATLAB內(nèi)部含有多元圖像分析系統(tǒng),可以用來分析圖像中標(biāo)記的每個麥粒。多元圖像分析系統(tǒng)是基于主成分分析(PCA)。一個簡單的多元圖像含有二個像素坐標(biāo)(寬和高)和一個變量坐標(biāo)(波形值),構(gòu)成一個三維數(shù)組(超立方體)。每隔60個波長,把所有麥粒的按照像素強度(反射比)重新排列成一縱列,那么超立方體數(shù)據(jù)就被重構(gòu)成一個二維數(shù)組。這個二維數(shù)組可用一個k×60 表示,其中K是被標(biāo)記的麥粒的總的像素數(shù)目。然后再用主成分分析法重構(gòu)每個麥粒的二維數(shù)據(jù)組。
最有效的波長應(yīng)該與選擇的第一主成分和第二主成分的最高因子載荷相一致,用于特征提取。從圖像中提取的6個統(tǒng)計圖像特征(最大值,最小值,中值,平均值,標(biāo)準(zhǔn)方差,方差)應(yīng)與有效波形一致。從變換后的圖像中每個有效波長提取10個直方圖特征,然后把這個特征均勻分成10組映射在0和1之間。這些特征可以作為不同判別分類器的輸入。運用多種統(tǒng)計判別分析(線性,二次方程式,馬氏距離)來開發(fā)不同的判別算法。
最有效的波長應(yīng)該與選擇的第一主成分和第二主成分的最高因子載荷相一致,用于特征提取。從圖像中提取的6個統(tǒng)計圖像特征(最大值,最小值,中值,平均值,標(biāo)準(zhǔn)方差,方差)應(yīng)與有效波形一致。從變換后的圖像中每個有效波長提取10個直方圖特征,然后把這個特征均勻分成10組映射在0和1之間。這些特征可以作為不同判別分類器的輸入。運用多種統(tǒng)計判別分析(線性,二次方程式,馬氏距離)來開發(fā)分類算法。線性判別分析(LDA)分類器是以貝葉斯標(biāo)準(zhǔn)合并協(xié)方差。在生物應(yīng)用方面,數(shù)據(jù)不可能總是服從正態(tài)分布,因此合并協(xié)方差并不能得到適當(dāng)?shù)姆诸悺6畏匠膛袆e(QDA)分類器應(yīng)用每類的協(xié)方差計算,而不是合并它們。如果每類的協(xié)方差相等,那么線性判別分析分類器和二次方程判別分析分類器很可能得到同樣的分類結(jié)果。馬爾科夫判別分析分類器是線性判別分析分類器的一個簡化模型,并且假設(shè)已知組有相等的先驗概率。如果數(shù)據(jù)呈橢圓分布并且未知樣品所在組具有最小馬爾科夫距離,那么馬爾科夫判別分析分類器是一個很好的分類器。
3.結(jié)果和討論
在高光譜處理時,第一主成分和第二主成分因子載荷的累積貢獻(xiàn)分別為94%和5%用于波形的提取。在1101,69和1305.05nm處的二個波長與第一主成分的最高因子載荷相一致,在1447.46nm處的波長與第二主成分的最高因子載荷相一致,可以作為特征波長進(jìn)行特征抽取。在分類中,總共提取和使用48個特征(6個統(tǒng)計特征,每個波長10個直方圖特征)。在1100~1300nm范圍內(nèi)的波長吸收帶與C-H第一、第二倍頻和C-H化合帶相一致,因此這個范圍內(nèi)的波形可以被淀粉顆粒吸收。與完整麥粒相比,被糧蟲侵食過的麥粒的淀粉含量減少了,這是由于糧蟲在生長的過程中消耗了淀粉。完整麥粒的胚芽區(qū)域呈暗黑色,但是大部分被侵害的麥粒的胚芽區(qū)域不明亮,較暗部位是被侵蝕區(qū)域,實際的灰度圖像是不能顯示出完整麥粒和被侵蝕麥粒之間的差別。
4.結(jié)論
在1000~1600nm波長范圍內(nèi),二個波長(11101.69nm和1305.5nm)與第一主成分分析的最高因子載荷相一致,可以用來設(shè)計最佳分類器;第二個選擇的波長與第二主成分分析的最高因子載荷相一致,但是不能明顯提高分類器的精確性。合并統(tǒng)計特征和直方圖特征可以最大程度的提高分類器的精確性,使用線性判別分析分類器和二次方程判別分析分類器可以很好的判別出麥粒是否受糧蟲侵食,判別率可達(dá)85%~100%,麥粒的姿態(tài)對分類器設(shè)計的影響不大,因此,近紅外高光譜圖像可以從麥粒判別出麥粒是否受糧蟲侵食。
【參考文獻(xiàn)】
[1]陸良怒.中國農(nóng)業(yè)新發(fā)展與食物安全[EB/OL].http://www.sfncc.org.cn/.
[2]丁聲俊.十億饑餓人口的警示[N].人民日報,2009-10-15.
[3]毛罕平,張紅濤.儲糧害蟲圖像識別的研究進(jìn)展及展望[J].農(nóng)業(yè)機械學(xué)報,2008,39(4):175-179.
[4]Singh C B,Jayas D S,Paliwal J,et al.Detection of insect-damaged wheat kernels using near-infrared hyperspectral imaging[J].Journal of Stored Products Research.2009,45(3):151-158.
[5]張紅濤,胡玉霞,毛罕平.基于SVM的儲糧害蟲圖像識別分類研究[J].農(nóng)機化研究,2008,30(8):36-38.
[6]張紅濤.儲糧害蟲圖像識別中的特征提取研究[D].鄭州:鄭州大學(xué)電氣工程學(xué)院, 2002.