陳婉鈞 陳贊鴻 林暉竣 張勝祥
摘? 要:實(shí)現(xiàn)農(nóng)作物種子品種快速、無損鑒別是農(nóng)業(yè)生產(chǎn)和選育育種重要的一個環(huán)節(jié)。傳統(tǒng)的種子品種鑒別方法存在成本高、耗時長、對檢驗(yàn)人員的技術(shù)要求較高以及有可能對種子產(chǎn)生損傷等缺點(diǎn),難以構(gòu)建自動化和智能化的在線檢測系統(tǒng)。光譜及成像技術(shù)可以實(shí)現(xiàn)高效、無損、快速的農(nóng)作物種子品種鑒定,是目前農(nóng)作物品種鑒定領(lǐng)域的研究熱點(diǎn)。該文總結(jié)了基于深度學(xué)習(xí)的近紅外光譜技術(shù)、高光譜成像技術(shù)在農(nóng)作物品種鑒別領(lǐng)域的研究進(jìn)展,并對該技術(shù)的發(fā)展前景進(jìn)行了展望。
關(guān)鍵詞:光譜分析? 高光譜圖像? 品種鑒別? 空譜聯(lián)合? 無損檢測
中圖分類號:TP391.4 ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A文章編號:1672-3791(2021)01(c)-0005-05
Abstract: Realize rapid and non-destructive identification of crop seed varieties is an important link in agricultural production and breeding. It is difficult to develop an automatic and intelligent on-line detection system due to the disadvantages oftraditional variety identification, such as high cost, long time, high technical requirements for inspectors and possible damage to seeds. Spectroscopy and imaging technology can realize efficient, nondestructive and rapid identification of crop seed varieties, which is a research hot spot in the field of crop variety identification at present. In this paper, the research progress of near infrared spectroscopy and hyperspectral imaging based on deep learning in the field of crop variety identification was summarized. And development prospect of these technologies was also prospected.
Key Words: Spectral analysis; Hyperspectral images; Species identification; Spatial-spectral; Non-destructive testing
種子是特殊的具有生命力的生產(chǎn)資料,其純度的高低直接影響農(nóng)作物產(chǎn)量的高低和優(yōu)良種子的選育。由于我國種子市場交易的作物種子品種日益繁多,且相似品種的種子具有相似的外觀及紋理特征,難以區(qū)分和判斷種子的真?zhèn)涡?。因此不少不法商家摻雜其他品種種子造假、以次充好的現(xiàn)象屢見不鮮。目前,國內(nèi)外傳統(tǒng)的品種鑒別方法主要有基于遺傳標(biāo)記的方法(如簡單序列重復(fù)標(biāo)記,建立隨機(jī)擴(kuò)增多態(tài)DNA指紋圖譜檢測)、蛋白質(zhì)電泳分析、電子鼻、田間鑒別分析、形態(tài)學(xué)分析等方法。這些方法已經(jīng)被證實(shí)具有較高識別準(zhǔn)確率。但遺傳標(biāo)記、化學(xué)檢測方法等儀器設(shè)備成本較高,同時要求檢驗(yàn)人員具有相關(guān)的儀器操作經(jīng)驗(yàn)和專業(yè)背景知識,此外,這些生物檢測技術(shù)對種子具有一定的破壞性且耗時費(fèi)力,不適合對大批量的作物種子的品種進(jìn)行同步在線的無損檢測。而田間鑒別分析技術(shù)易受品種、環(huán)境等因素的影響,檢測周期長且效率低。種子形態(tài)特征(如顏色、紋理、形狀、大小等)差異程度會直接影響形態(tài)分析方法檢測準(zhǔn)確率。因此研究實(shí)現(xiàn)種子品種快速無損鑒別的方法是必要的。
近年來,光譜及成像技術(shù)以快速、無損、經(jīng)濟(jì)、簡單等特點(diǎn)而被廣泛關(guān)注,是未來實(shí)現(xiàn)在線農(nóng)作物種子品種快速、無損鑒別的主要發(fā)展趨勢。特別是近年來數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等新興的信息技術(shù)的蓬勃發(fā)展,為光譜及成像技術(shù)在作物種子品種無損鑒別研究提供新的方法與思路。目前我國在種子品種快速鑒別、無損檢測等領(lǐng)域的研究水平與國外研究水平相比,仍然有較大差距。國外結(jié)合機(jī)器學(xué)習(xí)、數(shù)據(jù)科學(xué)、光譜及成像技術(shù)應(yīng)用于作物種子品種無損檢測已有相關(guān)的研究工作積累和研究成果,并逐步推動商業(yè)化應(yīng)用,開發(fā)在線批量化種子智能檢測系統(tǒng)。該文總結(jié)了光譜及成像技術(shù)應(yīng)用于農(nóng)作物種子品種快速、無損鑒別的研究進(jìn)展,并對該技術(shù)的發(fā)展前景進(jìn)行了展望。
1? 近紅外光譜技術(shù)
1.1 檢測原理
近紅外光譜區(qū)在780~2 526 nm之間,攜帶了有機(jī)分子中能量較高的含氫基團(tuán)化學(xué)鍵振動的合頻和各級倍頻的信息,能夠更明顯地反映不同物質(zhì)結(jié)構(gòu)的差異。種子內(nèi)部含有大量的含氫基團(tuán),因此具有近紅外吸收能力,能夠利用近紅外光譜鑒別種子品種。實(shí)現(xiàn)的技術(shù)路線如圖1所示。
1.2 光譜采集裝置
常見光譜采集系統(tǒng)如圖2所示。該裝置主要包括了檢測器(光譜儀為主)、光源、計(jì)算機(jī)。圖中“樣品放置處”可以通過控制傳送帶或采用電控位移臺運(yùn)送待測種子[1]以縮短采集多粒種子光譜耗費(fèi)的時間。
1.3 光譜采集與處理
近紅外光具有較強(qiáng)的穿透能力和散射效應(yīng),根據(jù)待測物的透光能力的強(qiáng)弱選擇透射方式還是漫反射方式,從而獲得待測樣品對應(yīng)的光譜。目前應(yīng)用研究主要是分析近紅外漫反射光譜,因?yàn)槁瓷涔庾V更能反映種子的表層信息。常見的光譜預(yù)處理方法主要有平滑處理、光散射校正(多元散射校正和標(biāo)準(zhǔn)正態(tài)變量變換等、傅里葉變換、小波變換等。這些方法能夠減少噪聲、雜散光對數(shù)據(jù)的干擾。通常為增強(qiáng)數(shù)據(jù)間的差異性,采用均值中心化、標(biāo)準(zhǔn)中心化或者歸一化對數(shù)據(jù)進(jìn)一步處理。
1.4 特征選擇和提取
基于全波段光譜輸入訓(xùn)練分類器,可能會增加模型計(jì)算的復(fù)雜度,因?yàn)槿ǘ喂庾V會存在一些高度相關(guān)的特征造成特征冗余。因此,在建立多變量判別模型之前,盡可能選擇特征不相關(guān)或是差異性特征明顯的波長。光譜求導(dǎo)、連續(xù)投影和主成分分析是常見的特征波長選擇的方法。對采集的光譜進(jìn)行一階或者二階求導(dǎo)獲得更清晰的不同品種種子的差異信息。選取差異較大的峰谷作為特征輸入,可以減少計(jì)算資源。因?yàn)樗从沉瞬煌贩N間種子含氫基團(tuán)振動的差異,可以作為區(qū)分的主要依據(jù)。采用連續(xù)投影算法篩選的特征波段是最低冗余度、最小共線性且能反映光譜有效的關(guān)鍵信息。主成分分析是將數(shù)據(jù)進(jìn)行投影,投影后的特征是正交的,選擇前k個重要的特征實(shí)現(xiàn)特征選擇,因此不同算法選擇的特征光譜不同。除此之外,林萍等人[2]提出一種遺傳算法提取特征光譜。
1.5 判別模型
建立判別模型可以分為線性建模和非線性建模。其中最小二乘判別分析(PLS-DA)、線性判別分析(LDA)是常用的線性建模方法,加入核函數(shù)的支持向量機(jī)(SVM)、BP人工神經(jīng)網(wǎng)絡(luò)及其變體等經(jīng)典的機(jī)器學(xué)習(xí)算法,是建立非線性多變量判別模型常見的選擇。劉小丹等人[3]建立PLS-DA和SVM模型實(shí)現(xiàn)雜交稻品系識別,準(zhǔn)確率達(dá)到90%以上。蔡月芹等人[4]結(jié)合人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)玉米品種無損快速鑒別,鑒別準(zhǔn)確率達(dá)到100%。林萍等人[5]采用ISOMAP流形降維法,建立PLS-SVM模型實(shí)現(xiàn)了94.67%準(zhǔn)確率的轉(zhuǎn)基因水稻種子及其親本的快速鑒別??梢?,近紅外光譜技術(shù)結(jié)合機(jī)器學(xué)習(xí)算法可以應(yīng)用于品種純度分析,是一種快速無損、有發(fā)展前景的分析技術(shù)。
2? 高光譜成像技術(shù)
2.1 檢測原理
高光譜成像技術(shù)在光譜技術(shù)基礎(chǔ)上結(jié)合了成像技術(shù),使得光譜具有空間分布的特征。采集的數(shù)據(jù)是連續(xù)、窄波段的圖像數(shù)據(jù)(波長從λ0至λn),每一像素塊對應(yīng)連續(xù)波段的光譜信號。像素值與光譜對應(yīng),具有“圖譜合一”的特點(diǎn)。與非成像光譜相比,高光譜成像技術(shù)只需采集一次數(shù)據(jù)即可得到多個樣品的光譜空間分布。
目前,該應(yīng)用研究方向主要有兩種:(1)提取高光譜圖像中種子的光譜信息,基于光譜構(gòu)建多變量的判別模型;(2)融合圖像和光譜信息,構(gòu)建判別模型。見圖4,虛線路徑為(2)方向增加的圖像輸入。與圖1對比,提取單粒種子光譜后的光譜處理的常用方法基本一致。
2.2 高光譜成像系統(tǒng)
試驗(yàn)常用的系統(tǒng)主要由CCD相機(jī)、光譜儀、鏡頭、光源、計(jì)算機(jī)、受控制移動的樣本臺、暗箱構(gòu)成[6],檢測裝置與近紅外光譜檢測裝置類似。
2.3 圖像校正
采集反射率接近100%和接近0的高光譜圖像并根據(jù)式(1)校正原始拍攝的圖像,以減少采集過程中暗電流噪聲對數(shù)據(jù)的影響:
式中,R是校正圖像;Iraw是待測樣品的原始高光譜圖像;Iblack是反射率接近0的高光譜圖像(采集鏡蓋覆蓋住鏡頭的高光譜圖像);Iwhite是反射率接近100%的高光譜圖像(采集白色標(biāo)準(zhǔn)校正板的高光譜圖像)。
2.4 提取單粒種子及平均光譜獲取
提取圖像中的種子區(qū)域并計(jì)算區(qū)域內(nèi)各點(diǎn)的反射率,取均值得到該像素點(diǎn)的光譜值,進(jìn)而獲得種子的平均光譜。因此需要從背景中分割出種子,剔除背景的光譜信息。由于背景簡單且是黑色,常用閾值分割或邊緣分割方法處理。
2.5 判別模型
除1.5節(jié)描述基于光譜構(gòu)建分類器方法外,其他經(jīng)典的機(jī)器學(xué)習(xí)算法也被嘗試結(jié)合高光譜成像技術(shù)應(yīng)用于種子品種鑒別。Yin等人[7]基于SVM、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)和極值學(xué)習(xí)機(jī)(ELM),結(jié)合近紅外高光譜成像技術(shù)鑒別4種不同品種的枸杞,其中ELM識別準(zhǔn)確率達(dá)到91.25%。Zhou等人[8]對比SVM、樸素貝葉斯、k近鄰(KNN)、人工神經(jīng)網(wǎng)絡(luò)、決策樹、LDA和logistic回歸算法鑒別甜玉米種子品種結(jié)果,精度達(dá)到94.07%。
與傳統(tǒng)的機(jī)器學(xué)習(xí)算法比較,深度學(xué)習(xí)更能深度挖掘大量數(shù)據(jù)背后的規(guī)律,任務(wù)表現(xiàn)更佳。Qiu等人[9]構(gòu)建適合一維光譜輸入的卷積神經(jīng)網(wǎng)絡(luò)(CNN)實(shí)現(xiàn)種子品種鑒別,與SVM、KNN相比,CNN模型表現(xiàn)更佳。且隨著訓(xùn)練樣本的增加,CNN的性能提升。崔研改進(jìn)SENet卷積神經(jīng)網(wǎng)絡(luò),提取高光譜圖像差異特征鑒別6種高相似度的稻種,準(zhǔn)確率達(dá)到94.77%[10]。這表明了CNN模型應(yīng)用于作物種子品種鑒別的有效性。杭盈盈等人[11]構(gòu)建堆疊自動編碼器,蘿卜種子品種鑒別準(zhǔn)確率達(dá)96.22%。因此,高光譜成像技術(shù)結(jié)合深度學(xué)習(xí)算法具有很大應(yīng)用潛力。
然而僅提取光譜信息訓(xùn)練分類器,則高光譜圖像的空間信息沒有被利用。近年來,為應(yīng)對噪聲等影響下獲得更佳的識別結(jié)果,融合圖像的空間信息和光譜信息的方法被研究。基于馬爾可夫隨機(jī)場及其改進(jìn)方法被廣泛應(yīng)用[12]。結(jié)合稀疏表示[13]、基于像元鄰域串接光譜信息[14]的方法也被研究應(yīng)用。李治鑫提出了異構(gòu)神經(jīng)網(wǎng)絡(luò)空-譜特征級融合的方法[15]。這些基于圖譜融合的方法為未來應(yīng)用于種子品種無損快速識別提供了新的思路。鄧小琴等人[16]將形態(tài)特征與光譜能量、均值、熵信息融合,實(shí)現(xiàn)檢測精度96%,滿足種子純度不低于95%的國家標(biāo)準(zhǔn)要求。Xia等人[17]基于PLS-SVM建立融合光譜和圖像信息的多元分析判別模型,準(zhǔn)確率達(dá)到97.5%。
傳統(tǒng)的分類任務(wù)通常構(gòu)建單個分類器實(shí)現(xiàn)分類。目前,也有研究融合多分類器以提高分類精度的方法。任守綱等人[18]對高光譜圖像進(jìn)行多尺度提取空譜特征,并構(gòu)建了多個并行結(jié)構(gòu)的SVM分類器,采用“決策級融合”策略進(jìn)行分類,準(zhǔn)確率達(dá)到96%以上。采用并行結(jié)構(gòu)是常見的多分類器融合的方法,此外還有串行結(jié)構(gòu)和混合結(jié)構(gòu)[19]。
高光譜成像技術(shù)結(jié)合人工智能算法能夠?qū)崿F(xiàn)種子品種智能、快速無損識別,降低人工成本、提高檢測效率。但其算法需要大量的訓(xùn)練樣本和穩(wěn)定的模型才能達(dá)到理想的分類效果。基于光譜信息構(gòu)建分類器、基于空-譜信息構(gòu)建判別模型、融合多類特征[20]、采用多分類器融合策略是目前高光譜圖像分類工作的研究熱點(diǎn)。這些方法通常是基于先驗(yàn)樣本的有監(jiān)督學(xué)習(xí)。考慮到構(gòu)建先驗(yàn)知識的成本,半監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的方法也逐漸受到各研究人員的青睞。半監(jiān)督學(xué)習(xí)是只構(gòu)建部分先驗(yàn)知識用于訓(xùn)練分類器,即大量未標(biāo)記的數(shù)據(jù)和少部分標(biāo)記數(shù)據(jù)構(gòu)成訓(xùn)練集,用于訓(xùn)練分類器。無監(jiān)督學(xué)習(xí)算法常用于解決難以進(jìn)行人工標(biāo)注或標(biāo)注數(shù)據(jù)(構(gòu)建先驗(yàn)知識)的成本較高的問題。蘭雨陽提出基于遺傳算法和標(biāo)記樣本位置的高光譜圖像半監(jiān)督分類算法、基于融合區(qū)域的半監(jiān)督高光譜圖像分類算法,它們具有更佳的分類精度[21]。常見的無監(jiān)督學(xué)習(xí)算法有K均值聚類算法、譜聚類等。因此如何設(shè)計(jì)智能分類器模型、適合小樣本訓(xùn)練的方法仍然是考慮的問題。
3? 結(jié)語
種子的純度影響播種后的收成和優(yōu)良種子的選育。傳統(tǒng)品種檢測方法因耗時長、操作復(fù)雜且對檢驗(yàn)人員有技術(shù)門檻等缺點(diǎn),難以實(shí)現(xiàn)自動化的大規(guī)模檢測。光譜及成像技術(shù)具有快速、無損、經(jīng)濟(jì)、簡單等特點(diǎn),是實(shí)現(xiàn)種子品種無損鑒別的主要研究方向。該文總結(jié)了基于深度學(xué)習(xí)的近紅外光譜技術(shù)、高光譜成像技術(shù)在農(nóng)作物品種鑒別領(lǐng)域的研究進(jìn)展。隨著計(jì)算機(jī)技術(shù)和數(shù)學(xué)理論的發(fā)展,高光譜成像技術(shù)結(jié)合人工智能算法實(shí)現(xiàn)批量化、智能化和自動化的種子品種快速無損鑒別應(yīng)用具有極大的發(fā)展?jié)摿?。基于光譜信息構(gòu)建分類器、基于空-譜信息構(gòu)建判別模型、融合多類特征是目前關(guān)注研究的熱點(diǎn)。如何深入挖掘信息特征、降低構(gòu)建先驗(yàn)知識的成本及計(jì)算成本,實(shí)現(xiàn)可行性向?qū)嵱眯赞D(zhuǎn)變,這仍然是未來需要解決的難題。
參考文獻(xiàn)
[1] 邢川平.基于近紅外光譜的玉米品種鑒別系統(tǒng)研建[D].北京林業(yè)大學(xué),2018.
[2] 林萍,陳永明.利用可見近紅外光譜技術(shù)快速鑒別大米品種[J].江蘇農(nóng)業(yè)科學(xué),2015(12):320-323.
[3] 劉小丹,馮旭萍,劉飛,等.基于近紅外高光譜成像技術(shù)鑒別雜交稻品系[J].農(nóng)業(yè)工程學(xué)報,2017,33(22):189-194.
[4] 蔡月芹,趙文杰,王雪.基于近紅外光譜技術(shù)的玉米品種鑒別方法研究[J].江蘇科技信息,2019(21):36-39.
[5] 林萍,高明清,陳永明.基于近紅外光譜分析技術(shù)的轉(zhuǎn)Bt基因水稻種子及其親本快速鑒別方法[J].江蘇農(nóng)業(yè)科學(xué),2019,47(13):72-75.
[6] 王新忠,盧青,張曉東,等.基于高光譜圖像的黃瓜種子活力無損檢測[J].江蘇農(nóng)業(yè)學(xué)報,2019,35(5):1197-1202.
[7] YIN Wenxin,zhang chu,zhu hongyan, et al. Application of near-infrared hyperspectral imaging to discriminate different geographical origins of Chinese wolfberries.[J].PLOS ONE,2017,12(7):e0180534.
[8] zhou quan,huang wenqian,fan shuxiang,et al.Non-destructive discrimination of the variety of sweet maize seeds based on hyperspectral image coupled with wavelength selection algorithm[J].infrared physics & techndogy,2020,109:103418.
[9] qiu zhengjun,chen jian,zhao yiying, et al. Variety Identification of Single Rice Seed Using Hyperspectral Imaging Combined with Convolutional Neural Network[J].Applied Sciences,2018,8(2):212.
[10] 崔研.基于深度學(xué)習(xí)的稻種圖像分類算法研究[D].吉林大學(xué),2020.
[11] 杭盈盈,李亞婷,孫妙君.基于高光譜圖像技術(shù)結(jié)合深度學(xué)習(xí)算法的蘿卜種子品種鑒別[J].農(nóng)業(yè)工程,2020,10(5):29-33.
[12] zhang xiaorong,pan zhibin,lU xiaoqiang,et al.Hyperspectral image classification based on joint spectrum of spatial space and spectral space[J].Multimedia Tools and Applicati-ons,2018,77(22):29759-29777.
[13] zhao wenzhi,dU shihong.Spectral–Spatial Feature Extraction for Hyperspectral Image Classification: A Dimension Reduction and Deep Learning Approach[J].IEEE Transactions on Geoscience and Remote Sensing,2016,54(8):4544-4554.
[14] yue jun,mao shanjun,li mei.A deep learning framework for hyperspectral image classification using spatial pyramid pooling[J].Remote Sensing Letters, 2016,7(9):876-884.
[15] 李治鑫.基于深度學(xué)習(xí)的空譜聯(lián)合高光譜圖像分類算法及系統(tǒng)實(shí)現(xiàn)[D].南京理工大學(xué),2018.
[16] 鄧小琴,朱啟兵,黃敏.融合光譜、紋理及形態(tài)特征的水稻種子品種高光譜圖像單粒鑒別[J].激光與光電子學(xué)進(jìn)展,2015(2):128-134.
[17] xia chao,yang sai,hUang min,et al. Maize seed classification using hyperspectral image coupled with multi-linear discriminant analysis[J]. Infrared Physics & Technology, 2019,103:103077.
[18] 任守綱,萬升,顧興健,等.基于多尺度空譜鑒別特征的高光譜圖像分類[J].計(jì)算機(jī)科學(xué),2018,45(12):243-250.
[19] 李秉璇,周冰,賀宣,等.針對高光譜圖像的目標(biāo)分類方法現(xiàn)狀與展望[J].激光與紅外,2020,50(3):259-265.
[20] 魏利峰.玉米種子高光譜圖像品種檢測方法研究Z
[21] 蘭雨陽.基于波段選Z擇和半監(jiān)督學(xué)習(xí)的高光譜圖像分類[D].西安電子科技大學(xué),2018.Z