吳靜珠, 劉 倩, 陳 巖, 孫麗娟, 張澤宇
(1.北京工商大學(xué) 計(jì)算機(jī)與信息工程學(xué)院 食品安全大數(shù)據(jù)技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100048;2.中國農(nóng)業(yè)科學(xué)院 作物科學(xué)研究所,北京 100081)
基于近紅外與高光譜技術(shù)的小麥種子多指標(biāo)檢測方法*
吳靜珠1, 劉 倩1, 陳 巖1, 孫麗娟2, 張澤宇1
(1.北京工商大學(xué) 計(jì)算機(jī)與信息工程學(xué)院 食品安全大數(shù)據(jù)技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100048;2.中國農(nóng)業(yè)科學(xué)院 作物科學(xué)研究所,北京 100081)
采集47份小麥樣本的高光譜圖像,提取感興趣區(qū)內(nèi)的平均光譜,結(jié)合反映小麥品質(zhì)的水分、蛋白質(zhì)和濕面筋三個指標(biāo)基礎(chǔ)數(shù)據(jù),通過OPUS軟件搜尋最佳的光譜預(yù)處理和波段組合,分別建立了三個指標(biāo)的偏最小二乘法(PLS)定量分析模型。同時與采用近紅外(NIR)光譜技術(shù)建立的三個指標(biāo)的近紅外模型進(jìn)行比較,發(fā)現(xiàn)高光譜模型的各性能指標(biāo)均明顯優(yōu)于近紅外模型。結(jié)果表明:當(dāng)被測樣品為顆粒狀且內(nèi)部化學(xué)成分分布不均勻時,近紅外模型的準(zhǔn)確性和穩(wěn)定性會受其測量條件的限制,而高光譜采樣面積大,獲取信息更全面,展現(xiàn)出強(qiáng)大的分析檢測潛質(zhì),為小麥品質(zhì)評價(jià)提供了新方法。
小麥品質(zhì); 高光譜; 近紅外光譜; 偏最小二乘法
品質(zhì)評價(jià)是小麥生產(chǎn)、收購、儲運(yùn)、加工和育種的重要技術(shù)依托,對國家糧食安全與經(jīng)濟(jì)發(fā)展有非常重要的影響[1]。其中,水分、蛋白質(zhì)、濕面筋是小麥品質(zhì)評價(jià)的重要指標(biāo)。近紅外(NIR)光譜技術(shù)具有操作簡單、分析速度快、無損傷、多組分同時分析等優(yōu)點(diǎn)[2],目前已廣泛應(yīng)用于小麥品質(zhì)分析,并已出臺近紅外技術(shù)檢測小麥水分、蛋白等指標(biāo)的國家標(biāo)準(zhǔn)[3,4]。但近紅外技術(shù)對于小麥等固體樣品,多采用漫反射測量方式,極易受樣品狀態(tài)和裝樣條件的影響,且小麥籽粒內(nèi)部各成分的空間分布極度不均衡,采樣面積過小,則只能獲得樣品的局部化學(xué)信息,將造成較大的測試誤差,模型的可靠性與穩(wěn)定性也得不到保證。
高光譜成像技術(shù)[5]是近年來出現(xiàn)的將光譜與成像科學(xué)相結(jié)合的分析技術(shù),既能獲取被測樣品在不同波長上的圖像信息,又能獲得不同空間點(diǎn)上的光譜信息,因而可以更全面地獲取樣本信息,有更高的分析檢測潛質(zhì)[6~8]。
本文以水分、蛋白質(zhì)和濕面筋含量作為評價(jià)小麥品質(zhì)的三個指標(biāo),采用高光譜技術(shù)建立小麥種子上述三個指標(biāo)的定量分析模型并與近紅外模型比較,推動小麥品質(zhì)快檢的發(fā)展。
1.1 實(shí)驗(yàn)材料
47份小麥樣本由中國農(nóng)業(yè)科學(xué)院作物科學(xué)研究所提供,每份樣本對應(yīng)不同的品種和產(chǎn)地信息。
1.2 化學(xué)值測定
小麥水分含量參照GB 5497—1985 《糧食、油料檢驗(yàn)水分測定法》[9]中105 ℃恒重法進(jìn)行測定,蛋白質(zhì)含量參照GB/T 5511—2008《谷類和豆類氮含量測定和粗蛋白質(zhì)含量計(jì)算(凱氏法)》[10]測定,濕面筋含量參照GB/T 14608—1993《小麥粉濕面筋測定法》[11]測定。
1.3 高光譜圖像采集與處理
1.3.1 高光譜圖像采集與標(biāo)定
選用北京卓立漢光儀器有限公司GaiaSorter高光譜分選儀作為高光譜圖像采集系統(tǒng),如圖1所示。采集過程和儀器參數(shù)設(shè)定如下:取每個小麥樣本100粒平鋪無重疊地放置于樣品臺上采集其高光譜圖像,圖像分辨率320像素×256像素點(diǎn),光譜掃描范圍876~1 729 nm,曝光時間25 ms,波段間隔3.3 nm。
圖1 高光譜圖像采集系統(tǒng)Fig 1 Hyperspectral image acquiring system
由于光源的強(qiáng)度在各個波段下分布不均勻和攝像頭中暗電流的存在,造成光源強(qiáng)度分布較弱的波段所獲得的圖像含有較大的噪聲。因此,需要對所獲得的高光譜圖像按下式進(jìn)行黑白標(biāo)定
(1)
式中Icorrection為校正后的光譜圖像,Iraw為原始光譜圖像,Iwhite為掃描反射率為99 %的標(biāo)準(zhǔn)白板得到的白板標(biāo)定圖像,Idark為關(guān)上光源,擰上鏡頭蓋后采集的黑板標(biāo)定圖像。
1.3.2 高光譜特征提取
首先,為了減少小麥樣本內(nèi)部成分分布不均勻性對測定結(jié)果的影響,選取樣本全區(qū)域作為感興趣區(qū);然后,在樣本與背景區(qū)分明顯的波段下(實(shí)驗(yàn)選取波段為1 026.5 nm)利用最大方差自動取閾法[12]提取樣本輪廓圖像,依次在256個波段下提取樣本輪廓范圍內(nèi)的反射率平均值作為該樣本的光譜信息,如圖2所示。
圖2 1 026.5 nm波段的灰度圖像、輪廓圖像和提取的高光譜Fig 2 Grayscale image at 1 026.5 nm,outline image and extracted hyper-spectrum
高光譜儀在其測量臨界區(qū)有較強(qiáng)的機(jī)器噪聲,因此,截去兩端噪聲嚴(yán)重波段,取939~1 692 nm范圍內(nèi)高光譜進(jìn)行分析。
1.4 近紅外光譜采集
采用德國布魯克公司的VERTEX 70傅立葉變換近紅外光譜儀掃描小麥樣本的近紅外光譜。采用大樣品杯旋轉(zhuǎn)采樣方式,裝樣前仔細(xì)篩查剔除夾雜物和空粒。掃描頻率范圍設(shè)定在939~1 692 nm,掃描次數(shù)為64次。47份小麥樣本的近紅外光譜如圖3所示。
圖3 小麥樣本的近紅外光譜Fig 3 NIR spectra of wheat seed samples
1.5 模型評價(jià)
根據(jù)模型的決定系數(shù)(R2)、交互驗(yàn)證均方根誤差(root mean square error of cross validation,RMSECV)、預(yù)測均方根誤差(root mean square error of prediction,RMSEP)和相對分析誤差(residual predictive deviation,RPD)評價(jià)模型性能。
2.1 樣本統(tǒng)計(jì)信息
47份小麥樣本的水分、蛋白質(zhì)、濕面筋參考值統(tǒng)計(jì)信息如表1所示。
表1 樣本參考值統(tǒng)計(jì)信息(%)Tab 1 Statistic information of reference value of samples
2.2 模型建立與對比
對47份樣本按照Kennard-Stone法以35∶12的比例劃分校正集與預(yù)測集,利用Bruker OPUS定量分析軟件分別篩選出近紅外光譜和高光譜對應(yīng)的最佳光譜預(yù)處理方法和建模波段,結(jié)合偏最小二乘算法(partial least squares,PLS)建立小麥水分、蛋白質(zhì)、濕面筋含量的最優(yōu)近紅外模型和最優(yōu)高光譜模型并進(jìn)行比較,如表2所示。
表2 三個指標(biāo)最優(yōu)高光譜模型與近紅外光譜模型比較Tab 2 Comparison between the optimal hyperspectral and NIR models of three indexes
分析表2可知,與近紅外模型相比,高光譜模型的決定系數(shù)較高,預(yù)測誤差較小,且模型的RPD值較大,說明高光譜模型的性能明顯優(yōu)于近紅外模型,且模型的準(zhǔn)確性和預(yù)測能力較高,可用于精確的定量分析。
結(jié)果表明:高光譜成像技術(shù)可以很好地用于小麥種子品質(zhì)的評價(jià),且比近紅外分析方法有較大的優(yōu)越性。分析原因,近紅外光譜是通過漫反射積分球測樣,由于光斑面積有限,通過旋轉(zhuǎn)方式采樣的面積也僅是一個環(huán)狀區(qū)域,而小麥種子顆粒不均勻且內(nèi)部成分分布極不均衡,近紅外光譜受其采樣方式的限制往往只能獲取樣本局部的信息,造成光譜代表性低,模型穩(wěn)定性不能保證。而高光譜成像技術(shù)是通過面掃描方式得到一堆平鋪開的小麥種子的圖像,再針對性地從圖像上選定目標(biāo)區(qū),獲取每像素點(diǎn)的光譜信息,光譜代表性更強(qiáng),因而可以更精確、全面地反映出樣品內(nèi)部的化學(xué)成分信息,所建的模型的性能更好。
采用高光譜技術(shù),選擇最佳的光譜預(yù)處理方法和波段區(qū)間結(jié)合偏最小二乘法分別建立了小麥種子中水分、蛋白質(zhì)、濕面筋三個指標(biāo)的定量分析模型,并與對應(yīng)的近紅外光譜模型進(jìn)行比較。結(jié)果表明:高光譜模型的各性能指標(biāo)均明顯優(yōu)于近紅外模型,更適用于小麥品質(zhì)的精確評價(jià)。后期可以嘗試針對單籽粒種子進(jìn)行品質(zhì)檢測,用于滿足育種應(yīng)用需求,并進(jìn)一步結(jié)合數(shù)字圖像信息對籽粒的形態(tài)學(xué)特征信息,如大小、飽滿和干癟以及蟲害等進(jìn)一步探索。
[1] 孫 輝,尹成華,趙仁勇,等.我國小麥品質(zhì)評價(jià)與檢驗(yàn)技術(shù)的發(fā)展現(xiàn)狀[J].糧食與食品工業(yè),2010(5):14-18.
[2] 陸婉珍.現(xiàn)代近紅外光譜分析技術(shù)[M].北京:中國石化出版社,2006:9-11.
[3] GB/T 24898—2010.糧油檢驗(yàn)小麥水分含量測定近紅外法[S].
[4] GB/T 24899—2010.糧油檢驗(yàn)小麥粗蛋白質(zhì)含量測定近紅外法[S].
[5] 丁 冬.高光譜成像技術(shù)及其在農(nóng)產(chǎn)品檢測中的應(yīng)用[J].科技信息,2013,35:72,98.
[6] 李美凌,鄧 飛,劉 穎,等.基于高光譜圖像的水稻種子活力檢測技術(shù)研究[J].浙江農(nóng)業(yè)學(xué)報(bào),2015(1):1-6.
[7] 鄧小琴,朱啟兵,黃 敏.融合光譜、紋理及形態(tài)特征的水稻種子品種高光譜圖像單粒鑒別[J].激光與光電子學(xué)進(jìn)展,2015(2):128-134.
[8] 賈仕強(qiáng),劉 哲,李紹明,等.基于高光譜圖像技術(shù)的玉米雜交種純度鑒定方法探索[J].光譜學(xué)與光譜分析,2013(10):2847-2852.
[9] GB/T 5497—1985.糧食、油料檢驗(yàn)水分測定方法[S].
[10] GB/T 5511—2008.谷物和豆類氮含量測定和粗蛋白質(zhì)含量計(jì)算凱氏法[S].
[11] GB/T 14608—1993.小麥粉濕面筋測定法[S].
[12] Rafael C G,Richard E W,Steven L E.Digital image processing using Matlab[M].Beijing:Publishing House of Electronics Industry,2005:305-307.
Multi-index detection method of wheat seed based on NIR and hyperspectrum technology*
WU Jing-zhu1, LIU Qian1, CHEN Yan1, SUN Li-juan2, ZHANG Ze-yu1
(1.Beijing Key Laboratory of Big Data Technology for Food Safety,School of Computer and Information Engineering,Beijing Technology and Business University,Beijing 100048,China;2.Institute of Crop Science,Chinese Academy of Agricultural Sciences,Beijing 100081,China)
hyperspectral images of 47 unit wheat seed samples are collected,and average spectrum information is extracted within the range of interest.Combined with three index basic data of moisture,protein and wet gluten content reflect the quality of wheat seed,partial least squares(PLS)quantitative analysis models of the three index are built separately the optimal spectral preprocessing and waveband combination is searched by OPUS software.And by comparing the hyperspectral models with the NIR models,it is found that the performance index of hyperspectral model is better than that of NIR model.The results show that,when the sample is granular and its chemical composition inside distributes unevenly,the accuracy and stability of the NIR model will be affected by the limitation of its measurement conditions,while hyperspectral technology exhibits larger sampling area,more comprehensive information, and stronger analysis potential, which provides a new way for wheat quality evaluation.
wheat quality; hyperspectrum; near infrared(NIR)spectrum; partial least square(PLS)
10.13873/J.1000—9787(2016)07—0042—03
2015—10—29
土壤植物機(jī)器系統(tǒng)技術(shù)國家重點(diǎn)實(shí)驗(yàn)室開放課題基金資助項(xiàng)目(2014—SKL—05);北京工商大學(xué)兩科基金培育項(xiàng)目(19008001110);北京工商大學(xué)2015年研究生科研能力提升計(jì)劃資助項(xiàng)目
O 657.3
A
1000—9787(2016)07—0042—03
吳靜珠(1979-),女,江蘇無錫人,博士,副教授,主要研究方向?yàn)榛诜肿庸庾V、成像技術(shù)的農(nóng)產(chǎn)品與食品檢測。