白巖康 蔡小嬋 李晶晶
【摘 要】高光譜成像技術(shù)作為一項近年來比較流行的技術(shù),在農(nóng)作物檢測方面展現(xiàn)出了巨大優(yōu)勢[1]。通過儀器和光源照射,高光譜技術(shù)能夠獲取被測物品的二維圖像信息、一維光譜信息,從而無損地檢測出蘋果內(nèi)外在的理化性質(zhì)。文章通過高光譜技術(shù)獲得蘋果數(shù)據(jù)后,利用反向人工神經(jīng)網(wǎng)絡(luò)算法建模,實現(xiàn)對蘋果糖度(蘋果最重要的品質(zhì)之一)的檢測和預(yù)測。經(jīng)過實際訓(xùn)練顯示,該模型蘋果糖度檢測效果為R=0.910 3,預(yù)測誤差均方根為13.17,預(yù)測效果較為良好,是無損檢測蘋果糖度的一個行之可行的方法。文章利用高光譜成像系統(tǒng)采集蘋果的二維圖像信息和一維光譜信息;對采集的數(shù)據(jù)進行降噪和預(yù)處理,篩選出特征波長;利用人工神經(jīng)網(wǎng)絡(luò)BP算法建立蘋果糖度預(yù)測模型;帶入實驗數(shù)據(jù)訓(xùn)練,進行模型的評估。
【關(guān)鍵詞】蘋果糖度;無損檢測;高光譜成像;人工神經(jīng)網(wǎng)絡(luò)BP算法
【中圖分類號】O657.33;TS255.7【文獻標(biāo)識碼】A【文章編號】1674-0688(2020)10-0057-03
1 項目背景與技術(shù)簡介
1.1 研究背景
我國是世界農(nóng)產(chǎn)品的生產(chǎn)和消費大國,水果作為農(nóng)產(chǎn)品的重要組成部分,其產(chǎn)業(yè)能否穩(wěn)步向前,關(guān)系到我國的經(jīng)濟和生態(tài)產(chǎn)業(yè)發(fā)展。蘋果是最常見、最重要的一種水果,我國作為蘋果種植面積最廣、銷量最大的蘋果生產(chǎn)國,蘋果產(chǎn)業(yè)的發(fā)展對提高農(nóng)民收入,實現(xiàn)新農(nóng)村產(chǎn)業(yè)改革具有重要影響。但我國的蘋果產(chǎn)業(yè)目前還存在檢測水平落后、帶損檢測無法高新產(chǎn)業(yè)化等問題。如果能夠由單純的產(chǎn)量大國轉(zhuǎn)變?yōu)楝F(xiàn)代產(chǎn)業(yè)強國,那么中國的蘋果產(chǎn)業(yè)將在經(jīng)濟全球化趨勢下?lián)碛懈鼜姷膰H競爭力。本文利用高光譜成像技術(shù)和人工神經(jīng)網(wǎng)絡(luò)BP算法,針對無損檢測和預(yù)測蘋果內(nèi)在品質(zhì)(以糖度為代表)做初步探索與研究。
1.2 高光譜成像技術(shù)簡介
高光譜成像技術(shù)是基于非常多窄波段的影像數(shù)據(jù)技術(shù),它成功地結(jié)合了成像技術(shù)和光譜技術(shù),通過高光譜技術(shù)可以檢測出實驗物品的二維圖像信息和一維光譜信息[2]。如圖1所示,研究人員把3個維度的信息抽象為空間坐標(biāo)軸上的一個立方體,其中X軸和Y軸代表實驗物品的二維圖像信息,Z軸代表實驗物品的一維光譜信息。通過高光譜獲得的數(shù)據(jù)具有極高的分辨率,廣泛的光譜波段范圍能提供大量實驗物品的內(nèi)外信息。
隨著科學(xué)技術(shù)的不斷發(fā)展,高光譜技術(shù)在越來越多的領(lǐng)域體現(xiàn)了其優(yōu)越的檢測特性,比如食品安全方面融合了空間的圖像信息和光譜中的光譜信息,可以達到同時檢測果蔬等食品外部和內(nèi)部指標(biāo)的目的:在醫(yī)學(xué)診斷方面,高光譜技術(shù)提供了一個較為先進且對人體損傷極小的診斷手法,可以清晰地描述病人的物理、化學(xué)方面的各種體征:在航空航天方面,其高靈敏度、高分辨率和高頻譜范圍的儀器特性可以應(yīng)用于遙感和地球科學(xué)等。
高光譜技術(shù)優(yōu)勢明顯,但是由于從高光譜儀中提取的高光譜數(shù)據(jù)同時包含二維圖像和一維光譜的三維綜合信息,且圖像信息和光譜信息一一對應(yīng),所以圖像的每一個像素點都包含了很長的連續(xù)波段信息,而圖像本身又包含數(shù)據(jù)量龐大的像素點,這就必然導(dǎo)致數(shù)據(jù)采集量過大及冗余程度過強,給后續(xù)的數(shù)據(jù)處理分析帶來一定的難度。
圖2是一個高光譜檢測系統(tǒng)的大致結(jié)構(gòu)示意圖,它由面陣相機、光譜儀、光電轉(zhuǎn)換器、各種控制器、移動平臺及與之連接的計算機軟硬件等部分構(gòu)成[3]。將被檢測的實驗物品平穩(wěn)地放在移動平臺上,打開光源后,其探頭裝置便能將物體照射面的圖像和光譜信息收集在計算機中,采集的具體軟硬件種類可能因物品種類差異而有所不同。
1.3 實驗流程圖
實驗流程圖如圖3所示。
2 實驗材料數(shù)據(jù)采集與預(yù)處理
2.1 實驗材料與實驗環(huán)境
為了保證實驗材料的新鮮程度,實驗開始的前一天在京東商城購買了63個新西蘭“皇家姬娜”蘋果,每個蘋果的重量范圍在160~190 g,形狀規(guī)整,表面光滑,顏色鮮艷。為了提升樣本容量和減少蘋果因?qū)嶒瀸?dǎo)致的浪費,將一個蘋果的兩個半球面拆分開來,分別看成兩個不同的蘋果進行切片取樣。購買的63個蘋果通常都是一半面的顏色較為紅潤,另一個半面則呈現(xiàn)較多的黃色,這樣切片可以在節(jié)省原料的同時為實驗提供更多具有差異性的波段信息。
前期的蘋果糖度檢測及高光譜信息的采集在安徽大學(xué)農(nóng)業(yè)大數(shù)據(jù)實驗室進行。糖度的檢測主要利用數(shù)字糖度計(Digital Refractometer)對蘋果樣本進行糖度測量。
高光譜的圖像和光譜數(shù)據(jù)由實驗室提供的面陣高光譜成像系統(tǒng)平臺及連接于系統(tǒng)的計算機(數(shù)據(jù)采集軟件為SRA Toolkit)進行采集。
采集過后的高光譜數(shù)據(jù)使用ENVI 5.2進行RGB波段選擇和感興趣區(qū)域的選擇,最終導(dǎo)出.csv形式的表格文件。
后期的算法模型和做圖分析所使用的軟件工具為MATLAB2018b。
2.2 樣本數(shù)據(jù)采集和預(yù)處理
2.2.1 高光譜圖像采集
將購買回來的蘋果放在室溫下靜置24 h之后,用一次性滅菌手套把蘋果輕輕放入含有固定裝置的高光譜檢測箱系統(tǒng)內(nèi),預(yù)先確定好采集范圍后將含有該范圍的蘋果的一面朝上對著光源,朝上的受光部分即為圖像采集區(qū)域。調(diào)整光譜范圍和光照強度,使得在SRA軟件上的蘋果image清晰,并且注意曝光值不超過軟件的警告范圍。每個蘋果的一個面測好后貼上標(biāo)簽并標(biāo)號,換另一面重復(fù)上述操作,即可獲得.cube和.hdr格式的文件數(shù)據(jù)。
在上述操作中,每次采集數(shù)據(jù)都要在蘋果邊上放置一個硬質(zhì)白板進行黑白校正,從而盡可能地減少背景噪聲對高光譜數(shù)據(jù)分析產(chǎn)生的影響。高光譜鏡頭蓋取下之前產(chǎn)生的圖像計為R(全黑),將硬質(zhì)白板通過光源檢測生成的圖像計為W(全白),則可以通過公式由原始圖像I得到校正圖像R[4]。
2.2.2 光譜數(shù)據(jù)預(yù)處理
未經(jīng)處理的光譜反射率曲線往往含有大量的噪聲信息,會對數(shù)據(jù)的分析產(chǎn)生較大的干擾。數(shù)據(jù)預(yù)處理的方法有很多種,本文選擇矢量歸一化的方法,該方法能夠有效地減少因光譜變化導(dǎo)致的噪聲影響,公式如下:
2.3 蘋果實際糖度測量
使用數(shù)字糖度計對樣本進行糖度測量。在用數(shù)字糖度計之前,需要將蘋果的一面先切一部分下來,測量質(zhì)量后按照1 g樣本配1 g水的比例放入榨汁機中榨成果汁,接著倒入燒杯攪拌均勻。每次用滴管在燒杯中的一半高度取1.5 mL果汁放入糖度計檢測糖度,每個切片取3次求平均值,作為該樣本的糖度值,小數(shù)點后保留兩位小數(shù)(單位:Brix)。將測量的結(jié)果標(biāo)號并且記錄在Excel表格中。統(tǒng)計的結(jié)果見表1。
2.4 特征波段選擇
由于每個蘋果在使用ENVI 5.2軟件選擇感興趣的區(qū)域(ROI)后導(dǎo)出的 . csv表格文件中,擁有band1到band260波段及不同XY像素點,平均每個文件的數(shù)據(jù)量為260×7 000,如此龐大的數(shù)據(jù)量對后期的建模和數(shù)據(jù)分析尤為不利,所以要想辦法對數(shù)據(jù)進行降維縮減,我們利用MATLAB的模糊極值算法在光譜反射回歸曲線中提取8個特征波段,這8個特征波段包含了絕大部分蘋果的光譜信息。
3 建立深度網(wǎng)絡(luò)模型
3.1 人工神經(jīng)網(wǎng)絡(luò)BP算法簡介
本項目采用的是基于人工神經(jīng)網(wǎng)絡(luò)BP算法的模型。人工神經(jīng)網(wǎng)絡(luò)是模擬生物神經(jīng)系統(tǒng)的。人工神經(jīng)網(wǎng)絡(luò)中神經(jīng)元之間的聯(lián)系可以抽象化為權(quán)值的大小,調(diào)整的方式為循環(huán)往復(fù)的數(shù)據(jù)信息的不斷刺激;而反向傳播(back propagation,BP)算法就是用來調(diào)整權(quán)值的,其核心思想就是訓(xùn)練誤差逐層反向傳播,每層神經(jīng)元與下層神經(jīng)元間權(quán)重通過誤差最速梯度下降的方法調(diào)整。
通常人工神經(jīng)網(wǎng)絡(luò)分為輸入層、隱藏層和輸出層(如圖4所示)。隱藏層和輸出層都有相應(yīng)的激勵函數(shù)(這個激勵方式可以類比為人體的神經(jīng)脈沖)[5]。
常用的激勵函數(shù)有sigmoid和linear函數(shù)。本項目意圖建立蘋果糖度的實際值和測量值的回歸模型,因此使用linear函數(shù)更合適。由訓(xùn)練數(shù)據(jù)集確定輸入層和輸出層的神經(jīng)元數(shù)目;而隱藏層神經(jīng)元數(shù)目的設(shè)定帶有很大的經(jīng)驗性,對經(jīng)驗公式向上取整的數(shù)值可作為隱藏層神經(jīng)元數(shù)目。
3.2 前向傳播
采用以感知機為基礎(chǔ)方式,訓(xùn)練數(shù)據(jù)中含有的信息能夠逐個層次從輸入層傳播到輸出層,公式表達如下:
Xhidden_in=Winput_hiddenXinput
Xhidden_out=fhidden(Xhidden_in)
Xoutput_in=Whidden_outputXhidden_out
Xoutput_out=foutput(Xoutput_in)
3.3 誤差BP(反向)傳播
BP傳播方式和上文所述的前向傳播方式相反,前者是訓(xùn)練數(shù)據(jù)從輸入層傳遞到輸出層,而BP算法則是將訓(xùn)練誤差從輸出層開始反方向地傳遞到網(wǎng)絡(luò)中的所有隱藏層,通過不斷訓(xùn)練,誤差會越來越小。本實驗采用平方誤差損失函數(shù)達到實驗所期待的誤差范圍,用鏈?zhǔn)阶钏偬荻认陆捣ǜ淖儥?quán)值的大小,達到最好的訓(xùn)練效果。其中,損失函數(shù)如下:
E=21(ypred-ytrue)2
3.4 各層梯度和更新函數(shù)
輸出層梯度(誤差):
Gout=Xoutput_out-ytrue
隱藏層到輸出層權(quán)值梯度:
Ghidden_out=Xhidden_outδhidden_output
δhidden_output=Gout×foutput'(Xoutput_in)
輸入層到隱藏層權(quán)值梯度:
Ginput_hidden=Xinputδinput_hidden
δinput_hidden=δhidden_outputWhidden_output×fhidden'(Xhidden_in)
隱藏層到輸出層權(quán)值更新:
ΔWhidden_output=ηGhidden_out+αΔWhidden_
outputprevious
輸入層到隱藏層權(quán)值更新:
ΔWinput_hidden=ηGinput_hidden+αΔWinput_h-
iddenprevious
3.5 算法步驟
步驟1:初始化權(quán)值矩陣W、閾值b。步驟2:訓(xùn)練內(nèi)容(包含前向傳播和誤差反向傳播)。步驟3:迭代訓(xùn)練直到誤差小于閾值ep或達到最大迭代次數(shù)max。上述步驟中輸入?yún)?shù)為訓(xùn)練數(shù)據(jù)集x和y,閾值ep,最大迭代次數(shù)max及其他人工神經(jīng)網(wǎng)絡(luò)所必需的配置參數(shù)。輸出的參數(shù)為人工神經(jīng)網(wǎng)絡(luò)的權(quán)值W。
4 模型預(yù)測結(jié)果與小結(jié)
上文“2.4節(jié)”中提到選擇出8個特征波段代表蘋果的光譜信息,將這8個數(shù)據(jù)作為輸入導(dǎo)入輸入層,根據(jù)經(jīng)驗公式和檢驗調(diào)整,決定隱藏層的個數(shù)為5,最終確定了8-5-1的人工神經(jīng)網(wǎng)絡(luò)BP模型。將該模型的學(xué)習(xí)速度設(shè)定為0.03,可以兼顧數(shù)據(jù)訓(xùn)練速度和訓(xùn)練精度,使得理想訓(xùn)練誤差在0.05左右。
實際蘋果糖度檢測效果為R=0.910 3,預(yù)測誤差均方根為13.17,并用MATLAB做出預(yù)測值和實際值的關(guān)系圖。
由圖5可以看出,經(jīng)過前期高光譜數(shù)據(jù)采集出的蘋果的一維圖像和二維光譜信息,經(jīng)過數(shù)據(jù)預(yù)處理和特征波長的選擇后,輸入基于人工神經(jīng)網(wǎng)絡(luò)BP算法的模型,該模型對蘋果糖度的預(yù)測效果較為理想,是無損檢測蘋果糖度的一個行之有效的方法。后期本項目成員將兼顧蘋果和其他水果的內(nèi)外品質(zhì),并融合多指標(biāo)進行分析實踐,使得本項目思路能夠在更廣泛的平臺上發(fā)揮作用。
參 考 文 獻
[1]劉晶晶,劉付龍,史鐵,等.高光譜圖像技術(shù)檢測蘋果外部損傷[J].中國食品學(xué)報,2018(1):278-284.
[2]馮迪,紀(jì)建偉,張莉,等.基于高光譜成像提取蘋果糖度與硬度最佳波長[J].發(fā)光學(xué)報,2017(6):799-806.
[3]管曉梅,杜軍,張立人,等.基于高光譜技術(shù)的果糖檢測優(yōu)化算法和可視化方法[J].光電子·激光,2018(2):173-180.
[4]吳龍國,何建國,賀曉光,等.高光譜圖像技術(shù)在水果無損檢測中的研究進展[J].激光與紅外,2013(9):990-996.
[5]劉思伽,田有文,張芳,等.采用二次連續(xù)投影法和BP人工神經(jīng)網(wǎng)絡(luò)的寒富蘋果病害高光譜圖像無損檢測[J].食品科學(xué),2017(8):277-282.