国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于介電特征的蘋果霉心病檢測方法

2021-03-29 02:14李東博黃鋁文趙旭博
關(guān)鍵詞:隨機(jī)森林支持向量機(jī)BP神經(jīng)網(wǎng)絡(luò)

李東博 黃鋁文 趙旭博

摘要:針對蘋果霉心病無法有效根據(jù)外表進(jìn)行識別,且傳統(tǒng)檢測方法具有設(shè)備復(fù)雜、成本高昂等問題,本研究通過采集蘋果介電參數(shù)構(gòu)建蘋果霉心病檢測模型,從而實現(xiàn)簡單快速的蘋果霉心病無損檢測?;?LCR 測量儀采集220個蘋果的108項介電指標(biāo)(9個頻率下的12項介電指標(biāo))作為原始參數(shù),使用數(shù)據(jù)標(biāo)準(zhǔn)化、主成分分析算法等對數(shù)據(jù)進(jìn)行預(yù)處理,并利用BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、隨機(jī)森林算法構(gòu)建霉心病果檢測模型。試驗結(jié)果表明,基于隨機(jī)森林算法構(gòu)建的霉心病果檢測模型性能最佳,在150個蘋果構(gòu)建的訓(xùn)練集和70個蘋果構(gòu)建的測試集中分類準(zhǔn)確率分別達(dá)到96.66%和95.71%;基于采用 BP神經(jīng)網(wǎng)絡(luò)構(gòu)建的霉心病果檢測模型效果次之,分類準(zhǔn)確率分別可達(dá)到94.66%和94.29%;基于使用支持向量機(jī)構(gòu)建的模型檢測效果相對較差,分類準(zhǔn)確率分別為93.33%和91.43%。試驗結(jié)果表明,使用隨機(jī)森林構(gòu)建的模型可以更有效地識別霉心病果和好果。本研究可為蘋果病蟲害及蘋果品質(zhì)無損檢測等提供參考。

關(guān)鍵詞:蘋果霉心病;介電特征;隨機(jī)森林; BP神經(jīng)網(wǎng)絡(luò);支持向量機(jī)

中圖分類號: S126文獻(xiàn)標(biāo)志碼: A文章編號:202102-SA035

引用格式:李東博, 黃鋁文, 趙旭博. 基于介電特征的蘋果霉心病檢測方法[J].智慧農(nóng)業(yè)(中英文), 2021, 3(4):66-76.

LI Dongbo, HUANG Lyuwen, ZHAO Xubo. Detection method of apple mould core based on dielectric characteristics[J]. Smart Agriculture, 2021, 3(4):66-76.(in Chinese with English abstract)

1? 引言

蘋果霉心病是一種嚴(yán)重的蘋果采后病害,感染霉心病后的蘋果會由果實的心室往外擴(kuò)展,逐漸導(dǎo)致果肉的腐爛[1],但觀察其外表卻無法發(fā)現(xiàn)明顯的病害特征?;加忻剐牟〉奶O果含有展青霉素和曲棒霉素等毒素[2],具有影響人體生育、致癌、致突變等毒理作用,對人體健康產(chǎn)生較大威脅。霉心病發(fā)病時主要作用蘋果心室,無法有效使用肉眼分辨蘋果是否患有霉心病。因此便捷快速地檢測蘋果是否感染霉心病對于蘋果品質(zhì)檢測、蘋果的采后管理等具有重要的現(xiàn)實意義。

有研究針對蘋果內(nèi)部品質(zhì)檢測嘗試使用不同的方法,主要包括近紅外光譜[3,4]、計算機(jī)視覺[5,6]、核磁共振[7,8]、介電特征[9, 10]等。Mc‐Glone等[11]使用石英鹵鎢燈照射蘋果,獲取其近紅外光譜,并據(jù)此構(gòu)建出蘋果褐變在線檢測系統(tǒng),最優(yōu)模型決定系數(shù)可達(dá)90%。Shenderey等[12]使用近紅外光譜技術(shù),構(gòu)建蘋果霉心病檢測模型,試驗結(jié)果表明霉心病檢測成功率達(dá)到90.1%,其中霉心病果的識別準(zhǔn)確率為88.4%,好果的識別準(zhǔn)確率為91.7%。李順峰等[13]通過采集蘋果的近紅外漫射光譜,并使用多元散射校正、標(biāo)準(zhǔn)正太變量變換等不同的預(yù)處理方法進(jìn)行處理,之后使用主成分分析算法進(jìn)行數(shù)據(jù)降維,從而構(gòu)建出相應(yīng)的檢測模型,結(jié)果表明訓(xùn)練集識別準(zhǔn)確率達(dá)89.9%,測試集識別準(zhǔn)確率達(dá)87.8%。王富春等[14]使用基于計算機(jī)視覺的方法,設(shè)計了蘋果霉心病病變程度的檢測方法,試驗結(jié)果表明誤檢率為8.87%,可以較為有效地測量蘋果霉心病變程度。Stroshine[15]使用低頻磁共振設(shè)備,并安裝高速傳感器對蘋果進(jìn)行無損檢測,判別準(zhǔn)確率達(dá)到88%以上。張立彬等[16]通過采集蘋果的介電特征,并對蘋果阻抗、相對介電常數(shù)和損耗因數(shù)等內(nèi)部品質(zhì)與介電特征之間的關(guān)系進(jìn)行了研究,發(fā)現(xiàn)可以通過介電特征達(dá)到判別蘋果內(nèi)部特征的目的。李芳等[17]使用LCR測量儀采集蘋果在100 Hz~3.98 MHz 間的介電參數(shù),并通過稀疏主元分析、支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)等建模方法構(gòu)建對應(yīng)的分類器,經(jīng)過十折交叉驗證分析,結(jié)果表明對于霉心病果的識別準(zhǔn)確率可達(dá)94%。

相較于其他檢測方法,使用介電方式具有檢測靈敏性高,設(shè)備簡單、成本低、易于實現(xiàn)的特點,但在蘋果霉心病無損檢測領(lǐng)域卻較少有人使用介電方式,且已有文獻(xiàn)著重于分析蘋果霉心病對介電參數(shù)的影響,所構(gòu)建的蘋果霉心病檢測模型識別準(zhǔn)確率也有進(jìn)一步提高的空間。本研究通過增加霉心病果樣本數(shù)量,采用與已有研究不同的數(shù)據(jù)預(yù)處理及建模方法,提高霉心病果檢測正確率,保證所建模型的準(zhǔn)確性和有效性。本研究使用數(shù)據(jù)標(biāo)準(zhǔn)化、主成分分析算法等進(jìn)行介電數(shù)據(jù)預(yù)處理,使用BP 神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和隨機(jī)森林算法構(gòu)建蘋果霉心病檢測模型,以進(jìn)一步提高蘋果霉心病的檢測準(zhǔn)確率。

2? 材料與方法

2.1 試驗材料

本研究以蘋果9種頻率下的12項介電指標(biāo)為研究對象,所使用蘋果采集自陜西省白水縣西北農(nóng)林科技大學(xué)蘋果試驗站,品種為“富士”,通過人工精心選擇挑選一批好果和疑似霉心病果。從中挑選大小相似、顏色相近、表皮無損傷的蘋果220個,于室溫下儲藏。

2.2 蘋果介電參數(shù)采集系統(tǒng)

圖1所示為蘋果介電參數(shù)采集系統(tǒng),所使用主要設(shè)備為日本日置3532-50型LCR測試儀,測試探頭型號為L20004端開爾文夾。

為避免外界環(huán)境所導(dǎo)致的系統(tǒng)誤差,采集蘋果介電數(shù)據(jù)時首先將蘋果置于室內(nèi)24 h ,待蘋果溫度與室內(nèi)溫度平衡后將蘋果放入屏蔽箱,上下移動平行電極板使蘋果緊貼于平行電極板之上,使用LCR測試儀探頭夾住平行電極板進(jìn)行測量,介電參數(shù)通過 RS-232串行接口傳輸?shù)诫娔X上。采集數(shù)據(jù)時沿果實最大橫截面測量,以保持蘋果與平行電極板間接觸面積最大,保證所獲取介電數(shù)據(jù)可以準(zhǔn)確反映蘋果內(nèi)部品質(zhì)。

蘋果的理化性質(zhì)與介電特性在頻率為以10為底的對數(shù)下相關(guān)關(guān)系更加明顯[18, 19],因此本研究使用158、251、398、15,800、25, 100、39,800、1,580,000、2,510,000和3,980,000 Hz共9個頻率,每個頻率下采集12項介電指標(biāo),所采集介電指標(biāo)如表1所示。

采集數(shù)據(jù)時,分別為每個蘋果進(jìn)行編號,每項介電指標(biāo)將其頻率作為下標(biāo),如Z158表示該蘋果在頻率為158 Hz 下所采集的復(fù)阻抗,其他介電指標(biāo)同理可得。同時為避免采集過程中系統(tǒng)性誤差對試驗效果產(chǎn)生影響,每個蘋果分別采集5 次數(shù)據(jù),最后以5次數(shù)據(jù)的平均值作為該蘋果的介電數(shù)據(jù)。

采集完成電學(xué)指標(biāo)之后,對每個蘋果進(jìn)行破壞性試驗,觀察其是否為霉心病果,最終確認(rèn)霉心病果164個,好果56個。劃分訓(xùn)練集與測試集時,隨機(jī)選取110個霉心病果和40個好果作為訓(xùn)練集,剩余的54個霉心病果和16個好果作為測試集進(jìn)行后續(xù)試驗。

2.3 原始數(shù)據(jù)預(yù)處理

使用 LCR 儀采集到介電參數(shù),由于數(shù)據(jù)格式是以二維表的形式存儲,即對于每一個蘋果而言,其介電數(shù)據(jù)都可視為9 ×12的二維數(shù)組,對于所有數(shù)據(jù)可視為220× 9× 12的三維矩陣。但是此數(shù)據(jù)格式不利于進(jìn)行數(shù)據(jù)處理,因此需要進(jìn)行數(shù)據(jù)扁平化操作。與此同時,所采集的介電參數(shù)是在較大范圍頻率下采集的,數(shù)據(jù)分布范圍不均勻,數(shù)據(jù)大小有明顯差異。不同的介電指標(biāo)具有不同的量綱,導(dǎo)致采集到的介電指標(biāo)數(shù)據(jù)相差較大。為防止試驗中大數(shù)據(jù)對小數(shù)據(jù)的影響,消除不同指標(biāo)間的量綱影響,需要對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。

進(jìn)行數(shù)據(jù)扁平化處理時,分別將每個蘋果的108項指標(biāo)由9 ×12的二維矩陣轉(zhuǎn)換為1 ×108的一維矩陣,同時將所有的蘋果數(shù)據(jù)進(jìn)行拼接,最終形成220× 108的蘋果介電數(shù)據(jù)庫。

蘋果的介電參數(shù)是在9 種不同頻率下采集的,因此相同介電指標(biāo)在不同頻率下數(shù)據(jù)會產(chǎn)生較大的差異,如圖2所示。在同一頻率中不同的介電指標(biāo)由于各自量綱的不同,數(shù)據(jù)的大小也會存在較大差異,如圖3所示。

圖2 中以復(fù)阻抗為例展示了其在15,800、25, 100和 39, 800 Hz 中的分布趨勢,從中可以觀察到不同頻率對復(fù)阻抗具有較大影響,隨著頻率的上升,復(fù)阻抗值以倍數(shù)形式擴(kuò)增。圖3中展示了 158 Hz 下并聯(lián)電阻、并聯(lián)電感及并聯(lián)電容的變化情況,因為三者之間數(shù)據(jù)相差巨大,所以使用對數(shù)刻度的樣式進(jìn)行展示,可以觀察到三者處于不同分布,相互之間具有數(shù)量級差異。

由于數(shù)據(jù)間的巨大差異,不進(jìn)行數(shù)據(jù)預(yù)處理將有較大概率導(dǎo)致后續(xù)試驗中較大的數(shù)據(jù)訓(xùn)練時占據(jù)更大的比重,較小的數(shù)據(jù)則占據(jù)更小的比重甚至于直接被忽略。而較小的數(shù)據(jù)中也可能蘊(yùn)藏著較為重要的信息,因此需要將原始數(shù)據(jù)進(jìn)行處理,消除不同量綱的影響。

預(yù)處理時使用了 Z-score 標(biāo)準(zhǔn)化方法對原始數(shù)據(jù)進(jìn)行處理,其數(shù)學(xué)模型如下所示。

x*? =?????? ?????????????????????????????????( 1)

其中,x*為標(biāo)準(zhǔn)化后的數(shù)據(jù); x為原始數(shù)據(jù);為原始數(shù)據(jù)均值;σ 為原始數(shù)據(jù)標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化后數(shù)據(jù),如圖4所示。

圖4(a)是原始數(shù)據(jù)中Z158的數(shù)據(jù)分布情況,圖 4(b)是經(jīng)過標(biāo)準(zhǔn)化后 Z158的數(shù)據(jù)分布情況。兩者對比可以看出兩者數(shù)據(jù)分布幾乎沒有變化,但是數(shù)據(jù)分布區(qū)間已經(jīng)大大減小,同時數(shù)據(jù)間的關(guān)聯(lián)性得到了很好的保留,證明了標(biāo)準(zhǔn)化后的數(shù)據(jù)依舊有效。通過對比圖2與圖4 (c)可以得到,標(biāo)準(zhǔn)化后的數(shù)據(jù)可以很好地將不同頻率下的數(shù)據(jù)映射到較小的區(qū)間,同時可以保留數(shù)據(jù)間的關(guān)聯(lián)性。同理,觀察圖3與圖4(d)可得,經(jīng)標(biāo)準(zhǔn)化后,數(shù)據(jù)可以消除不同指標(biāo)間度量單位帶來的影響,并可很好地保留原始數(shù)據(jù)的原有信息。

2.4 建模方法

介電特性數(shù)據(jù)分析方法常用的算法有 BP 神經(jīng)網(wǎng)絡(luò)(Back? Propagation? Neural? Network, BPNN)預(yù)測模型[20]、支持向量機(jī)(Support? Vector Machine ,SVM)[21]和隨機(jī)森林(Random? Forest ,RF)[22]等模型。BPNN 是一種按照數(shù)據(jù)間誤差進(jìn)行逆向傳播訓(xùn)練網(wǎng)絡(luò)的多層前饋神經(jīng)網(wǎng)絡(luò),是應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)之一,具有優(yōu)秀的非線性映射能力,在眾多領(lǐng)域有著不俗的表現(xiàn)。 SVM 是一種按照監(jiān)督學(xué)習(xí)方式對數(shù)據(jù)進(jìn)行分類的模型,可以使用核方法進(jìn)行非線性映射,在分類領(lǐng)域占據(jù)著重要的地位。RF 是采取了集成思想的算法,將多個弱分類器通過組合變成一個強(qiáng)分類器。RF 通過隨機(jī)選取不同的訓(xùn)練樣本和數(shù)據(jù)特征,根據(jù)每種訓(xùn)練樣本和數(shù)據(jù)特征構(gòu)建出對應(yīng)的決策樹,通過統(tǒng)計森林中所有決策樹的分類結(jié)果,從而得出最終的分類結(jié)果,在多種數(shù)據(jù)集中都擁有著優(yōu)秀的表現(xiàn),且相較于其他算法可以有效降低訓(xùn)練時長。

本研究根據(jù)經(jīng)預(yù)處理并使用主成分分析(Principal Component Analysis ,PCA)[23]算法降維后所得主成分作為模型輸入,結(jié)合 BPNN、 SVM以及RF構(gòu)建蘋果霉心病分類模型,對三種建模方法分別構(gòu)建對應(yīng)的分類模型,通過對比分析確定最優(yōu)的模型。

3? 結(jié)果與分析

3.1 介電數(shù)據(jù)降維

數(shù)據(jù)采集時通過9個不同的頻率采集蘋果的12項介電參數(shù),因此對于每個蘋果而言,不同頻率下的某些介電指標(biāo)經(jīng)過標(biāo)準(zhǔn)化后蘊(yùn)藏的信息量可能會極其相似,導(dǎo)致信息冗余,因此需要使用降維算法消除數(shù)據(jù)間的信息冗余。

將標(biāo)準(zhǔn)化之后的介電數(shù)據(jù)采用 PCA方法降維后,其前30項主成分貢獻(xiàn)率占比如圖5所示。

從圖中可以觀察到,第十主成分之后提供的貢獻(xiàn)率已經(jīng)極其微小,結(jié)合具體數(shù)值分析,第一主成分(PC1)貢獻(xiàn)率達(dá)到43.69%,第二主成分(PC2)、第三主成分(PC3)和第四主成分(PC4)的貢獻(xiàn)率分別達(dá)到了14.19%、10.53%和8.61%,前四個主成分累計貢獻(xiàn)率已經(jīng)達(dá)到近80%。但是考慮到如果選取的主成分?jǐn)?shù)量較少,可能會導(dǎo)致后續(xù)試驗中因為訓(xùn)練數(shù)據(jù)過少而出現(xiàn)欠擬合現(xiàn)象,因此選取降維后的前14個主成分,其貢獻(xiàn)率以及累計貢獻(xiàn)率如表2所示。

從表2中可以觀察到前五個主成分累計貢獻(xiàn)率已經(jīng)達(dá)到81.89%,前十個主成分累計貢獻(xiàn)率達(dá)到94.31%,從第十四主成分(PC14)開始,后續(xù)主成分所提供的貢獻(xiàn)率漸漸小于0.5%,已經(jīng)較難提供更多原始數(shù)據(jù)中的信息??紤]主成分的個數(shù)以及累計貢獻(xiàn)率之間的關(guān)聯(lián),為了后續(xù)試驗分類的準(zhǔn)確性,選取累計貢獻(xiàn)率達(dá)到97.07%的主成分,即前14個主成分。

3.2 建模方法與結(jié)果

試驗中采用 BPNN 、SVM 與 RF 三種建模方法構(gòu)建霉心病果、好果分類模型,三組試驗中輸入特征變量都為經(jīng)PCA 處理后的主成分變量,三組試驗彼此獨立進(jìn)行,對比模型分類效果后選擇分類效果最理想的模型作為最終分類模型。為后續(xù)表述簡潔,三組試驗分別以 PCA-BP、 PCA-SVM和PCA-RF表示。

3.2.1?? PCA-BP模型參數(shù)的選擇與設(shè)定

本研究所使用的BP神經(jīng)網(wǎng)絡(luò)為三層BP神經(jīng)網(wǎng)絡(luò),包含輸入層、隱藏層以及輸出層。該模型中使用 Sigmoid函數(shù)作為傳遞函數(shù),影響該模型分類效果的因素包括隱藏層神經(jīng)元個數(shù)、初始權(quán)值、學(xué)習(xí)速率以及期望誤差。增加隱藏層神經(jīng)元的個數(shù)相較于增加隱藏層的層數(shù)從結(jié)構(gòu)實現(xiàn)角度而言更加簡單,也可降低模型的復(fù)雜度。隱藏層神經(jīng)元太少時,BP 神經(jīng)網(wǎng)絡(luò)無法很好地進(jìn)行學(xué)習(xí),迭代次數(shù)也會延長,模型精度不夠。隱藏層神經(jīng)元個數(shù)太多時,網(wǎng)絡(luò)的學(xué)習(xí)時間會逐步增加,同時也容易出現(xiàn)過擬合現(xiàn)象。初始權(quán)值的選擇會影響后續(xù)網(wǎng)絡(luò)訓(xùn)練的復(fù)雜度,合理的初始權(quán)值會有效降低模型訓(xùn)練時間,反之不合理的初始權(quán)值會增加模型訓(xùn)練代價。學(xué)習(xí)速率同樣會對模型的訓(xùn)練及精度產(chǎn)生影響,過大的學(xué)習(xí)精度可能會導(dǎo)致模型不穩(wěn)定,同時也有可能會跳過最優(yōu)解,過小的學(xué)習(xí)精度會導(dǎo)致收斂速度過慢,從而需要花費(fèi)更多的訓(xùn)練時間。

模型中如采用固定值作為初始權(quán)值,則會導(dǎo)致隱藏層節(jié)點都具有相同的計算結(jié)果,進(jìn)而導(dǎo)致模型的收斂速度將大幅降低。因此為保證模型的收斂速度,防止出現(xiàn)梯度消失或者梯度爆炸現(xiàn)象,因此將初始權(quán)值設(shè)定為(- 1,1)之間的隨機(jī)數(shù),期望誤差設(shè)置為0.001,隱藏層節(jié)點個數(shù)按照經(jīng)驗公式,并結(jié)合試湊法確定最佳隱藏層節(jié)點數(shù)。經(jīng)驗公式如下所示。

h =? +α?????????????????????????? (2)

其中,h 為隱藏層節(jié)點數(shù)量,個; m 為輸入層節(jié)點數(shù)量,個; n 為輸出層節(jié)點數(shù),個;α 為1~10之間的常數(shù)。

試驗中輸入層節(jié)點個數(shù)設(shè)置為15,輸出層節(jié)點個數(shù)設(shè)置為1 ,α取值設(shè)置為5 ,因此隱藏層節(jié)點個數(shù)設(shè)置為9。

考慮到模型中不同階段會使用到不同的學(xué)習(xí)速率,因此設(shè)置學(xué)習(xí)速率時并沒有固定學(xué)習(xí)速率,而是根據(jù)變學(xué)習(xí)率公式進(jìn)行動態(tài)調(diào)節(jié),變學(xué)習(xí)率公式如下所示:

η(t )= ηmax? - t ×(ηmax? -ηmin)/tmax(3)

其中,ηmax為最大學(xué)習(xí)率;ηmin為最小學(xué)習(xí)率;tmax為最大迭代次數(shù),次; t 為當(dāng)前迭代次數(shù),次。

本試驗中最大學(xué)習(xí)率設(shè)置為0.1 ,最小學(xué)習(xí)率設(shè)置為0.0001,最大迭代次數(shù)設(shè)置為3000。

3.2.2?? PCA-SVM模型參數(shù)的選擇與設(shè)定

SVM 通過將原始數(shù)據(jù)進(jìn)行映射,使其在高維空間中線性可分,影響 SVM分類效果的參數(shù)主要有核函數(shù)、多項式維度、停止訓(xùn)練的誤差值大小、最大迭代次數(shù)、是否采用概率估計、懲罰參數(shù) C 、核函數(shù) Gamma參數(shù)等,其中對試驗結(jié)果影響最大的有核函數(shù)類型、Gamma以及C 。徑向基核函數(shù)(Radical Basis Function ,RBF)可以實現(xiàn)非線性映射,減少數(shù)據(jù)計算難度,同時RBF所涉及的參數(shù)較少,相較于其他多項式核函數(shù)可以有效降低模型的復(fù)雜度,因此本研究中選擇 RBF 作為核函數(shù)。C 與 Gamma 的選取采用了網(wǎng)格搜索化方法,該方法只需將參數(shù)輸入進(jìn)去,即可自行進(jìn)行調(diào)優(yōu),選取最優(yōu)的參數(shù)。本研究將C 和 Gamma 的原始參數(shù)分別設(shè)置為[0.001,0.01,0.1 ,0.5,1,1.5,2,3,4,5,10,100,1000]和[0.001, 0.005, 0.0001, 0.0005,0.00001,0.00005],經(jīng)過采用十折交叉驗證法進(jìn)行相關(guān)試驗之后,最終得到的最優(yōu)參數(shù)組合為C取3, Gamma取0.0005。

3.2.3?? PCA-RF模型參數(shù)的選擇與設(shè)定

隨機(jī)森林是由一系列決策樹構(gòu)成的強(qiáng)分類器,其分類能力的強(qiáng)弱取決于所構(gòu)建的決策樹的分類能力,主要影響的參數(shù)包括節(jié)點分裂時所需的最小樣本數(shù)量(min_split),葉子節(jié)點最少樣本數(shù)量(min_leaf),分裂所需最小增益(min_split_gain),采樣方式(sampleing_mode),隨機(jī)森林中決策樹數(shù)量(tree_num),決策樹高度(tree_depth)等。經(jīng)預(yù)試驗最佳參數(shù)組合如表3所示。

同時為了更加深入比較決策樹數(shù)量及決策樹高度對分類效果的影響,將森林規(guī)模分別設(shè)置為:5,10,15,20,25,50,100,200,300;每棵決策樹的最大深度設(shè)置為:3 ,5,10,15,20,25,30,35,40,45,50。試驗中在每種森林規(guī)模下分別將決策樹設(shè)置為不同的深度,通過比較每種不同規(guī)模森林及不同決策樹高度下分類的準(zhǔn)確率及訓(xùn)練時間,從而選取最為合適的森林規(guī)模和決策樹高度。不同規(guī)模森林及不同決策樹高度分類準(zhǔn)確率如圖6所示。

從圖6(a)中可以觀察到,當(dāng)森林規(guī)??刂圃?0和25時都可以獲取較為不錯的分類準(zhǔn)確率,最高分類準(zhǔn)確率都可達(dá)到95%以上。當(dāng)森林規(guī)??刂频?、10和15時識別準(zhǔn)確率較低,在不同決策樹深度下,識別準(zhǔn)確率有較大的波動。與此同時,當(dāng)森林規(guī)模較高時,同樣可以獲取較為準(zhǔn)確的識別準(zhǔn)確率。但是從圖6(b)中可以看出,隨著森林規(guī)模的增加,搭建分類模型所需的時間將逐步增加,當(dāng)森林的規(guī)模超過50時,訓(xùn)練所需的時間將大幅上升。所以將森林的規(guī)??刂圃?0 以內(nèi)會是較好的選擇。結(jié)合圖6 (a)與圖6 (b)可得到,雖然森林規(guī)模較高時分類模型同樣具有較好的分類準(zhǔn)確性,但是其訓(xùn)練耗時遠(yuǎn)遠(yuǎn)超過森林規(guī)模較小時的訓(xùn)練耗時。因此,為了避免漫長的訓(xùn)練耗時,應(yīng)該選擇較小的森林規(guī)模。

為了更加清晰地比較不同規(guī)模森林的識別準(zhǔn)確率和耗時,提取了每種森林規(guī)模下的最好分類準(zhǔn)確率和平均試驗耗時,如圖6 (c)和圖6 (d)所示。從圖中可以觀察到,當(dāng)森林規(guī)模為20和 25時擁有著最高的識別準(zhǔn)確率,同時訓(xùn)練耗時也較少。因此應(yīng)該選擇森林規(guī)模和決策樹深度分別為(20,20)和(25,40)作為下一步試驗參數(shù),以期望獲得更好的分類效果。

為進(jìn)一步獲取更加準(zhǔn)確的試驗結(jié)果,根據(jù)上文中取得的表現(xiàn)較好的森林規(guī)模和決策樹深度,進(jìn)行十折交叉驗證試驗。將原始數(shù)據(jù)分成相等的十份,每次取其中的一份作為測試集,將剩余九份作為訓(xùn)練集,最終取十次結(jié)果的平均值作為最終的分類準(zhǔn)確率,試驗結(jié)果如圖7所示。

從圖7可以明顯看出,當(dāng)森林規(guī)模為20、決策樹深度為20時,分類模型的分類準(zhǔn)確率要優(yōu)于另一組,兩者的平均識別準(zhǔn)確率分別為0.946和0.936。因此,在森林規(guī)模為20、決策樹深度為20時可以取得最優(yōu)的分類效果,最高分類準(zhǔn)確率可達(dá)0.957。

3.2.4? 模型結(jié)果分析

將原始蘋果介電參數(shù)經(jīng)過 PCA 降維得到的主成分與經(jīng)過破壞性試驗所得到的蘋果標(biāo)簽(其中標(biāo)簽為“1”表示為霉心病果,標(biāo)簽為“0”表示為正常果)組合起來作為模型輸入變量,分別輸入 PCA-BP ,PCA-SVM 和 PCA-RF 三種模型中,三組模型的最優(yōu)識別準(zhǔn)確率結(jié)果如表4所示。

從試驗結(jié)果上可以觀察到,PCA-RF 的分類效果最好,訓(xùn)練集中識別準(zhǔn)確率達(dá)到96.66%,訓(xùn)練集中150個蘋果的錯分樣本數(shù)只有5個,誤判率僅為3.33%。PCA-RF 在共70個蘋果組成的測試集中也有著最好的表現(xiàn),分類準(zhǔn)確率達(dá)到95.71%。錯分樣本共計3個,其中,好果全部可以正確分類,霉心病果中有3個樣本被錯分為好果。PCA-BP 模型的分類效果僅次于 PCA-RF,其在訓(xùn)練集中分類準(zhǔn)確率達(dá)到94.66%,測試集中分類準(zhǔn)確率為94.29%,訓(xùn)練集中錯分樣本為6個,測試集中錯分樣本為4個,分類效果與 PCA-BP 相似。PCA-SVM 模型分類效果相對較差,其在訓(xùn)練集中分類準(zhǔn)確率可達(dá)93.33%,但在測試集中分類準(zhǔn)確率僅能達(dá)到91.43%,錯分樣本量在訓(xùn)練集和測試集中分別為10個和6個,誤判率分別為6.66%和8.57%。

從表4可以觀察到三組模型出現(xiàn)誤判時將霉心病果誤判為好果的比例要大于將好果誤判為霉心病果的比例,三組數(shù)據(jù)組合起來,出現(xiàn)誤判的樣本共計34條,其中霉心病果誤判為好果占據(jù)26條,占比達(dá)到76.5%,而將好果誤判為霉心病果的樣本數(shù)共計8 條,所占比例為23.5%。具體到每個模型中,以PCA-RF為例,訓(xùn)練集和測試集中錯分樣本共計8條,其中霉心病果錯分為好果的數(shù)量為7條,其比例達(dá)到87.5%??傮w而言,將霉心病果錯分為好果的概率要遠(yuǎn)大于將好果錯分為霉心病果的概率,導(dǎo)致這種現(xiàn)象出現(xiàn)的原因可能是由于樣本中存在一些霉心果的癥狀較為輕微,還未大幅影響蘋果的介電特征,所以導(dǎo)致模型分類時將其錯分為好果。

4? 結(jié)論

本研究針對霉心病果分類這一具體問題,使用 BPNN 、SVM 和 RF三種建模方法,結(jié)合數(shù)據(jù)標(biāo)準(zhǔn)化、主成分分析算法等預(yù)處理方法構(gòu)建出利用蘋果9種頻率下12項介電指標(biāo)進(jìn)行訓(xùn)練的霉心病果分類模型。試驗結(jié)果表明,使用RF 構(gòu)建的模型分類效果更佳,在測試集中最高分類效果達(dá)到96.66%,BPNN所構(gòu)建模型效果次之,測試集中分類效果達(dá)到94.29%,SVM所構(gòu)建模型分類效果相對其余兩種方法效果較差,測試集中分類效果僅為91.43%。

本研究構(gòu)建的蘋果霉心病分類模型可以有效地分辨出霉心病果和好果,有效地將蘋果介電參數(shù)與蘋果霉心病檢測結(jié)合到一起,可為后續(xù)研究奠定基礎(chǔ)。

與已有研究相比,本研究中使用了不同的數(shù)據(jù)預(yù)處理及建模方法,所構(gòu)建的蘋果霉心病檢測模型更為有效,霉心病果的識別準(zhǔn)確率有了較為明顯的提高,但與此同時本研究僅針對“富士”這一種蘋果,未對比其他蘋果品種的分類準(zhǔn)確率,在接下來的研究中可以采集不同品種蘋果介電參數(shù),對比不同品種下模型效果,提高模型通用性。

參考文獻(xiàn):

[1] PATRIARCA A. Fungi and mycotoxin problems in theapple? industry[J]. Current? Opinion? in? Food? Science,2019, 29:42-47.

[2] ZHONG L, CARERE J, LU Z, et al. Patulin in applesand? apple-based? food products: The burdens? and themitigation strategies[J]. Toxins, 2018, 10(11): ID 475.

[3]郭志明, 黃文倩, 陳全勝, 等. 近紅外光譜的蘋果內(nèi)部品質(zhì)在線檢測模型優(yōu)化[J].現(xiàn)代食品科技, 2016, 32(9):147-153.

GUO Z, HUANG W, CHEN Q, et al. Optimization ofonline detection model for internal quality of apple bynear? infrared? spectroscopy[J]. Modern? Food? Scienceand Technology, 2016, 32(9):147-153.

[4]王轉(zhuǎn)衛(wèi), 遲茜, 郭文川, 等. 基于近紅外光譜技術(shù)的發(fā)育后期蘋果內(nèi)部品質(zhì)檢測[J].農(nóng)業(yè)機(jī)械學(xué)報, 2018,49(5):348-354.

WANG Z, CHI Q, GUO W, et al. Internal quality detec‐tion of apple in late development stage based on nearinfrared? spectroscopy[J]. Transactions? of the? CSAM,2018, 49(5):348-354.

[5]高輝, 馬國峰, 劉偉杰. 基于機(jī)器視覺的蘋果缺陷快速檢測方法研究[J].食品與機(jī)械 , 2020, 36(10):125-129.

GAO? H,? MA G,? LI W. Research? on rapid? detectionmethod of apple defects based on machine vision[J].Food & Machinery, 2020, 36(10):125-129.

[6] BHARGAVA A, BANSAL? A. Quality? evaluation? ofMono & bi-Colored apples with computer vision andmultispectral imaging[J]. Multimedia Tools and Appli‐cations, 2020, 79(11):7857-7874.

[7]張京平, 朱建錫, 孫騰. 蘋果內(nèi)部品質(zhì)的CT成像結(jié)合傅里葉變換方法檢測[J].農(nóng)業(yè)機(jī)械學(xué)報, 2014, 45(5):197-204.

ZHANG J, ZHU J, SUN T. Detection of apple internalquality by CT imaging combined with Fourier trans‐form method[J]. Transactions of the CSAM, 2014, 45(5):197-204.

[8]曹玉棟, 祁偉彥, 李嫻, 等. 蘋果無損檢測和品質(zhì)分級技術(shù)研究進(jìn)展及展望[J].智慧農(nóng)業(yè), 2019, 1(3):29-45. CAO Y, QI W, LI X, et al. Research progress and prospect on non-destructive detection and quality grading technology of apple[J]. Smart Agriculture, 2019, 1(3):29-45.

[9]蔡騁, 李永超, 馬惠玲, 等. 基于介電特征選擇的蘋果內(nèi)部品質(zhì)無損分級[J].農(nóng)業(yè)工程學(xué)報, 2013, 29(21):279-287.

CAI C, LI Y, MA H, et al. Nondestructive grading of apple internal quality based on dielectric feature selection[J].? Transactions? of? the? CSAE,? 2013,? 29(21):279-287.

[10] 王若琳, 王棟, 任小林, 等. 基于電學(xué)特征的蘋果水心病無損檢測[J].農(nóng)業(yè)工程學(xué)報, 2018, 34(5):129-136.? WANG R, WANG D, REN X, et al. Nondestructive detection of apple water core disease based on electrical characteristics[J]. Transactions of the CSAE, 2018, 34(5):129-136.

[11] MCGLONE V A, MARTINSEN P J, CLARK C J, etal. On-line detection of Brown heart in Braeburn apples using near infrared transmission measurements[J]. Postharvest? Biology? and? Technology, 2005,? 37(2):56-63.

[12] SHENDEREY? C,? SHMULEVICH? I,? ALCHANATISV,? et? al. NIRS? detection? of moldy? core in? apples[J]. Food & Bioprocess Technology, 2010, 3(1):79-83.

[13] 李順峰, 張麗華, 劉興華, 等. 基于主成分分析的蘋果霉心病近紅外漫反射光譜判別[J].農(nóng)業(yè)機(jī)械學(xué)報, 2011, 42(10):158-161.

LI S, ZHANG L, LIU X, et al. Discrimination of apple moldy? heart? disease? by? near? infrared? diffuse? reflectance spectroscopy based on principal component analysis[J]. Transactions? of? the? CSAM, 2011, 42(10):158-161.

[14] 王富春, 李軍, 張潤浩, 等. 基于計算機(jī)視覺的蘋果霉心病病變程度測量方法[J].農(nóng)機(jī)化研究, 2015, 37(6):189-193.

WANG F, LI J, ZHANG R, et al. Measurement method of apple? mold? heart? disease? lesion? degree? based? on computer vision[J]. Journal of Agricultural Mechanization Research, 2015, 37(6):189-193.

[15] STROSHINE C R. Rapid sensing of internal browningin? whole? apples? using? a? low-cost,? low-field? protonmagnetic resonance sensor[J]. Postharvest Biology andTechnology, 2005, 3:56-64.

[16] 張立彬, 胥芳賈, 燦純, 等. 蘋果內(nèi)部品質(zhì)的電特性無損檢測研究[J].農(nóng)業(yè)工程學(xué)報, 2000(3):104-106.

ZHANG L, XU F, CAN C, et al. Study on nondestruc‐tive testing of internal quality of Apple[J]. Transactionsof the CSAE, 2000(3):104-106.

[17] 李芳, 蔡騁, 馬惠玲, 等. 基于生物阻抗特性分析的蘋果霉心病無損檢測 [J].食品科學(xué) , 2013, 34(18):197-202.

LI F, CAI C, MA H, et al. Nondestructive detection ofapple moldy heart disease based on bioelectrical im‐pedance? analysis[J].? Food? Science,? 2013,? 34(18):197-202.

[18] 蔡騁, 李曉龍, 馬惠玲, 等. 基于生物阻抗特性的蘋果新鮮度無損測定[J].農(nóng)業(yè)機(jī)械學(xué)報 , 2013, 44(2):147-152.

CAI C, LI X, MA H, et al. Nondestructive determina‐tion of apple freshness based on bioelectrical imped‐ance? characteristics[J]. Transactions? of? the? CSAM,2013, 44(2):147-152.

[19] 耿晗, 蔡騁, 劉斌. 基于介電特性的蘋果內(nèi)部品質(zhì)預(yù)測方法研究[J].農(nóng)機(jī)化研究, 2019, 41(10):186-191.

GENG H, CAI C, LIU B. Study on prediction meth‐od of apple internal quality based on dielectric proper‐ties[J].? Journal? of? Agricultural? Mechanization? Re‐search, 2019, 41(10):186-191.

[20] SIDHU K, GILL A, ARORA A, et al. Advancements infarming and related activities with the help of artificialintelligence: A? review[J]. Environment? ConservationJournal, 2021, 22(SE):55-62.

[21] OMRANI E, KHOSHNEVISAN B, SABOOHI H, etal. Potential of radial basis function-based support vec‐tor regression for apple disease detection[J]. Measure‐ment, 2014, 55:512-519.

[22] SAMAJPATI? B,? DEGADWALA? S. Hybrid? approachfor apple fruit diseases detection and classification us‐ing? random? forest? classifier[C]// 2016 InternationalConference on Communication and Signal Processing(ICCSP). Piscataway, New York,? USA: IEEE, 2016:1015-1019.

[23] GRANATO D, SANTOS J, ESCHER G, et al. Use ofprincipal? component? analysis (PCA) and hierarchicalcluster analysis (HCA) for multivariate association be‐tween bioactive compounds and functional propertiesin foods: A critical perspective[J]. Trends in Food Sci?????????? ence& Technology, 2018, 72:83-90.

Detection Method of Apple Mould Core Based onDielectric Characteristics

LI Dongbo1, HUANG Lyuwen1,2,3*, ZHAO Xubo4

(1. College of Information Engineering, Northwest A&F University, Yangling 712100, China;2. Key Laboratory of Agricultural Internet of Things, Ministry of Agriculture and Rural Affairs, Yangling 712100,? China;3. Key Laboratory of Agricultural Information Perception and Intelligent Service, Yangling 712100, China;4. College of Food Science and Engineering, Northwest A&F University, Yangling 712100, China)

Abstract: Apple mouldy core disease often occurs in the ventricle of apples and cannot be effectively identified by appearance. Near-infrared spectroscopy, nuclear magnetic resonance and other methods are usually used in traditional apple mouldy core disease detection, but these methods require complex equipment and high detection costs. In this research, a simple and fast nondestructive detection method of apple mouldy core disease was proposed by using a dielectric method to construct an apple mouldy core disease detection model. Japan's Hioki 3532-50 LCR tester was used to collect 108 dielectric indicators (12 dielectric indicators at 9 frequencies) of 220 apples as the original data. Due to the large differences in the distribution of data collected with different dielectric indexes and different frequencies, a standardized method was used for data preprocessing to eliminate the problem of large differences in dielectric data distribution. Afterwards, in order to eliminate the redundant information between the data, the principal component analysis algorithm was used to reduce the data dimensionality, and finally the three algorithms of BP neural network (BPNN), support vector machine (SVM) and random forest (RF) were used to construct the mouldy core disease detection model. After pre-experiment, the most effective parameters of each algorithm were selected, the test results showed that the apple mouldy core disease detection model based on the RF algorithm obtained the best performance, and the detection accuracy rate reached 96.66% and 95.71% in the training set (150 apples) and the test set (70 apples). The mouldy core disease detection model constructed by using BPNN was the second most effective, and the detection accuracy could reach 94.66% and 94.29%, respectively. The detection effect of the model built by using SVM was relatively poor, and the detection accuracies were 93.33% and 91.43%, respectively. The experimental results showed that the model constructed by using RF can more effectively identify mouldy core disease apples and healthy apples. This study could provide references for apple diseases and insect pests and non-destructive testing of apple quality.

猜你喜歡
隨機(jī)森林支持向量機(jī)BP神經(jīng)網(wǎng)絡(luò)
隨機(jī)森林在棉蚜蟲害等級預(yù)測中的應(yīng)用
基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類算法
拱壩變形監(jiān)測預(yù)報的隨機(jī)森林模型及應(yīng)用
動態(tài)場景中的視覺目標(biāo)識別方法分析
論提高裝備故障預(yù)測準(zhǔn)確度的方法途徑
基于熵技術(shù)的公共事業(yè)費(fèi)最優(yōu)組合預(yù)測
復(fù)雜背景下的手勢識別方法
BP神經(jīng)網(wǎng)絡(luò)在軟件質(zhì)量評價中的應(yīng)用研究 
基于隨機(jī)森林算法的飛機(jī)發(fā)動機(jī)故障診斷方法的研究
基于支持向量機(jī)的金融數(shù)據(jù)分析研究