張麗娜 馬巧梅
(寶雞文理學(xué)院計(jì)算機(jī)學(xué)院 寶雞 721016)
據(jù)國(guó)家糧食局統(tǒng)計(jì),全國(guó)糧食庫(kù)存居于歷史最高點(diǎn),且1/6的糧食儲(chǔ)存在簡(jiǎn)易倉(cāng)囤,并且隨著我國(guó)糧食產(chǎn)量的持續(xù)增加,糧食存儲(chǔ)存在設(shè)施能力嚴(yán)重不足、物流通道不暢、質(zhì)量安全隱患較大、糧情監(jiān)測(cè)預(yù)警滯后、糧食產(chǎn)后損失浪費(fèi)嚴(yán)重等問(wèn)題。我國(guó)基層農(nóng)戶存糧約占全國(guó)糧食年總產(chǎn)量的一半左右,但由于儲(chǔ)存條件差、設(shè)施簡(jiǎn)陋等原因,農(nóng)戶儲(chǔ)糧損失比例約為8%左右,安全儲(chǔ)糧面臨前所未有的困難與挑戰(zhàn),保障糧食儲(chǔ)存安全迫在眉睫。
隨著檢測(cè)技術(shù)的發(fā)展以及各項(xiàng)新技術(shù)的應(yīng)用,在傳統(tǒng)的儲(chǔ)糧害蟲(chóng)檢測(cè)方法之外,近紅外光譜法、X射線法、微波雷達(dá)法、圖像識(shí)別法、電子鼻法和聲檢測(cè)法也正被廣泛應(yīng)用,這些方法各有利弊,其中國(guó)內(nèi)外對(duì)于儲(chǔ)糧害蟲(chóng)聲音檢測(cè)方法也已具備一定成果,將糧食顆粒經(jīng)過(guò)碰撞裝置產(chǎn)生超聲或者可聽(tīng)聲,使用各種多種模式識(shí)別方法再對(duì)聲音信號(hào)進(jìn)行進(jìn)一步分類識(shí)別。
廣義回歸神經(jīng)網(wǎng)是基于徑向基函數(shù)網(wǎng)絡(luò)一種改進(jìn),相對(duì)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)不需反復(fù)訓(xùn)練且對(duì)樣本數(shù)量要求不高,并具備訓(xùn)練速度快等優(yōu)點(diǎn),使其具有很大優(yōu)勢(shì)[1]。因此,本文以小麥碰撞聲檢測(cè)裝置為基礎(chǔ),提出一種基于廣義回歸神經(jīng)網(wǎng)絡(luò)的小麥碰撞聲信號(hào)分類方法,實(shí)現(xiàn)對(duì)小麥完好粒和蟲(chóng)害粒的識(shí)別與分類。
郭敏團(tuán)隊(duì)研究設(shè)計(jì)了一個(gè)基于聲特征的糧食顆粒碰撞信號(hào)分類裝置[2],研究在此基礎(chǔ)上,創(chuàng)新性地使用廣義回歸神經(jīng)網(wǎng)絡(luò)用于聲音信號(hào)的識(shí)別,系統(tǒng)結(jié)構(gòu)如圖1所示,將糧食顆粒經(jīng)過(guò)碰撞聲裝置產(chǎn)生可聽(tīng)聲,使用專業(yè)錄音設(shè)備采集聲音數(shù)據(jù),計(jì)算機(jī)對(duì)原始數(shù)據(jù)進(jìn)行去噪、截取有用信號(hào)等預(yù)處理操作,隨后提取糧食聲音信號(hào)的特征參數(shù),使用廣義回歸神經(jīng)網(wǎng)絡(luò)分類得到識(shí)別結(jié)果。
圖1 碰撞聲信號(hào)識(shí)別系統(tǒng)結(jié)構(gòu)
廣義回歸神經(jīng)網(wǎng)絡(luò)由美國(guó)學(xué)者Specht D.F.[3]在1991年提出,其原理是基于人腦的神經(jīng)元細(xì)胞對(duì)外界反應(yīng)的局部性,并具備全局逼近和最佳逼近的優(yōu)點(diǎn)。與BP神經(jīng)網(wǎng)絡(luò)類似,它是由輸入層、隱層和輸出層構(gòu)成的3層前向網(wǎng)絡(luò)。網(wǎng)絡(luò)的第1層為輸入層,將輸入信號(hào)傳輸至隱層,其數(shù)目等于樣本輸入向量的維數(shù)[4~6],隱層節(jié)點(diǎn)函數(shù)為輻射狀的高斯函數(shù),輸出節(jié)點(diǎn)由特定的線性函數(shù)構(gòu)成。其基本原理如下描述。
設(shè)j維向量,x=[x1,x2,…xj]T為過(guò)程的輸入向量,對(duì)應(yīng)輸出向量為y,隨機(jī)變量x和y的聯(lián)合概率密度函數(shù)為f(x,y)。由于GRNN的理論基礎(chǔ)是非線性回歸分析,通過(guò)給定x的值,計(jì)算相應(yīng)y的條件數(shù)學(xué)期望進(jìn)行回歸。GRNN估計(jì)和的聯(lián)合概率密度函數(shù),來(lái)建立一個(gè)估計(jì)的概率模型。通過(guò)訓(xùn)練輸入輸出集,利用非參數(shù)密度估計(jì)法構(gòu)建PDF估計(jì)器。對(duì)于給定的輸入向量x,假設(shè)被估計(jì)函數(shù)連續(xù)且光滑,則估計(jì)y的期望值為[7~9]
連續(xù)概率密度函數(shù)函數(shù)f(x,y)可定義為[10~11]
其中,xi,yi分別為隨機(jī)變量x和y的第i個(gè)樣本值,σ為平滑參數(shù),p為隨機(jī)變量x的維數(shù),k為樣本數(shù)量[12]。
GRNN的拓?fù)浣Y(jié)構(gòu)如圖2所示,具有輸入層、模式層、求和層和輸出層4層網(wǎng)絡(luò)結(jié)構(gòu)。算法描述如下。
1)將樣本輸入至輸入層,如圖1所示,輸入層的節(jié)點(diǎn)數(shù)目等于輸入向量的維數(shù)p,隨后將輸入向量的各元素傳送至模式層。
2)模式層的節(jié)點(diǎn)數(shù)等于訓(xùn)練樣本數(shù)目,其傳遞函數(shù)為
3)求和層有兩種類型的節(jié)點(diǎn),第一種類型僅包含一個(gè)神經(jīng)元,對(duì)所有模式層神經(jīng)元的輸出進(jìn)行算術(shù)求和,模式層各神經(jīng)元與該神經(jīng)元的連接權(quán)值為1,其傳遞函數(shù)為;第二種類型包含剩余節(jié)點(diǎn)對(duì)所有模式層神經(jīng)元的輸出進(jìn)行加權(quán)求和,求和神經(jīng)元j的傳遞函數(shù)其中,yij為模式層中第i個(gè)神經(jīng)元與求和層中第j個(gè)求和神經(jīng)元之間的連接權(quán)值為第i個(gè)輸出樣本Yi中的第j個(gè)元素[13]。
4)輸出層中的節(jié)點(diǎn)數(shù)目等于學(xué)習(xí)樣本中輸出向量的維數(shù)m[14]。
圖2 GRNN的拓?fù)浣Y(jié)構(gòu)
1)網(wǎng)絡(luò)結(jié)構(gòu)相對(duì)簡(jiǎn)單,除了輸入和輸出層外,一般只有兩個(gè)隱藏層,模式層和求和層。而模式中隱藏單元的個(gè)數(shù),與訓(xùn)練樣本的個(gè)數(shù)是相同的。
2)網(wǎng)絡(luò)訓(xùn)練非常簡(jiǎn)單。當(dāng)訓(xùn)練樣本通過(guò)隱藏層的同時(shí),網(wǎng)絡(luò)訓(xùn)練隨即完成。而不像前饋神經(jīng)網(wǎng)絡(luò)一樣,需要非常長(zhǎng)的訓(xùn)練時(shí)間和高的計(jì)算成本。
3)由于簡(jiǎn)單的網(wǎng)絡(luò)結(jié)構(gòu),我們不需要對(duì)網(wǎng)絡(luò)的隱藏層數(shù)和隱藏單元的個(gè)數(shù)進(jìn)行估算和猜測(cè)。由于它是從徑向基函數(shù)引申而來(lái),因此只有一個(gè)自由參數(shù),即徑向基函數(shù)的平滑參數(shù)。而它的優(yōu)化值可以通過(guò)交叉驗(yàn)證的方法非常容易得到。
4)網(wǎng)絡(luò)計(jì)算結(jié)果的全局收斂性。標(biāo)準(zhǔn)的前饋神經(jīng)網(wǎng)絡(luò)的計(jì)算結(jié)果則會(huì)經(jīng)常不能達(dá)到全局收斂,而停止在局部收斂。
實(shí)驗(yàn)中采用小麥作為糧食樣本,所有樣本均來(lái)自陜西省某農(nóng)戶糧倉(cāng),實(shí)驗(yàn)共隨機(jī)選擇霉變小麥、無(wú)損小麥、發(fā)芽小麥和蟲(chóng)害小麥各500顆,分別使2000顆小麥顆粒經(jīng)過(guò)碰撞聲信號(hào)識(shí)別系統(tǒng),并錄制碰撞聲音,使用希爾伯特黃變換方法提取聲音特征,最后利用廣義回歸神經(jīng)網(wǎng)絡(luò)對(duì)小麥顆粒進(jìn)行分類識(shí)別。實(shí)驗(yàn)將每類聲信號(hào)隨機(jī)分為兩部分,作為訓(xùn)練樣本和測(cè)試樣本。
實(shí)驗(yàn)中,分別對(duì)四類聲音信號(hào)的時(shí)域和頻域特征進(jìn)行分析,組建特征庫(kù),使用高頻帶能量、最強(qiáng)IMF中心頻率、時(shí)頻熵、殘差平方和、方差等五種頻域、時(shí)域特征作為識(shí)別受損小麥與完好小麥的有效特征,特征含義如表1所示。
表1 有效特征含義
神經(jīng)網(wǎng)絡(luò)訓(xùn)練指的是向網(wǎng)絡(luò)輸入足夠多的樣本,通過(guò)一定算法調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),使網(wǎng)絡(luò)的輸出與預(yù)期值相符。一個(gè)神經(jīng)網(wǎng)絡(luò)的搭建,需要滿足三個(gè)條件:輸入和輸出;權(quán)重(w)和閾值(b);多層感知器的結(jié)構(gòu)。神經(jīng)網(wǎng)絡(luò)的運(yùn)作過(guò)程如下:確定輸入和輸出;找到一種或多種算法,可以從輸入得到輸出;找到一組已知答案的數(shù)據(jù)集,用來(lái)訓(xùn)練模型,估算w和b;一旦新的數(shù)據(jù)產(chǎn)生,輸入模型,就可以得到結(jié)果,同時(shí)對(duì)w和b進(jìn)行校正。
根據(jù)學(xué)習(xí)環(huán)境中教師信號(hào)的差異,GRNN的訓(xùn)練屬于有監(jiān)督式訓(xùn)練,共分兩個(gè)步驟:第一步為無(wú)教師式訓(xùn)練,確定訓(xùn)練輸入層和隱層間的權(quán)值;第二步為有教師訓(xùn)練,根據(jù)提供的目標(biāo)向量集來(lái)訓(xùn)練生成隱層和輸出層之間的權(quán)值矩陣。
根據(jù)GRNN神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)特征,確定網(wǎng)絡(luò)的輸入層和輸出層神經(jīng)元的數(shù)目分別為輸入的特征向量維數(shù)和小麥類型數(shù),由于實(shí)驗(yàn)中包含小麥完好粒和蟲(chóng)害粒,因此待分類的樣本種類為4,對(duì)應(yīng)的輸出層的節(jié)點(diǎn)數(shù)也相應(yīng)確定為4。本文采用二進(jìn)制形式表示四類小麥碰撞聲信號(hào)的仿真結(jié)果,令小麥完好粒的對(duì)應(yīng)輸出為0001,蟲(chóng)害粒的對(duì)應(yīng)輸出為0010,霉變粒的對(duì)應(yīng)輸出為0100,發(fā)芽粒的對(duì)應(yīng)輸出為1000。并通過(guò)Matlab編程實(shí)現(xiàn)。具體程序如下:
net=newgrnn(p1n,t1n,SPRAD);其中p1n為聲音數(shù)據(jù)p經(jīng)過(guò)歸一化處理后的數(shù)據(jù),t1n為發(fā)病率數(shù)據(jù)t經(jīng)過(guò)歸一化處理后的數(shù)據(jù),SPRAD為光滑因子。y=sim(net,p1n);網(wǎng)絡(luò)模擬。t2n=sim(net,p2n);網(wǎng)絡(luò)仿真與預(yù)測(cè),最終確定光滑因子進(jìn)行PRRS發(fā)病預(yù)測(cè),檢驗(yàn)t2值與PRRS實(shí)際發(fā)病率值擬合程度是否令人滿意。
實(shí)驗(yàn)一中,將小麥完好粒、蟲(chóng)害粒、發(fā)芽粒和霉變粒4類小麥顆粒作為實(shí)驗(yàn)對(duì)象,使用廣義回歸神經(jīng)網(wǎng)絡(luò)的分類結(jié)果如表2所示,訓(xùn)練樣本和采樣樣本數(shù)量均為250粒,測(cè)試函數(shù)建模實(shí)驗(yàn)結(jié)果表明,識(shí)別率分別為76%、44%、50%、68%,無(wú)法得到較為滿意的識(shí)別率[15]。
表2 分類結(jié)果
表3 分類結(jié)果
重新選擇實(shí)驗(yàn)對(duì)象,將外部特征比較明顯的發(fā)芽顆粒借助肉眼識(shí)別,使用系統(tǒng)提取小麥完好粒、蟲(chóng)害粒和霉變粒碰撞聲特征,并使用廣義回歸神經(jīng)網(wǎng)絡(luò)得到的識(shí)別結(jié)果如表3所示,訓(xùn)練樣本和采樣樣本數(shù)量均為250粒,可以看出,此時(shí)可以較好地識(shí)別同種類小麥的三種不同類型,并且識(shí)別率可達(dá)到80%以上。說(shuō)明了通過(guò)對(duì)小麥碰撞聲信號(hào)使用恰當(dāng)數(shù)字信號(hào)處理方法進(jìn)行特征提取,并借助廣義回歸神經(jīng)網(wǎng)絡(luò)可以得到較好的識(shí)別率[2]。
本文在團(tuán)隊(duì)前期研究成果基礎(chǔ)上,將四類小麥顆粒通過(guò)碰撞聲裝置提取到聲音特征,并采用廣義回歸神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行分類識(shí)別,并沒(méi)有得到比較好的識(shí)別效果。實(shí)驗(yàn)將外部特征比較明顯的發(fā)芽顆粒人工挑選出,再使用同樣的方法對(duì)剩余三類信號(hào)進(jìn)行分類識(shí)別,取得了高于80%的識(shí)別率,測(cè)試函數(shù)建模實(shí)驗(yàn)結(jié)果表明,該方法能有效提高建模精度和模型泛化能力,為進(jìn)一步實(shí)現(xiàn)小麥病蟲(chóng)害顆粒自動(dòng)化檢測(cè)提供了有效的方法。
未來(lái)可以對(duì)系統(tǒng)進(jìn)行進(jìn)一步改進(jìn),比如:進(jìn)一步提高硬件設(shè)備的實(shí)驗(yàn)精度;研究特征提取方法,采用特征融合進(jìn)一步提高識(shí)別率;采用多種模式識(shí)別方法進(jìn)行分類識(shí)別;針對(duì)識(shí)別率較低的四類麥粒類型,考慮結(jié)合圖像識(shí)別方法提高對(duì)小麥發(fā)芽粒的識(shí)別效果。