于悅洋 王冰 王靜 湯喬
摘 要:本文介紹了一種基于BP神經(jīng)網(wǎng)絡的水果識別方法。隨著模式識別技術不斷的發(fā)展,圖像識別作為最具代表性的應用,受到了眾多學者的關注,尤其是在圖像快速識別方面。為了解決傳統(tǒng)水果圖像分類識別算法人工提取特征的缺陷,將經(jīng)過訓練的BP神經(jīng)網(wǎng)絡應用在水果的識別中。本實驗使用數(shù)字圖像處理的方法,首先對采集到的圖像進行預處理,并針對多種水果混合的圖像進行提取和識別。實驗表明,基于BP神經(jīng)網(wǎng)絡的水果識別方法能夠獲得很高的識別率,能夠有效地將同一幅圖像中的不同水果識別出來。
關鍵詞:水果識別;圖像處理;BP神經(jīng)網(wǎng)絡;MATLAB
文章編號:2095-2163(2019)04-0187-05 中圖分類號:TP391.41 文獻標志碼:A
0 引 言
在中國,通常采用人工方式進行水果分級,而人工分級往往效率低、勞動量大、有較大的人工誤差等,難以實現(xiàn)標準分級[1]。并且人工識別具有諸多的不穩(wěn)定因素。因此,研究和開發(fā)水果自動實時分級系統(tǒng),對經(jīng)濟、農(nóng)業(yè)的發(fā)展具有廣闊的應用前景。從80年代開始,國內(nèi)外有許多學者研究水果分級的自動識別算法,近年來也出現(xiàn)了一些基于水果識別的算法,如鄭小東等人[2]根據(jù)區(qū)域特征進行水果的自動識別。項輝宇等人實現(xiàn)了對蘋果大小、缺陷以及顏色特征的檢測。程榮花等人[3]對水果圖像的主成分分析,從而對其進行識別預測。王水平等人[4]利用SVM分類器,對水果進行分類預測。這些方法雖然在水果識別中取得了一定效果,但對于同副圖像中的多種水果識別還有欠缺。針對這一問題,本文基于BP神經(jīng)網(wǎng)絡對水果圖像進行識別。首先,根據(jù)水果的不同特征,對圖像進行預處理;然后,通過標簽化處理將圖像中各個連接成分進行分離,從而實現(xiàn)對水果特性的研究,再提取出不同水果的顏色、邊界不規(guī)則、形狀等基本特征,對得到的水果圖像特征參數(shù)進行計算;最后,使用多幅圖像訓練BP神經(jīng)網(wǎng)絡,并完善水果特征庫,以達到快速識別水果的目的。
1 數(shù)字圖像處理
首先,本文對不同水果圖片進行數(shù)字圖像處理。目的是為了提高圖片的質量,得到理想的圖像效果。圖像處理的方法有:圖像變化、圖像編碼壓縮、圖像增強和復原、分割、描述等。本文采用圖像識別方法的主要步驟為:首先,預處理圖像;然后,對預處理的圖像進行分割和特征提取;最后,對圖像進行判斷分類。圖像分類多數(shù)情況采用傳統(tǒng)的識別模式。傳統(tǒng)識別模式分為2大類:統(tǒng)計模式分類和結構模式分類。近幾年研究中,模糊模式識別、人工神經(jīng)網(wǎng)絡模式識別,這2種新興的圖像識別方法頗受學術界的廣泛關注。
本文圖像預處理分為圖像去噪、圖像增強和圖像二值化3個步驟。本文采用中值濾波法對圖像去噪,中值濾波法是一種去噪聲的非線性平滑處理辦法。本文采用反銳化掩模法[5]對圖像增強,該方法是一種常用的圖像銳化方法,先模糊處理圖像,再與原圖進行差值運算,再乘上一個修正因子,最后得到輪廓增強的圖像。該算法表達式如下:
二值化是將圖像呈現(xiàn)為黑白的對比效果的過程,該方法將圖像像素的灰度值設為“0”或“255”。圖像閾值分割法是應用較普遍的圖像分割技術,利用了圖像的背景與對象之間的灰度差異。本文采用閾值分割法對圖像進行二值化,從而得到效果更好的二值化水果圖像。
2 水果圖像特征提取
數(shù)字圖像處理后,水果和背景被明顯的分開。下一步,需要對每種水果進行特征提取。具有代表性的水果特征有:紋理、形狀、顏色[6]等。計算機視覺技術主要通過從圖像或者視頻中提取出的物體特征,經(jīng)對比區(qū)別出不同物體。在農(nóng)業(yè)領域中應用的水果自動分類識別系統(tǒng),也是通過提取所拍攝的水果圖像中的特征參數(shù),并以此為依據(jù)進行訓練得到識別模型從而達到分類識別的目的。
2.1 圖像顏色模型
水果的顏色特征在圖像方向、尺寸等特征發(fā)生改變時無明顯變化,因此,在圖像識別中常用到顏色特征。顏色模型是用作精確標定且生成多種顏色的一種方法。對于顯示設備來說,可以用紅色、綠色、藍色發(fā)光量來描述RGB。RGB又叫相加混色模型,其在實際生活中主要用于光照、顯示器等中。
(1)顏色特征,包括彩色和灰度信息處理;對于彩色信息處理,主要采用幾種常見的色彩空間;而對于灰度信息處理,主要采用直方圖技術。
(2)紅綠藍3色光按不同比例和強度混合可以用其表示近乎所有自然界的可見光,其顏色模型稱之為RGB色彩空間模型[7],如圖1所示為RGB色彩空間模型。紅綠藍3色位于彩色立方體的3個頂角,其產(chǎn)生的點匯聚在彩色立方體的對角線上,即灰色線。在使用RGB模型時,由于任一基本色上無亮度,所有RGB顏色顯示黑色。當3基色變?yōu)樽罡叩母叨龋臻g即會顯現(xiàn)出白色。其余較低高度但等量的3種基色就顯示灰色。RGB圖像每一個像素的顏色值直接存放在圖像矩陣中,通過3個M×N的二維矩陣分別表示各個像素的3種顏色分量,R、G、B3個分量分別表示每一個像素的顏色,圖像的行列數(shù)由M、N表示。
2.2 圖像形狀特征
圖像的形狀特征是指將圖像經(jīng)過邊緣提取和圖像分割,從而得到目標的形狀。形狀的描述方法一般分為輪廓法和區(qū)域法2類。本文采用輪廓法。并對其結果進行美化,以達到更準確的識別。圖像的形狀特征主要包括周長和形狀參數(shù)。
(1)周長為整個邊界的長度。周長通過計算物體邊界上相鄰像素的中心距的累加而得出。通常,面對傾斜方向,數(shù)據(jù)會產(chǎn)生一些誤差,所以要用2倍的原有像素數(shù)進行計算修改。
(2)物體的其中一個重要特征量是弧度,弧度是用于計算物體形狀復雜程度的參數(shù)。將弧度進行比較,識別出不同的水果。在數(shù)字圖像中,可以通過物體所占有的像素點數(shù)來計算面積。
本文首先使用面積、周長、弧度等參數(shù)表示水果,再使用RGB顏色模式對不同的水果圖像進行特征提取,產(chǎn)生3幅不同通道的直方圖。通過直方圖顯示出的結果,提取不同水果中特有的特征,以達到識別水果的目的。
3 BP神經(jīng)網(wǎng)絡
BP神經(jīng)網(wǎng)絡在上世紀八十年代年被首次提出[8]。BP神經(jīng)網(wǎng)絡是一種有效的神經(jīng)學習方法,是在誤差反傳算法的基礎上產(chǎn)成的,并引入了反向傳播原理,破傳統(tǒng)網(wǎng)絡結構,解決了非線性問題,是目前普遍應用的神經(jīng)網(wǎng)絡模型。
BP神經(jīng)網(wǎng)絡通常由3個層次構成,分別是輸入層、中間層、輸出層[9]。由傳遞函數(shù)將各層連接,通過特定的學習算法來訓練網(wǎng)絡、調(diào)節(jié)權重,使輸出不斷接近預期值。輸入層接受來自外部的輸入信息,其中間層(可為單隱層或多隱層)需要進行信息處理,各神經(jīng)元上的信息經(jīng)由最后一個隱層傳送到輸出層,處理完成的結果再通過輸出層向外界發(fā)送。
BP網(wǎng)絡的結構如圖2所示。
BP網(wǎng)絡具有非常強大的非線性映射能力,因此,能夠學習和大量關于存儲輸入與輸出之間的映射關系。3層BP神經(jīng)網(wǎng)絡可以在不描述函數(shù)映射關系的情況下逼近任意非線性函數(shù)。如圖3示出了BP網(wǎng)絡的向量圖。
BP神經(jīng)網(wǎng)絡采用梯度下降算法,這種算法適用于非線性多層網(wǎng)絡梯度的計算。BP神經(jīng)網(wǎng)絡算法的基本思路是:由前向神經(jīng)網(wǎng)絡實現(xiàn)正向傳播,由遞歸神經(jīng)網(wǎng)絡(反饋神經(jīng)網(wǎng)絡)實現(xiàn)誤差反向傳播。這2個進程交替完成,在權向量空間執(zhí)行誤差梯度下降算法,從而使誤差降到最低。其具體步驟如下:
(3)選取下一個輸入模式再返回到(2)中反復訓練直到輸出誤差達到要求為止。
在BP網(wǎng)絡的結構中,輸入層與輸出層之間含有多層神經(jīng)元(其模擬人類大腦神經(jīng)元擁有的基本功能:加權、求和、傳遞),這些神經(jīng)元被稱為隱單元,隱單元與外界沒有直接的聯(lián)系,但其狀態(tài)的改變,會影響輸入與輸出之間的關系,每一層可以有無數(shù)個這樣的節(jié)點。
4 實驗及結果分析
4.1 實驗框架
本文的水果識別框架是根據(jù)不同水果特征,把需要的水果從中識別出來,其總體框架如圖4所示。
本文實驗的具體步驟如下:
(1)輸入水果圖像;
(2)圖像預處理;
(3)圖像標簽化處理和圖像特征參數(shù)計算,把每個區(qū)域都分開,根據(jù)提取的圖像特征,將水果進行區(qū)分;
(4)建立水果特征庫,把采集的特征數(shù)據(jù)用BP網(wǎng)絡進行訓練,區(qū)分同一圖片中的不同水果;
(5)完成水果的識別。
4.2 實驗結果與分析
本文實驗環(huán)境中計算機系統(tǒng)為 Windows10,處理器為Intel 酷睿i53210M,主頻為2.5 GHz,內(nèi)存為4 GB,顯存為1 G,硬盤是500 GB,實驗是基于MATLAB開發(fā)工具。本文主要以蘋果、橙子、香蕉為例。圖5示出了水果圖像處理結果圖,依次為原始圖像、邊緣檢測圖像、OR運算分割圖像和彩色標簽化圖像。從圖中可以看出,通過一系列的圖像處理可以將不同區(qū)域的像素分開,從而利于后續(xù)對圖像特征的提取和圖像特征參數(shù)的計算。
表1為橙子、香蕉和蘋果的特征參數(shù)數(shù)據(jù)表,從中可以看出,與其它2種水果相比,香蕉的特征最為明顯,周長最大、弧度最小,根據(jù)該特征能夠把香蕉從水果中分離出來。
圖6所示為3種水果的RGB通道圖及其直方圖,由圖可知,與其它2種水果對比,蘋果的R通道直方圖中其固定區(qū)域內(nèi)的像素數(shù)量(200-300)與G通道和B通道像素和的比值為3水果中最大的,可得到蘋果的比值最大,可知蘋果的紅色信息量最多。
圖7為本文BP網(wǎng)絡的訓練性能,橫坐標代表訓練次數(shù),縱坐標代表均方誤差,該誤差值越小,說明實驗結果與原圖之間差異程度越低。從圖中可以看出本文的BP網(wǎng)絡經(jīng)過10次訓練,其均方誤差為0.7×10-3,識別準確度較高,可以直接進行水果識別。
圖8為本文設計的神經(jīng)網(wǎng)絡及其運行結果。測試結果表明,通過對不同測試樣本的訓練,對蘋果的識別近乎完全正確,橙子和香蕉的識別率均為97%,這個結果進而證實了采用特征提取和BP神經(jīng)網(wǎng)絡識別水果的有效性。通過神經(jīng)網(wǎng)絡的不斷訓練,后期對圖像的識別更加準確。就像人的大腦一樣,對圖像的特征不斷進行記憶,使識別更加智能化。
BP神經(jīng)的優(yōu)點:高效、智能。如果要更加準確,需要加入更多的特征,在顏色的準確性上需要改進。因為水果很多顏色較為相像,且需要更大的數(shù)據(jù)庫。
從實驗結果中可以看出,BP神經(jīng)網(wǎng)絡的圖像識別系統(tǒng)的自適應能力較強,且識別率也較高,是一種高效的檢測方法。
5 結束語
本文采用數(shù)字圖像處理的方法,對原始水果圖像進行預處理并對RGB圖像進行數(shù)據(jù)分析。通過對BP神經(jīng)網(wǎng)絡架構設計構建了基于MATLAB的水果圖像識別系統(tǒng)。通過實驗對比,本文算法誤差較小、實時性較好、正確率高,能夠實現(xiàn)對水果特征數(shù)據(jù)的準確識別。但是,本文提出的算法也存在不足,由于水果種類繁多,重點選取的香蕉、蘋果等比較有特點的水果,所以實驗結果較理想,若參雜其它水果種類,如青蘋果、火龍果等,則需要對算法進行改進。
參考文獻
[1] 曾平平,李林升. 基于卷積神經(jīng)網(wǎng)絡的水果圖像分類識別研究[J]. 機械設計與研究,2019,35(1):23-26,34.
[2]王水平,唐振民,范春年,等. 基于SVM的水果分類算法研究[J]. 武漢理工大學學報,2010,32(16):44-47.
[3]程榮花,馬飛,梁亞紅. 形狀相似水果自動化識別研究[J]. 山東農(nóng)業(yè)科學,2015,47(8):116-118.
[4]鄭小東,王曉潔,李印清. 自然環(huán)境下果實的自動識別技術[J]. 計算機應用與軟件,2006(11):96-97,100.
[5]項輝宇,薛真,冷崇杰,等. 基于Halcon的蘋果品質視覺檢測試驗研究[J]. 食品與機械,2016,32(10):123-126.
[6]沈磊,蘇建忠,郭肇敏,等. 基于反銳化掩模技術的紅外圖像增強算法設計[J]. 南開大學學報(自然科學版),2019(1):29-35.
[7]賀詢. 水果識別中圖像特征綜述[J]. 河南科技,2017(21):34-35.
[8]Huang Z, Zhu Q. Detection of Red Region of Fuji Apple Based on RGB Color Model[J]. Laser & Optoelectronics Progress, 2016, 53(4):041001.
[9]文周,林偉健. 基于BP神經(jīng)網(wǎng)絡的水果氣調(diào)包裝機械故障診斷方法[J]. 包裝與食品機械,2018,36(5):69-72.