樊 超,夏 旭,石小鳳,侯利龍
(河南工業(yè)大學(xué) 信息科學(xué)與工程學(xué)院,河南 鄭州 450001)
基于優(yōu)化神經(jīng)網(wǎng)絡(luò)的小麥品種分類研究
樊 超,夏 旭,石小鳳,侯利龍
(河南工業(yè)大學(xué) 信息科學(xué)與工程學(xué)院,河南 鄭州 450001)
為提高基于圖像處理的小麥品種識(shí)別的準(zhǔn)確率,首先選取L8998、內(nèi)鄉(xiāng)188、9023、優(yōu)展1號(hào)、豫麥47、周麥12等6個(gè)品種作為研究對(duì)象,對(duì)采集到的小麥顆粒圖像進(jìn)行中值濾波后采用迭代式閾值法分割圖像,提取出顏色、形態(tài)和紋理3方面共16個(gè)特征,然后通過(guò)構(gòu)建神經(jīng)網(wǎng)絡(luò)研究了小麥品種的識(shí)別準(zhǔn)確率與品種數(shù)量之間的關(guān)系.最后,為避免網(wǎng)絡(luò)因達(dá)到局部最優(yōu)而停止訓(xùn)練,利用MIV算法計(jì)算了各輸入特征參數(shù)對(duì)分類結(jié)果的平均影響值,進(jìn)而使用遺傳算法對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了優(yōu)化.結(jié)果表明,隨著小麥品種的增加,分類的準(zhǔn)確率逐步下降,當(dāng)待識(shí)別的小麥種類增加到6類時(shí),優(yōu)化后的神經(jīng)網(wǎng)絡(luò)的樣本識(shí)別準(zhǔn)確率從81.3%增加至85.6%,有效提高了小麥品種分類的準(zhǔn)確性.
小麥;圖像處理;特征提??;神經(jīng)網(wǎng)絡(luò);優(yōu)化算法
對(duì)于我國(guó)這樣的人口大國(guó),確保糧食安全不僅是實(shí)現(xiàn)國(guó)民經(jīng)濟(jì)又好又快發(fā)展的基本條件,也是確保國(guó)家安全的戰(zhàn)略基礎(chǔ).小麥作為我國(guó)第二大糧食作物,在滿足人們的膳食需求和保證糧食安全方面具有舉足輕重的地位.過(guò)去,農(nóng)業(yè)科研與生產(chǎn)方面的許多工作都是依靠人類視覺(jué)進(jìn)行判斷和辨別的,隨著計(jì)算機(jī)信息技術(shù)的迅速發(fā)展和硬件成本的不斷下降,圖像處理技術(shù)得以廣泛應(yīng)用于農(nóng)產(chǎn)品品質(zhì)檢測(cè)和分類中,成為保障農(nóng)業(yè)高效生產(chǎn)的有力手段[1-2].與人類的視覺(jué)相比,用圖像處理技術(shù)代替人工進(jìn)行種子質(zhì)量鑒別具有以下優(yōu)點(diǎn):1)能一次進(jìn)行多個(gè)參數(shù)的測(cè)量,滿足分類中對(duì)綜合指標(biāo)的要求;2)可以克服人的主觀因素和疲勞程度等對(duì)分類準(zhǔn)確性的影響,利于實(shí)現(xiàn)自動(dòng)化.
然而,如何提高基于圖像處理的小麥品種識(shí)別的有效性和準(zhǔn)確性是影響該技術(shù)能否實(shí)用化的關(guān)鍵所在.國(guó)內(nèi)外在小麥籽粒檢測(cè)和識(shí)別方面開(kāi)展了廣泛研究,一方面成功地識(shí)別小麥品種和類別,如對(duì)燕麥、大麥、黑麥草和小麥的正確識(shí)別率均達(dá)到90%以上[3-5];另一方面有效識(shí)別不同類別的小麥種子,如對(duì)不同冬春性、質(zhì)地和粒色的小麥類別判斷效果良好[6-7],但對(duì)同一類型不同品種的識(shí)別效果并不理想.筆者基于圖像處理技術(shù)通過(guò)對(duì)6種河南產(chǎn)小麥籽粒的圖像特征參數(shù)進(jìn)行提取并結(jié)合優(yōu)化遺傳算法,實(shí)現(xiàn)同一類型不同品種小麥的識(shí)別和分類.
研究中選取6個(gè)不同品種的河南產(chǎn)小麥(L8998、內(nèi)鄉(xiāng)188、9023、優(yōu)展1號(hào)、豫麥47、周麥12).由于小麥籽粒的體積相對(duì)較小,為獲得高質(zhì)量的小麥圖片,采用BENQ-5000E掃描儀進(jìn)行圖像采集.在得到不同品種小麥的圖像后,使用圖像處理技術(shù)對(duì)小麥品種進(jìn)行識(shí)別,識(shí)別系統(tǒng)流程參見(jiàn)圖1.其中預(yù)處理的目的在于改善圖像數(shù)據(jù),其處理效果的好壞將直接影響后續(xù)圖像特征提取質(zhì)量的高低.最后通過(guò)構(gòu)建并優(yōu)化神經(jīng)網(wǎng)絡(luò)完成小麥品種的分類.
圖1 系統(tǒng)流程
特征提取就是對(duì)圖像進(jìn)行物理測(cè)量或變換,得到一組反映其特性的數(shù)字值,而有效的小麥圖像預(yù)處理工作對(duì)后續(xù)的特征提取具有重要影響.由于本系統(tǒng)中圖像降質(zhì)的主要原因在于光學(xué)系統(tǒng)及背景環(huán)境的影響,并且采集得到的小麥籽粒圖像背景簡(jiǎn)單且前景與背景之間區(qū)別較大,因此試驗(yàn)中首先利用空域處理中的中值濾波法進(jìn)行圖像增強(qiáng),然后采用簡(jiǎn)單實(shí)用的迭代式閾值選擇法分割籽粒圖像,最后利用形態(tài)學(xué)進(jìn)一步完善分割效果,得到的圖像見(jiàn)圖2.通過(guò)圖像分割,將小麥籽粒圖像從背景中分離出來(lái),以便特征提取.
圖2 形態(tài)學(xué)處理后的圖像
特征提取的涉及面很廣,與待識(shí)別對(duì)象的各種物理的、形態(tài)的性能都有聯(lián)系.針對(duì)具體問(wèn)題有各種各樣的特殊方法.本研究中的圖像特征提取工作包括三方面的內(nèi)容:1)描述小麥籽粒色彩的顏色特征;2)描述小麥籽粒外形的形狀特征;3)描述小麥籽粒表面灰度變化的紋理特征.
其中,國(guó)內(nèi)外利用顏色特征在谷物的檢測(cè)和識(shí)別方面開(kāi)展了廣泛研究[8-9].試驗(yàn)中聯(lián)合使用RGB模型和HSI模型提取了小麥籽粒的6個(gè)顏色特征,得到的顏色數(shù)據(jù)見(jiàn)表1.
形狀特征方面,有研究表明,農(nóng)產(chǎn)品的結(jié)構(gòu)、組成與其粒形有密切的關(guān)系,因此谷物的形狀特征也是進(jìn)行谷物檢測(cè)分級(jí)的重要參數(shù)之一.形狀特征參數(shù)的選取沒(méi)有統(tǒng)一的規(guī)定,只要能有效區(qū)分籽粒之間的形狀差異,并且能方便、快速獲取的參數(shù)都可作為形狀特征參數(shù).參照以往研究[10],這里選取周長(zhǎng)(P)、面積(A)、矩形度(R)、圓形度(C)、伸長(zhǎng)度(E)5個(gè)特征參數(shù),每種小麥籽粒的形態(tài)參數(shù)計(jì)算結(jié)果參見(jiàn)表2.
紋理是圖像中一個(gè)重要而又難于描述的特征,通常被定義為“一種反映一個(gè)區(qū)域中像素灰度級(jí)的空間分布的屬性”.為了度量紋理,需設(shè)法對(duì)物體內(nèi)部灰度級(jí)的變化性質(zhì)進(jìn)行量化.試驗(yàn)中采取灰度共生矩陣法[11],并結(jié)合小麥籽粒的特點(diǎn)以及紋理特征參數(shù)的含義,這里選用能量 (ASM)、熵 (ENT)、對(duì)比度(CON)、局部平穩(wěn)性和相關(guān)性(COR)作為關(guān)鍵特征,得到小麥紋理特征數(shù)據(jù)如表3所示.
通過(guò)對(duì)采集得到的籽粒圖像進(jìn)行分割共提取得到小麥籽粒705顆,其中共有L8998類籽粒121顆、內(nèi)鄉(xiāng)188類籽粒109顆、9023類籽粒120顆、優(yōu)展1號(hào)類籽粒118顆、豫麥47類籽粒121顆、周麥12類籽粒116顆.從每類籽粒中隨機(jī)抽取100顆構(gòu)建籽粒圖像庫(kù),并將抽取得到的各類籽粒中前60顆用于訓(xùn)練,其余40顆用于測(cè)試.試驗(yàn)中選用人工神經(jīng)網(wǎng)絡(luò)作為分類器,工作方式由兩個(gè)連貫的階段即分析階段和識(shí)別階段組成.定義樣本識(shí)別準(zhǔn)確率為正確識(shí)別籽粒個(gè)數(shù)與輸入籽粒總個(gè)數(shù)的比值,即樣本識(shí)別準(zhǔn)確率:
表1 小麥顏色特征
表2 小麥形狀特征%%
表3 小麥紋理特征%%
根據(jù)前節(jié)對(duì)小麥特征參數(shù)的提取,得到小麥籽粒的6個(gè)顏色特征、5個(gè)形狀特征以及5個(gè)紋理特征等共16個(gè)特征參數(shù),將這16個(gè)參數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn);并根據(jù)待分類籽粒的種類數(shù)目,依次確定輸出層節(jié)點(diǎn)的個(gè)數(shù).為了方便進(jìn)行試驗(yàn)驗(yàn)證,首先選取L8998、內(nèi)鄉(xiāng)188、9023和優(yōu)展1號(hào)等4類小麥籽粒進(jìn)行分類,分類結(jié)果參見(jiàn)表4.由此可以看出,無(wú)論使用哪種網(wǎng)絡(luò)結(jié)構(gòu),系統(tǒng)對(duì)4類小麥的分類準(zhǔn)確率均達(dá)到90%以上,具有較好的分類效果.
在此基礎(chǔ)上,嘗試將待分類籽粒的數(shù)目逐步增加至5類和6類,分類結(jié)果參見(jiàn)表5和表6.可以看到,隨著待分類籽粒種類的增多,分類準(zhǔn)確率越來(lái)越小.尤其是在籽粒種類增加到5類、6類時(shí),對(duì)5類籽粒分類時(shí)最佳的網(wǎng)絡(luò)結(jié)構(gòu)為16-22-5結(jié)構(gòu),此時(shí)的分類準(zhǔn)確率為86.5%;而對(duì)6類籽粒分類時(shí)最高分類準(zhǔn)確率僅為81.3%.橫向比較可以看出,網(wǎng)絡(luò)對(duì)豫麥47和周麥12的分類效果明顯差于對(duì)其他種類籽粒的分類效果.進(jìn)一步分析表明,導(dǎo)致小麥品種分類效果不佳的主要原因在于輸入特征參數(shù)的選取不當(dāng)以及網(wǎng)絡(luò)陷入局部最優(yōu)解而造成的,因此首先采用MIV算法對(duì)神經(jīng)網(wǎng)絡(luò)輸入?yún)?shù)的有效性進(jìn)行計(jì)算,然后通過(guò)使用遺傳算法尋找全局最優(yōu)解的方法對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,期望得到更好的分類結(jié)果.
4.1 基于MIV算法的特征參數(shù)有效性計(jì)算
MIV被認(rèn)為是在神經(jīng)網(wǎng)絡(luò)中評(píng)價(jià)變量相關(guān)性最好的指標(biāo)之一,其符號(hào)代表相關(guān)的方向,絕對(duì)值大小代表影響的相對(duì)重要性.因此,試驗(yàn)中將平均影響值方法應(yīng)用于BP神經(jīng)網(wǎng)絡(luò),計(jì)算每個(gè)特征參數(shù)對(duì)神經(jīng)網(wǎng)絡(luò)分類結(jié)果的影響程度,從中找出對(duì)結(jié)果有較大影響的輸入項(xiàng),繼而實(shí)現(xiàn)對(duì)神經(jīng)網(wǎng)絡(luò)的輸入變量進(jìn)行篩選.使用MIV算法對(duì)網(wǎng)絡(luò)結(jié)構(gòu)為16-22-6時(shí)各輸入特征參數(shù)對(duì)輸出結(jié)果的影響程度進(jìn)行計(jì)算,結(jié)果如表7所示.
表4 4類小麥分類結(jié)果
表5 5類小麥分類結(jié)果
表6 6類小麥分類結(jié)果
表7 輸入特征對(duì)輸出結(jié)果的影響
從表7可以看出,MIV值在0.07以上的共有4個(gè),對(duì)應(yīng)的變量分別為顏色參數(shù)中的B分量、色調(diào)參數(shù)中的I分量、面積參數(shù)A和圓形度C,說(shuō)明這4個(gè)參數(shù)對(duì)小麥品種的分類結(jié)果影響較大;而MIV值在0.01以下的參數(shù)只有2個(gè),分別對(duì)應(yīng)于形態(tài)特征參數(shù)中的矩形度(R)和紋理特征參數(shù)中的相關(guān)性 (COR).若將MIV值在0.01以下的變量看作是對(duì)輸出結(jié)果不重要的特征參數(shù),則在后續(xù)對(duì)神經(jīng)網(wǎng)絡(luò)的研究中,輸入節(jié)點(diǎn)的個(gè)數(shù)簡(jiǎn)化為14個(gè).
4.2 結(jié)合遺傳算法的網(wǎng)絡(luò)優(yōu)化
由于BP網(wǎng)絡(luò)是在梯度法基礎(chǔ)上推導(dǎo)出來(lái)的,要求目標(biāo)函數(shù)連續(xù)可導(dǎo),在進(jìn)化學(xué)習(xí)的過(guò)程中收斂速度慢,容易陷入局部最優(yōu),找不到全局最優(yōu)值.并且由于BP網(wǎng)絡(luò)的權(quán)值和閾值在選擇上是隨機(jī)值,每次的初始值都不一樣,造成每次訓(xùn)練學(xué)習(xí)預(yù)測(cè)的結(jié)果都有所差別.遺傳算法是一種全局搜索算法,把BP神經(jīng)網(wǎng)絡(luò)和遺傳算法有機(jī)融合,充分發(fā)揮遺傳算法的全局搜索能力和BP神經(jīng)網(wǎng)絡(luò)的局部搜索能力,利用遺傳算法來(lái)彌補(bǔ)權(quán)值和閾值選擇上的隨機(jī)性缺陷,得到更好的預(yù)測(cè)結(jié)果.
針對(duì)表6中對(duì)6類小麥籽粒的分類情況,結(jié)合MIV算法以及遺傳算法對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,網(wǎng)絡(luò)的輸入?yún)?shù)簡(jiǎn)化為14個(gè),當(dāng)采用14-22-6的網(wǎng)絡(luò)結(jié)構(gòu)時(shí),分類效果對(duì)比如圖3所示,此時(shí)的樣本平均識(shí)別準(zhǔn)確率達(dá)到了85.6%,并且此時(shí)網(wǎng)絡(luò)在對(duì)其他幾種小麥分類效果保持不變的情況下,豫麥47和周麥12的識(shí)別準(zhǔn)確率大幅改善,相比于原有神經(jīng)網(wǎng)絡(luò)的分類效果有了明顯的提高.
圖3 識(shí)別效果對(duì)比
通過(guò)對(duì)6類不同小麥品種的籽粒圖像進(jìn)行特征提取,并利用神經(jīng)網(wǎng)絡(luò)方法對(duì)小麥品種實(shí)現(xiàn)自動(dòng)分類,可以得到以下研究結(jié)果.
1)%不同品種的小麥在顏色、形態(tài)和紋理特征參數(shù)上均有所差異,將這些參數(shù)應(yīng)用于小麥的分類識(shí)別研究中是可行的.
2)%利用MIV算法計(jì)算了各特征參數(shù)對(duì)分類結(jié)果影響的平均值,從而優(yōu)化了輸入?yún)?shù).在此基礎(chǔ)上,使用遺傳算法對(duì)網(wǎng)絡(luò)進(jìn)行了優(yōu)化,取得了更好的分類效果.
3)%本試驗(yàn)僅在外觀層面對(duì)不同種類的小麥進(jìn)行分析討論,如何擴(kuò)展到內(nèi)部品質(zhì)的檢測(cè)仍有待今后進(jìn)一步研究.
[1] 李明,張長(zhǎng)利,房俊龍.基于圖像處理技術(shù)的小麥葉面積指數(shù)的提?。跩].農(nóng)業(yè)工程學(xué)報(bào),2010, 26(1):205-209.
[2] 王志軍,叢培盛,周佳璐,等.基于圖像處理與人工神經(jīng)網(wǎng)絡(luò)的小麥顆粒外觀品質(zhì)評(píng)價(jià)方法[J].農(nóng)業(yè)工程學(xué)報(bào),2007,23(1):158-161.
[3] Majumdar S,Jayas D S.Classification of cereal grains using machine vision:I.Morphology models[J].Transaction of the ASAE,2000,43:1669-1675.
[4] Majumdar S,Jayas D S.Classification of cereal grains using machine vision:II.Color models[J]. Transaction of the ASAE,2000,43:1677-1680.
[5] Majumdar S,Jayas D S.Classification of cereal grains using machine vision:III.Texture models[J].Transaction of the ASAE,2000,43:1681-1687.
[6] Majumdar S,Jayas D S.Classification of cereal grains using machine vision:IV.Combined morphology,color,and texture models[J].Transaction of the ASAE,2000,43:1689-1694.
[7] 何勝美,李仲來(lái),何中虎.基于圖像識(shí)別的小麥品種分類研究 [J].中國(guó)農(nóng)業(yè)科學(xué),2005,38(9):1869-1875.
[8] Liu Chang-Chun,ShawJai-Tsung,Keen-Yik Poong.Classifying paddy rice by morphological and color features using machine vision[J].Cereal Chemistry,2005,82(6):649-653.
[9] 成芳,應(yīng)義斌.基于顏色特征的稻種霉變檢測(cè)法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2004,35(4):102-105.
[10] 何勝美,李仲來(lái),何中虎.基于圖像識(shí)別的小麥品種分類研究[J].中國(guó)農(nóng)業(yè)科學(xué),2005,38(9): 1869-1875.
[11] 徐秋景,戚大偉.基于灰度共生矩陣的東北虎紋理特征參數(shù) [J].東北林業(yè)大學(xué)學(xué)報(bào),2009,37(7):125-127.
RESEARCH ON WHEAT VARIETY CLASSIFICATION BASED ON OPTIMIZED ARTIFICIAL NEURAL NETWORK
FAN Chao,XIA Xu,SHI Xiao-feng,HOU Li-long
(School of Information Science and Engineering,Henan University of Technology,Zhengzhou 450001,China)
To improve wheat variety classification accuracy based on image processing,we selected 6 varieties of wheat samples of L8998,Neixiang 188,9023,Youzhan 1,Yumai 47 and Zhoumai 12 as objects,then acquired wheat grain images,processed the images by median filtering,segmented the images by iterative threshold method,extracted 16 features from color,morphology and texture aspects,and constructed an artificial neutral network to study the relationship between the classification accuracy and the number of varieties.Finally,we utilized MIV algorithm to calculate the mean impact value of each input characteristic parameter to the classification result to prevent the ANN from trapping into local optimum and stopping training,and further used genetic algorithm to optimize the network structure.The results showed that the classification accuracy dropped gradually when the number of wheat varieties increased;the identification accuracy of the optimized ANN increased form 81.3%to 85.6%when the number of wheat varieties increased to 6,thereby effectively improving the wheat variety classification accuracy.
wheat;image processing;characteristic extraction;artificial neural network;optimization algorithm
TP183;TP391.41
A
1673-2383(2012)04-0072-05
http://www.cnki.net/kcms/detail/41.1378.N.20120829.1722.201204.72_017.html
網(wǎng)絡(luò)出版時(shí)間:2012-08-29 05:22:00 PM
2011-05-30
國(guó)家自然科學(xué)基金(61071197)
樊超(1976—),男,河南鄭州人,博士,副教授,研究方向?yàn)槟J阶R(shí)別、圖像處理.