国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于K-means聚類算法和BP神經(jīng)網(wǎng)絡(luò)的稻米品種鑒別

2018-03-14 10:28秦淑芳劉昌華黃申奧
中國糧油學(xué)報(bào) 2018年2期
關(guān)鍵詞:秈米粳米稻米

秦淑芳 劉昌華 黃申奧

(武漢輕工大學(xué)數(shù)學(xué)與計(jì)算機(jī)學(xué)院,武漢 430023)

稻米是我國的主要糧食作物之一。隨著人們生活水平的改善,對(duì)稻米種類和品質(zhì)的要求也越來越高,快速準(zhǔn)確的鑒別稻米成為日常生活中迫切的需要。傳統(tǒng)的稻米品種鑒別一般采用人工方法,主要是抽樣后通過目測手查法進(jìn)行判定,這種方法主觀性大,速度慢,準(zhǔn)確性不高,導(dǎo)致稻米品種鑒別具有隨機(jī)性,可信性不高。隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,機(jī)器視覺技術(shù)已經(jīng)廣泛應(yīng)用于多個(gè)學(xué)科,在農(nóng)業(yè)領(lǐng)域也取得了很多突破性的進(jìn)展。目前利用近紅外圖像和電子鼻已經(jīng)可以成功的鑒別出稻米品種,但是這種設(shè)備造價(jià)高且復(fù)雜,使得很難大規(guī)模投入使用[1-5]。

由于稻米按粒形和粒質(zhì)可分為秈米、粳米和糯米3類,其中秈米和粳米的顏色相近,較透明,但秈米粒形細(xì)長而稍扁平,粳米粒短而闊,較厚,呈橢圓形或卵圓形;糯米的顏色偏白色而不透明,它又可分為兩種:秈糯米和粳糯米,其中秈糯米的粒型和秈米相近,但顏色不同,粳糯米的粒型和粳米相近,但顏色不同。本實(shí)驗(yàn)以稻米的數(shù)字圖像為研究對(duì)象,基于稻米圖像的灰度平均值、長寬比和圓形度,提出了一種基于K-means聚類算法和BP神經(jīng)網(wǎng)絡(luò)相結(jié)合的稻米品種鑒別方法[6-7]。該方法利用圖像處理技術(shù)提取出11種稻米樣品的灰度平均值、長寬比和圓形度三項(xiàng)特征參數(shù),利用K-means聚類算法對(duì)所得數(shù)據(jù)進(jìn)行粗聚類,將11種稻米樣本分為3類。聚類的結(jié)果作為BP神經(jīng)網(wǎng)絡(luò)的輸入,訓(xùn)練得到分類器,利用此分類器,可以將3類稻米樣本進(jìn)一步分類。實(shí)驗(yàn)結(jié)果表明,這種算法的分類效果要優(yōu)于單一使用BP神經(jīng)網(wǎng)絡(luò)和K-means算法,且分類準(zhǔn)確率達(dá)到80%,可見本實(shí)驗(yàn)的方法用于稻米品種鑒別是可行的。

1 K-means聚類算法

聚類,顧名思義,就是將相同或者相似的成員集中在一起并進(jìn)行分類。聚類技術(shù)就是一種發(fā)現(xiàn)這種內(nèi)在聯(lián)系的技術(shù),是數(shù)據(jù)挖掘?qū)W科中的一個(gè)重要分支。聚類技術(shù)遵循的理念是同一個(gè)集合中的樣本相似性最大,不同集合中的樣本相異性最大。在數(shù)據(jù)挖掘領(lǐng)域中,聚類算法可大致分為五種:基于層次、基于密度、基于劃分、基于網(wǎng)絡(luò)、基于模型。K-means聚類是最著名的劃分聚類算法[8-9],由于簡潔和效率使其成為最廣泛應(yīng)用的聚類算法。

K-means聚類算法相關(guān)描述:設(shè)樣本集X={xi|i=1,2,...,N},K個(gè)類別為Cj(j=1,2,...,K),K個(gè)聚類中心為Aj(j=1,2,...,K)。

樣本間的歐式距離公式:

(1)

聚類中心:

(2)

誤差平方準(zhǔn)則函數(shù):

(3)

K-means聚類算法思想:

初始化:在樣本集X中隨機(jī)選取k個(gè)對(duì)象作為初始聚類中心;

進(jìn)行聚類:利用公式(1)計(jì)算每個(gè)對(duì)象與各個(gè)聚類中心的歐式距離,把每個(gè)對(duì)象分配給距離聚類中心最近的類別,然后利用公式(2)計(jì)算出每個(gè)類別新的聚類中心;

終止條件:重復(fù)進(jìn)行聚類步驟直到聚類中心不再發(fā)生變化或者迭代次數(shù)達(dá)到預(yù)設(shè)的最大迭代次數(shù)。

K-means聚類算法在分類樣本較少時(shí),有很好的聚類效果,樣本類別過多,就會(huì)導(dǎo)致錯(cuò)分。通常的K-means算法在初始化聚類中心時(shí),是隨機(jī)選取的,這種隨機(jī)性決定了每次聚類效果都不同,當(dāng)隨機(jī)選取的聚類中心接近每一類樣本數(shù)據(jù)中心時(shí),收斂速度快,分類效果好;當(dāng)聚類中心處于每一類樣本數(shù)據(jù)邊緣時(shí),收斂速度很慢,甚至迭代結(jié)束,仍沒有收斂。

2 BP(Backing Propagation)神經(jīng)網(wǎng)絡(luò)

人工神經(jīng)網(wǎng)絡(luò)是用人造神經(jīng)網(wǎng)絡(luò)模仿人大腦的神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)某種功能。BP神經(jīng)網(wǎng)絡(luò)是1986年由Rumelharthe McClelland等科學(xué)家提出的,是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋網(wǎng)絡(luò),具有自適應(yīng)、實(shí)時(shí)學(xué)習(xí)的特點(diǎn)。在大部分人工神經(jīng)網(wǎng)絡(luò)中都采用BP神經(jīng)網(wǎng)絡(luò)及其變化形式,是前饋型神經(jīng)網(wǎng)絡(luò)的核心部分。由于BP神經(jīng)網(wǎng)絡(luò)能學(xué)習(xí)和存儲(chǔ)大量的輸入輸出模式映射關(guān)系,并根據(jù)輸入計(jì)算輸出[10-12],因此廣泛應(yīng)用于模式識(shí)別和分類。

三層BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示,它包括一個(gè)輸入層、一個(gè)隱含層和一個(gè)輸出層,分別由n、p、q個(gè)神經(jīng)元組成。

隱含層神經(jīng)元的輸出為:

(4)

圖1 三層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

輸出層神經(jīng)元的輸出為:

(5)

公式(4)中,ωij表示第i個(gè)輸入層神經(jīng)元與第j個(gè)隱含層神經(jīng)元之間的連接權(quán);公式(5)中νij表示第j個(gè)隱含層神經(jīng)元與第t個(gè)輸出層神經(jīng)元之間的連接權(quán);θj、rt表示相應(yīng)神經(jīng)元的閾值;f(x)表示神經(jīng)元的激勵(lì)函數(shù),這里采用公式(6)來計(jì)算:

(6)

一般的,假設(shè)yt表示第t個(gè)神經(jīng)網(wǎng)絡(luò)的期望輸出值;ct表示第t個(gè)神經(jīng)網(wǎng)絡(luò)的實(shí)際輸出值;當(dāng)訓(xùn)練樣本總數(shù)為K時(shí),網(wǎng)絡(luò)全局輸出誤差采用最小方差計(jì)算,可定義公式(7)

(7)

本研究依據(jù)反向傳播梯度下降法修正連接權(quán)值νij。

(8)

(9)

yt(N)=yt(N-1)+α·d

(10)

(11)

(12)

(13)

每個(gè)樣本學(xué)習(xí)結(jié)束,利用公式(9)、公式(12)調(diào)整相應(yīng)的連接權(quán)值,直到K個(gè)樣本都學(xué)習(xí)結(jié)束時(shí),判斷全局輸出誤差函數(shù)是否達(dá)到設(shè)定的收斂限定值,直到誤差函數(shù)達(dá)到限定值時(shí),網(wǎng)絡(luò)訓(xùn)練結(jié)束;如果網(wǎng)絡(luò)訓(xùn)練達(dá)到最大學(xué)習(xí)次數(shù)時(shí),誤差仍然大于設(shè)定的數(shù)值,網(wǎng)絡(luò)訓(xùn)練也結(jié)束,同時(shí)證明網(wǎng)絡(luò)訓(xùn)練失敗。

BP神經(jīng)網(wǎng)絡(luò)在分類中得到廣泛的應(yīng)用,但BP神經(jīng)網(wǎng)絡(luò)仍存在一定的局限性,當(dāng)樣本的類別過多,樣本數(shù)目過少時(shí),直接采用BP神經(jīng)網(wǎng)絡(luò)很難準(zhǔn)確的對(duì)樣本進(jìn)行分類。BP神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中,容易陷入誤差性能函數(shù)的局部最小值,導(dǎo)致訓(xùn)練結(jié)果不是很好。要解決這些問題,通常的做法是增加神經(jīng)元和網(wǎng)絡(luò)層數(shù),然而這也增加了網(wǎng)絡(luò)的復(fù)雜性。

3 K-means算法和BP神經(jīng)網(wǎng)絡(luò)相結(jié)合

本研究基于K-means聚類算法和BP神經(jīng)網(wǎng)絡(luò)的分類方法,構(gòu)造分類模型如圖2所示。

圖2 本研究的分類模型

分類模型算法可描述如下:

輸入:11種稻米圖像;

輸出:每一類樣本的分類正確率。

本文的稻米品種分類方法的實(shí)現(xiàn)過程如下:

提取特征參數(shù):對(duì)輸入的圖像分別提取灰度平均值、長寬比、圓形度三個(gè)特征值;

聚類:選取分類類別為3,對(duì)圖像的特征參數(shù)數(shù)據(jù)利用K-means算法進(jìn)行聚類,不斷更新聚類中心,直至聚類中心不再變化或迭代結(jié)束;

構(gòu)建BP神經(jīng)網(wǎng)絡(luò):定義BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu),確定網(wǎng)絡(luò)層數(shù)、創(chuàng)建函數(shù)、訓(xùn)練函數(shù),輸入訓(xùn)練數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)分類器;

測試:對(duì)訓(xùn)練完成的分類器輸入測試數(shù)據(jù),輸出分類正確率。

4 結(jié)果與分析

4.1 實(shí)驗(yàn)數(shù)據(jù)

稻米在植物科學(xué)研究中通常被分為秈米和粳米兩個(gè)亞種[13];而在實(shí)際生活中,人們則更加習(xí)慣根據(jù)籽粒形狀和籽粒品質(zhì)將稻米分為秈米、粳米和糯米三大類?;谀壳暗久灼贩N鑒定中存在的問題,本實(shí)驗(yàn)分別選用了湖北產(chǎn)秈米3種,泰國產(chǎn)秈米1種,湖北產(chǎn)秈糯米1種,東北產(chǎn)粳米5種,東北產(chǎn)粳糯米1種共11種稻米作為研究對(duì)象,選取11種稻米各50粒(總共550粒)作為建立大類模型的實(shí)驗(yàn)樣品,利用選取的特征參數(shù)提取方法分別提取稻米樣品的灰度平均值、長寬比、和圓形度3個(gè)特征參數(shù)。以550粒樣品的特征參數(shù)為輸入依據(jù),將4種秈米樣品編號(hào)1~200,粳米樣品編號(hào)201~450,糯米樣品編號(hào)451~550,其中每種稻米樣品分別編號(hào),采用數(shù)字1~11分別代表11種稻米樣品,其中1~4為秈米,5~9為粳米,10、11為糯米,用于特征參數(shù)提取。

4.2 實(shí)驗(yàn)結(jié)果

對(duì)于K-means聚類算法,這550粒樣本作為分類的輸入數(shù)據(jù);對(duì)于BP神經(jīng)網(wǎng)絡(luò),每種稻米選取30粒作為訓(xùn)練樣本,剩下的20粒作為測試樣本。分別統(tǒng)計(jì)利用每種算法處理,每種稻米的分類正確率。將K-means聚類算法、BP神經(jīng)網(wǎng)絡(luò)與本文的算法的分類正確率進(jìn)行對(duì)比,以驗(yàn)證本研究所提算法的性能,結(jié)果如表1所示。

分類正確率采用公式(14)來計(jì)算:

(14)

式中:la表示輸入數(shù)據(jù)的標(biāo)簽,labels表示輸出數(shù)據(jù)的標(biāo)簽,sum表示計(jì)算總和。

表1 每種稻米樣本的分類效果對(duì)比結(jié)果

從表1可以看出,利用K-means算法對(duì)11個(gè)樣本分類時(shí),秈米、粳米、糯米這三大類的樣本彼此沒有混淆,但4種秈米之間、5種粳米之間、2種糯米之間很容易錯(cuò)誤分類,且每種樣本分類的正確率大部分低于80%,總體的正確率是65%;利用BP神經(jīng)網(wǎng)絡(luò)分類時(shí),4種秈米經(jīng)常分為第3類,5種粳米經(jīng)常分為第7類;2種糯米的分類效果很好,雖然個(gè)別樣本的正確率接近100%,但大部分樣本的正確率低于60%,總體的正確率為56.55%;利用本研究的方法分類時(shí),雖然個(gè)別樣本的正確率低到35%,但大部分的正確率都達(dá)到80%,總體的正確率為80.64%。

由于本次實(shí)驗(yàn)所用的稻米品種較多,而每一品種的樣本數(shù)目較少,在選取樣本作測試樣本訓(xùn)練分類器時(shí),準(zhǔn)確性不夠,導(dǎo)致最終的分類識(shí)別率。因此筆者下一步的研究重點(diǎn)是采集更多的稻米品種和樣本數(shù)目,建立樣本庫,提高分類精度。

5 結(jié)論

本研究在傳統(tǒng)單一使用K-means算法和BP神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,將這兩種算法結(jié)合用于稻米品種鑒別,克服了因樣本類別過多、分類精度不高的局限性。實(shí)驗(yàn)結(jié)果顯示,利用本研究的方法有的單個(gè)樣本的分類正確率較低,但大部分樣本的分類正確率達(dá)到80%,總體的分類正確率達(dá)到80.64%。K-means算法總體的分類正確率為65%,BP神經(jīng)網(wǎng)絡(luò)的分類正確率為56.55%。可見利用本試驗(yàn)的方法,分類正確率最高,且具備一定穩(wěn)定性。

[1]郭文川,朱新華.機(jī)器視覺技術(shù)在谷物識(shí)別與分級(jí)中的研究進(jìn)展[J].糧食與飼料工業(yè),2002(6):50-51GUOWC,ZHUXH.Researchprogressofmachinevisiontechnologyingrainidentificationandclassification[J].GrainAndFeedIndustries,2000(6):50-51

[2]CHURCHILLDB,BILSLANDDM,COOPERTM.Comparisonofmachinevisionwithhumanmeasurementofseeddimensions.TransactionsoftheASAE.1992,35(1):61-64

[3]LIUJ,PAULSENMR.CornWhitenessmeasurementandclassificationusingmachinevision.TransactionoftheASAE,2002,43(3):757-763

[4]梁亮,劉志霄,楊敏華,等.基于可見/近紅外反射光譜的稻米品種與真?zhèn)舞b別[J].紅外與毫米波學(xué)報(bào),2009(5):353-356,391LIANGL,LIUZX,YANGMH,etal.Discriminationofvarietyandauthenticityforricebasedonvisual/nearinfraredreflectionspectra[J].InfraredMillimWaves,2009(5):353-356,391

[5]熊作周.基于人工嗅覺系統(tǒng)稻米品種鑒定方法的研究[D].鄭州:河南科技大學(xué),2012XIONGZZ.Theresearchofricevarietyidentificationmethodbasedonartificialolfactorysystem[D].Zhengzhou:HenanUniversityofScienceandTechnology,2012

[6]黃申奧.基于機(jī)器視覺的稻米品種鑒別[D].武漢:武漢輕工大學(xué),2017HUANGSA.Discriminationmethodofvarietiesofricebasedonmachinevisiontechnology[M].Wuhan:WuhanPolytechnicUniversity,2017

[7]牛曉穎,夏立婭,張曉瑜,K均值和分層聚類法在大米產(chǎn)地鑒別中的應(yīng)用[J].農(nóng)機(jī)化研究,2012,6:141-143NIUXY,XIALY,ZHANGXY.ClassificationofriceaccordingtothegeographicoriginbasedonK-meansclusterandhierarchinalcluster[J].JournalofAgriculturalMechanizationResearch,2012,6:141-143

[8]HANDDJ,VINCIOTTIV.Choosingkfortwo-classnearestneighbourclassifierswithunbalancedclasses.ElsevierScienceInc.,2003,24(9-10):1555-1562

[9]GARCIAV,MOLLINEDARA,SANCHEZJS.OntheK-NNperformanceinachallengingscenarioofimbalanceandoverlapping.PatternAnalysisandApplications,2008,11(3):269-280

[10]聞新,李新,張興旺.應(yīng)用MATLAB實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)[M].北京:國防工業(yè)出版社,2015WENX,LIX,ZHANGXW,ApplicationofMATLABtoRealizeNeuralNetwork[M].Beijing:NationalDefenceIndustryPress,2015

[11]LIAOK,PAULSENMR.CornkernelbreakageclassificationbymachinevisionusingaNeuralNetworkclassifier.TransactionsoftheASAE,1993,36(6):1949-1953

[12]LIAOK,PAULSENMR,REIDJF,etal.Cornkernelshapeidentificationbymachinevisionusinganeuralnetworkclassifier.ASAEPaper,No.927017,1992

[13]中華人民共和國國家技術(shù)監(jiān)督局.GB1350—2009.中華人民共和國國家標(biāo)準(zhǔn)—稻谷.北京:中華標(biāo)準(zhǔn)出版社,2009-03-28People’sRepublicofChinaStateBureauofTechnicalSupervision.GB1350—2009.NationalStandardofthePeople’sRepublicofChina—Rice.Beijing:StandardPressofChina.2009-03-28.

猜你喜歡
秈米粳米稻米
多吃粳米益氣養(yǎng)陰
隱藏于稻米花果中的酒香
大米加工與品質(zhì)對(duì)特香型白酒釀造指標(biāo)與基酒品質(zhì)的影響研究
多吃粳米益氣養(yǎng)陰
稻米飄香醉人時(shí)光
稻米香噴噴
三款粥預(yù)防孕期便秘
秈米品種對(duì)鮮濕米粉品質(zhì)影響的研究
發(fā)揮內(nèi)外因作用 促進(jìn)稻米業(yè)發(fā)展
治脾胃虛寒