国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)的植物識別原理綜述

2020-02-07 13:03王永金左羽吳戀崔忠偉趙晨潔
物聯(lián)網(wǎng)技術(shù) 2020年1期
關(guān)鍵詞:魯棒性網(wǎng)絡(luò)結(jié)構(gòu)深度學(xué)習(xí)

王永金 左羽 吳戀 崔忠偉 趙晨潔

摘 要:文中對基于深度學(xué)習(xí)的植物識別技術(shù)進(jìn)行了廣泛研究。闡述了傳統(tǒng)植物識別技術(shù)存在的缺陷,提出將深度學(xué)習(xí)技術(shù)應(yīng)用在植物識別方向,并簡要介紹了深度學(xué)習(xí)中的深度信念網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等網(wǎng)絡(luò)結(jié)構(gòu)和特征以及將各自的神經(jīng)網(wǎng)絡(luò)應(yīng)用在植物識別技術(shù)上的案例,并重點(diǎn)分析了植物識別的原理,最后指出將深度學(xué)習(xí)應(yīng)用在植物識別方向上的優(yōu)缺點(diǎn)。

關(guān)鍵詞:深度學(xué)習(xí);植物識別;神經(jīng)網(wǎng)絡(luò);信念網(wǎng)絡(luò);網(wǎng)絡(luò)結(jié)構(gòu);魯棒性

中圖分類號:TP305文獻(xiàn)標(biāo)識碼:A文章編號:2095-1302(2020)01-00-03

0 引 言

作為地球上最多樣化的生命形式,植物的種類數(shù)量已經(jīng)達(dá)到令人瞠目結(jié)舌的程度,在判斷植物類別時(shí)給研究人員帶來了諸多不便。傳統(tǒng)的植物識別主要依靠專家進(jìn)行判別,當(dāng)植物種類較多時(shí),就需要大量專家參與,不僅工作量極大,同時(shí)分類結(jié)果也容易受專家主觀因素的影響,導(dǎo)致判別植物種類的正確率有所不同。隨著計(jì)算機(jī)圖像處理技術(shù)的發(fā)展,許多研究者更傾向于將數(shù)字圖像處理和模式識別技術(shù)應(yīng)用于植物分類方面。近年來,深度學(xué)習(xí)的快速發(fā)展已成為圖像識別領(lǐng)域的熱點(diǎn)。許多研究人員在研究如何將深度學(xué)習(xí)方法應(yīng)用在植物鑒定中,并取得了較好的識別效果。

1 傳統(tǒng)方法的缺陷

在傳統(tǒng)的植物分類識別[1]方法中,主要包括兩個方面,即特征提取和分類器設(shè)計(jì)。許多研究人員在進(jìn)行特征選取時(shí)[2],一般選擇葉片作為特征參數(shù),但是這種方法形式單一,背景簡單,并未考慮其他復(fù)雜的背景,例如植物葉片缺口、斷葉、重疊等情況。然后在識別方法上,它局限于形狀、顏色、紋理等特征,并且未將各類特征融合[3]。在分類器的設(shè)計(jì)中,通常會選擇神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和最近鄰。但是分類人員在選擇特征功能時(shí)大都選擇自己認(rèn)為正確的,不僅缺乏公認(rèn)的依據(jù),同時(shí)這些特征只適合特定的數(shù)據(jù),如果用同樣的特征來處理不同的數(shù)據(jù)集,那么結(jié)果可能不一致,因此這種特征不具有可遷移性[4]。

2 基于深度學(xué)習(xí)的植物識別技術(shù)

隨著深度學(xué)習(xí)[5]的發(fā)展,許多研究者將深度學(xué)習(xí)應(yīng)用在各領(lǐng)域中,特別是在圖像識別領(lǐng)域,取得了較好的效果?;诰矸e神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)[6]的深度學(xué)習(xí)算法可以自動提取圖像特征且無需人工干預(yù),克服了傳統(tǒng)植物葉片識別依靠人工提取特征的缺陷。近年來,許多研究通過深度學(xué)習(xí)識別諸如植物的葉子、花朵等圖像。

2.1 深度學(xué)習(xí)技術(shù)

深度學(xué)習(xí)是在機(jī)器學(xué)習(xí)的基礎(chǔ)上發(fā)展而來,它屬于機(jī)器學(xué)習(xí)的研究領(lǐng)域之一,解決了特征選擇這一重大難題。傳統(tǒng)的機(jī)器學(xué)習(xí)特征由人類專家選擇,而深度學(xué)習(xí)則是由自己選擇特征,無需人工選擇,減少了人力、物力的投入。

2.1.1 深度信念網(wǎng)絡(luò)DBN

深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)[7]最初是由Hinton教授提出的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型,2006年Hinton教授在Science上發(fā)表了一篇文章,深度學(xué)習(xí)就是從這個時(shí)候慢慢開始發(fā)展,逐漸進(jìn)入大眾視野,開啟了學(xué)術(shù)界的深度學(xué)習(xí)大潮。這篇文章有兩個觀點(diǎn):首先,具有多個隱藏層的神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)到更多特征并具有很強(qiáng)的學(xué)習(xí)能力,能夠更好地描述數(shù)據(jù)性質(zhì),有利于數(shù)據(jù)可視化或分類。其次,在深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)下,可以通過逐層初始化的措施來降低訓(xùn)練難度。深度信念網(wǎng)絡(luò)是一種生成模型,是由多個受限制的Boltzmann[8]機(jī)組成的復(fù)合模型。Hinton教授使用預(yù)訓(xùn)練方法來解決局部最優(yōu)解的問題,并把隱藏層的數(shù)量增加到了7層,證明隱藏層的層數(shù)可以增加,結(jié)果直觀可見,使得神經(jīng)網(wǎng)絡(luò)有了真正意義上的深度。

2.1.2 循環(huán)神經(jīng)網(wǎng)絡(luò)RNN

循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)[9]是20世紀(jì)80年代提出的一種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型,其處理單元之間存在內(nèi)部反饋連接和前饋連接。在CNN網(wǎng)絡(luò)中,訓(xùn)練樣本的數(shù)據(jù)大多獨(dú)立且具有相同分布,解決的問題多為分類問題、回歸問題或者特征表達(dá)問題。但通常更多數(shù)據(jù)不滿足于獨(dú)立和相同分布,例如語音翻譯。這是一個序列問題,包括時(shí)間序列和空間序列[10]。RNN內(nèi)部具有記憶功能,利用該特點(diǎn),可用它來處理任意時(shí)間段的輸入序列,所以在處理語音翻譯等問題時(shí)更容易。RNN分為兩類,其中一類為Simple RNN,會將上一層存儲的信息帶入下一次RNN的隱藏層。Simple RNN有兩個缺點(diǎn):一是記憶期極短,不僅隱藏層存儲的內(nèi)容向后傳遞時(shí)影響會逐漸減弱,同時(shí)還無法控制存儲的內(nèi)容,即一個語句中并非所有的內(nèi)容都會寫入存儲中。另一類是Long Short Term Memory(LSTM),即僅將重要的內(nèi)容寫入memory中,不重要的不存入,需要時(shí)輸出,必要時(shí)清空。LSTM能夠解決Simple RNN存在的問題,但自身所需要的參數(shù)是Simple RNN的4倍。

2.1.3 卷積神經(jīng)網(wǎng)絡(luò)CNN

卷積神經(jīng)網(wǎng)絡(luò)最初是為解決圖像識別問題而提出,之后慢慢發(fā)展,廣泛應(yīng)用于圖像、視頻、音頻和文本數(shù)據(jù)等方面,當(dāng)人們提起深度學(xué)習(xí)時(shí),首先會想到CNN,而CNN也被認(rèn)為是深度學(xué)習(xí)的代名詞。卷積神經(jīng)網(wǎng)絡(luò)主要由輸入層、卷積層、池化層、全連接層和輸出層構(gòu)成。

(1)輸入層用來接收原始數(shù)據(jù),然后對原始數(shù)據(jù)進(jìn)行處理(包括處理多維數(shù)據(jù))。

(2)卷積層用來提取圖像的特征。

(3)池化層對卷積層卷積的特征圖進(jìn)行降維采樣,壓縮數(shù)據(jù)和參數(shù)數(shù)量,避免過擬合,同時(shí)增強(qiáng)模型的適應(yīng)能力。池化操作使得特征表達(dá)具有魯棒性。

(4)全連接層將之前得到的特征進(jìn)行整合,針對各類情況輸出概率,之后分類器就可以根據(jù)得到的概率進(jìn)行分類。

(5)輸出層將全連接層得到的分類結(jié)果進(jìn)行輸出,使得輸出結(jié)果更直觀。

2.2 基于深度學(xué)習(xí)的植物識別典型案例

隨著深度學(xué)習(xí)的快速發(fā)展,許多研究者將深度學(xué)習(xí)技術(shù)應(yīng)用到了植物識別方面。趙彥輝[11]將深度學(xué)習(xí)應(yīng)用到了藥用植物識別方面,通過灰度化、角度隨機(jī)旋轉(zhuǎn)等對收集的藥用植物圖像進(jìn)行預(yù)處理,然后采用卷積神經(jīng)網(wǎng)絡(luò)技術(shù),結(jié)合DeepLearning4J框架對模型參數(shù)進(jìn)行優(yōu)化調(diào)試,從而提高復(fù)雜背景下藥用植物圖像識別的準(zhǔn)確性和有效性。鄭一力[12]采用一種基于遷移學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)方法,將收集的植物圖像通過水平、垂直翻轉(zhuǎn)等預(yù)處理來擴(kuò)充植物圖像的數(shù)據(jù)集,之后將數(shù)據(jù)集以4∶1的比例劃分為訓(xùn)練集和測試集,然后使用遷移學(xué)習(xí)方法,將之前的模型(AlexNet,InceptionV3)在測試集上訓(xùn)練,模型前面所有卷積層的參數(shù)均不改變,只替換全連接層的最后一層,使其能夠適應(yīng)植物圖像的識別。結(jié)果表明此方法不僅能節(jié)約大量時(shí)間,而且擁有更好的準(zhǔn)確率。張雪芹[13]為了解決傳統(tǒng)機(jī)器學(xué)習(xí)算法在大樣本情況下圖像識別速度慢的難點(diǎn)而提出了P-AlexNet模型,此模型是在AlexNet模型基礎(chǔ)上進(jìn)行改進(jìn)優(yōu)化而得到的,改進(jìn)后的模型不僅能在大樣本情況下進(jìn)行圖像識別,識別精度和泛化能力也有所提高,同時(shí)還利用GPU來提高訓(xùn)練的速度、減少等待時(shí)間。最后將此模型算法應(yīng)用于智能植物圖像識別系統(tǒng),結(jié)果表明使用和測試效果良好。

2.3 基于深度性的植物識別技術(shù)原理

植物識別技術(shù)原理的本質(zhì)是圖像識別[14],根據(jù)植物的圖像來識別植物種類是植物識別技術(shù)的重點(diǎn)。然而,早期圖像識別的工作僅限于識別文本之類的簡單信息,經(jīng)過計(jì)算機(jī)技術(shù)的發(fā)展,逐漸演變到今天的圖像識別,可根據(jù)給定的圖像執(zhí)行相應(yīng)的處理和分析,以識別出我們設(shè)定的目標(biāo)。計(jì)算機(jī)圖像識別技術(shù)的靈感來源于人類用肉眼去識別圖像的原理,但缺少人類的視覺與感覺。人類在看到某一張圖片時(shí),大腦會迅速感應(yīng)是否見過類似圖片,腦海中是否存在類似圖片的記憶。在看到和感應(yīng)之間便是我們識別的過程。在此過程中,大腦將根據(jù)存儲類別來識別當(dāng)前看到的圖片,以查看他們是否看過這樣的圖片。計(jì)算機(jī)的圖像識別技術(shù)也一樣,根據(jù)提取到的特征來識別圖像。隨著神經(jīng)網(wǎng)絡(luò)的興起,將神經(jīng)網(wǎng)絡(luò)應(yīng)用于圖像識別技術(shù)中,使得計(jì)算機(jī)本身具備學(xué)習(xí)能力,從而自動提取圖像特征,自動識別,減少人為干預(yù),然后通過不斷學(xué)習(xí)來提高識別準(zhǔn)確度。

2.4 基于深度學(xué)習(xí)的植物識別技術(shù)的優(yōu)缺點(diǎn)

將深度學(xué)習(xí)應(yīng)用于植物識別方面是許多研究者都在做的事,事實(shí)證明這樣做能夠解決在植物識別中遇到的難題。尤其是近年來卷積神經(jīng)網(wǎng)絡(luò)的盛行,許多研究者將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于植物分類識別后大大提高了植物鑒定的準(zhǔn)確性。從依靠人工分類到現(xiàn)在采用深度學(xué)習(xí)技術(shù)來識別植物,很大程度上減少了人工投入,大大節(jié)約了成本。而且自然界的植物種類繁多,人工采集的植物圖像多如牛毛,如果僅靠人工分類,那么無疑增加了人的工作量。深度學(xué)習(xí)能夠在一定程度上解決數(shù)據(jù)繁多的難題,從而節(jié)省大量時(shí)間,同時(shí)基于深度學(xué)習(xí)的植物識別準(zhǔn)確率也較高。然而,計(jì)算機(jī)雖然能夠進(jìn)行植物識別,但是識別準(zhǔn)確度還無法達(dá)到100%,即使采用已經(jīng)準(zhǔn)備好的數(shù)據(jù)集也無法避免誤差,更何況在各種復(fù)雜背景下來動態(tài)識別各類植物,將大幅降低識別準(zhǔn)確率。同時(shí)設(shè)備的變化、網(wǎng)絡(luò)環(huán)境的差異均會影響判斷的準(zhǔn)確性。

3 結(jié) 語

本文闡述了在植物識別方面?zhèn)鹘y(tǒng)方法存在的技術(shù)缺陷,之后介紹了幾種具有代表性的神經(jīng)網(wǎng)絡(luò),并簡要描述了卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)。隨后列舉了幾個深度學(xué)習(xí)應(yīng)用于植物識別的案例,可以看出將深度學(xué)習(xí)應(yīng)用于植物識別確實(shí)能夠提高識別率。最后分析了植物識別技術(shù)的原理和存在的優(yōu)缺點(diǎn)。

將神經(jīng)網(wǎng)絡(luò)應(yīng)用于圖像識別雖然還存在一些問題,但是相信隨著計(jì)算機(jī)技術(shù)的發(fā)展,這些問題都會被逐一解決。

參 考 文 獻(xiàn)

[1]袁銀,王東斌,劉永金.基于深度學(xué)習(xí)的植物圖像識別方法研究[J].現(xiàn)代農(nóng)業(yè)科技,2017(23):278-280.

[2]溫坤哲,韋玉科,董曉華.深度卷積神經(jīng)網(wǎng)絡(luò)在圖像美學(xué)評價(jià)的應(yīng)用綜述[J/OL].計(jì)算機(jī)工程與應(yīng)用,2019:1-16. [2019-07-03].http://kns.cnki.net/kcms/detail/11.2127.TP.20190401.1730.026.html.

[3]鐘海軍,胡步發(fā).基于高層特征融合的圖像語義分割[J].機(jī)械制造與自動化,2019(3):178-181.

[4]汪榮貴,姚旭晨,楊娟,等.基于深度遷移學(xué)習(xí)的微型細(xì)粒度圖像分類[J].光電工程,2019,46(6):21-30.

[5] LECUN Y,BENGIO Y,HINTON G.Deep learning [J]. Nature,2015,521:436-444.

[6] LECUN Y,BENGIO Y.Convolutional Networks for Images,Speech,and Time Series [M]. Cambridge,MA: MIT Press,1998:255-258.

[7] HINTON G E,OSINDERO S, TEH Y W. A fast learning algorithm for deep belief nets [J]. Neural computation,2006,18(7):1527-1554.

[8] LI W,NING H T. Poisson-boltzmann equation with a random field for charged fluids [J]. Journal of physics:condensed matter,2019,31(37).

[9] MIKOLOV T, KARAFI?T M, BURGET L, et al. Recurrent neural network based language model [C]// Interspeech,2010.

[10]王遠(yuǎn)志,孫家潔,劉連興,等.關(guān)于引入空間序列概念的思考[J].沈陽工程學(xué)院學(xué)報(bào)(自然科學(xué)版),2007(2):179-180.

[11]趙彥輝,范欣寧,張建逵,等.基于DeepLearning4J on Spark深度學(xué)習(xí)方法在藥用植物圖像識別中的應(yīng)用初探[J].中國中醫(yī)藥圖書情報(bào)雜志,2018,42(5):18-22.

[12]鄭一力,張露.基于遷移學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)植物葉片圖像識別方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2018,49(z1):354-359.

[13]張雪芹,陳嘉豪,諸葛晶晶,等.基于深度學(xué)習(xí)的快速植物圖像識別[J].華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,44(6):887-895.

[14]高浩宇.基于機(jī)器學(xué)習(xí)的圖像識別研究與應(yīng)用[D].武漢:華中師范大學(xué),2018.

猜你喜歡
魯棒性網(wǎng)絡(luò)結(jié)構(gòu)深度學(xué)習(xí)
荒漠綠洲區(qū)潛在生態(tài)網(wǎng)絡(luò)增邊優(yōu)化魯棒性分析
基于確定性指標(biāo)的弦支結(jié)構(gòu)魯棒性評價(jià)
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
基于非支配解集的多模式裝備項(xiàng)目群調(diào)度魯棒性優(yōu)化
西南交通大學(xué)學(xué)報(bào)(2016年6期)2016-05-04
基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
知識網(wǎng)絡(luò)結(jié)構(gòu)維對于創(chuàng)新績效的作用機(jī)制——遠(yuǎn)程創(chuàng)新搜尋的中介作用
滬港通下A+ H股票網(wǎng)絡(luò)結(jié)構(gòu)演化的實(shí)證分析
復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)比對算法研究進(jìn)展
海门市| 道真| 通辽市| 孝感市| 五大连池市| 开化县| 阳泉市| 冷水江市| 陵水| 托克托县| 永靖县| 新乐市| 广东省| 潜江市| 揭东县| 仁怀市| 安多县| 林周县| 皋兰县| 周至县| 子洲县| 吐鲁番市| 岚皋县| 桂东县| 永新县| 凉城县| 武宣县| 吉水县| 喀喇| 绵阳市| 瓦房店市| 紫金县| 贵德县| 尤溪县| 奇台县| 新乡市| 墨脱县| 临汾市| 莆田市| 太仓市| 平顺县|