基于深度學習的圖像識別模型研究綜述

2018-03-20 09:09:56河北農業(yè)大學信息科學與技術學院陳勇濤郭曉穎陶慧杰

電子世界 2018年4期

河北農業(yè)大學信息科學與技術學院陳勇濤郭曉穎陶慧杰

一、圖像識別概述

圖像識別也就是圖像的模式識別，是模式識別技術在圖像領域中的具體應用，是對輸入的圖像信息建立圖像識別模型，分析并提取圖像的特征，然后建立分類器，根據圖像的特征進行分類識別的一種技術。

圖像識別的常用方法有：貝葉斯分類法、模板匹配法等。貝葉斯分類法，是假設圖像的特征之間獨立并計算特征的后驗概率來對圖像進行分類模板匹配法，是將樣本特征與特定的模板比較，根據相似度判斷是否同類。但由于貝葉斯定理假設一個屬性值對給定類的影響獨立于其它屬性的值，而此假設在實際情況中經常是不成立的，因此其分類準確率可能會下降。模板匹配法，研究某一特定對象物的圖案位于圖像的什么地方，進而識別對象物。但模板匹配具有自身的局限性，主要表現(xiàn)在它只能進行平行移動，若原圖像中的匹配目標發(fā)生旋轉或大小變化，該算法無效。

而基于深度學習的圖像識別方法，是使用大規(guī)模深層次卷積神經網絡模型從海量數據集中自動學習圖像特征，并泛化到實際識別場景中。其通過模擬人類的大腦皮層，采用多層非線性方式處理、逐級提取以及逐層建立映射的方式使復雜的工作簡單化。

二、深度學習在圖像識別中的發(fā)展

1.卷積神經網絡（CNN）

卷積神經網絡的結構和傳統(tǒng)的神經網絡有很多的相似之處：閾值、前向傳播、計算殘差、反向傳播，直到殘差收斂且滿足精度需求。其基本結構包括卷積層、嗎池化層和全連接層。

卷基層實質上是通過卷積核計算后的網絡層。卷積核是利用卷積層計算的重要組成部分，通過卷積層的運算，把原圖像轉換到超平面坐標系下，超平面能最大程度上集中同類圖像。在前向傳播的過程中，每個卷積核進行卷積計算，生成一個2維的特征圖，通過一定的網絡訓練，將這些卷積結果激活圖進行疊加，便可得出結果。

池化層也稱為下采樣層，利用卷基層處理過的數據作為輸入來進行池化操作對結果進行一定的壓縮，以降低數據的空間尺寸，減少參數數量，進而可以提高計算效率，有效控制過擬合。

全連接層在卷積神經網絡的最后會把卷積輸出的二維特征圖轉化成一維的一個向量，以提高特征提取的純度，更方便的交給最后的分類器或者回歸。

2.LeNet-5模型

如圖1是卷積神經網絡LetNet-5的結構圖，共有7層（不包括INPUT），每層都有訓練參數，輸入圖像大小為32×32（像素），卷積窗口大小為5×5（像素），卷積核在二維平面上平移，并且卷積核的每個元素與被卷積圖像對應位置相乘，再求和。通過卷積核的不斷移動可得出完全由卷積核在各個位置時的乘積求和的結果組成的圖像。經過池化和全連接層后，其采用滑動卷積窗口的方法對輸入圖像進行卷積。

3.AlexNet

針對現(xiàn)代化科技進步更快、更準確的需求，提高CNN的性能，更豐富的數據集、更有效的模型以及更高效的去過擬合技術在AlexNet中使用。

圖1 LetNet-5 網絡模型

圖2 AlexNet CNN網絡模型

如圖2是AlexNet的結構圖，其中有5個卷積層和3個全連接層，中間穿插著池化操作。除去卷積、池化、全連接操作外，本模型還有以下幾點優(yōu)化：

（1）ReLU作為激活函數

模擬神經元輸出的標準函數一般是：tanh(x)或者sigmoid(x)函數（也稱為飽和函數）；而f(x)=max(0,x)是一種非線性的非飽和函數。這種扭曲線性函數，不但保留了非線性的表達能力，而且由于其具有線性性質（正值部分），相比前者在誤差反向傳遞時，不會有由于非線性引起的梯度彌散形象（頂層誤差較大，因此ReLU作為激活函數可以訓練更深的網絡。

（2）多GPU并行訓練

事實證明，120萬個訓練樣本才足以訓練網絡，但這對于一個GPU的工作能力而言是不可能順利完成的。所以AlexNet模型將網絡分布在兩個GPU上。即每個GPU中放置一半核（或神經元）。這種結構降低了錯誤率，提高了圖像識別效率，減少了大量的訓練時間。

（3）局部反應歸一化（LRN）

利用臨近的數據做歸一化。這個策略貢獻了1.2%的Top-5錯誤率。

Dropout和LRN 技術使網絡的去過擬合能力更強，保證了卷積神經網絡的學習能力和泛化性能。

[1]王禹鄢.深度學習在圖像識別中的應用與發(fā)展[J].中國戰(zhàn)略新興產業(yè),2017：115-116

[2]Bottou L,Bengio Y,Cun Y L.Global Training of Document Processing Systems Using Graph Transformer Networks[C]//Proceeding of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Juan, Puerto Rico：IEEE,1997：489-494.

[3]陳旭,張軍,陳文偉,李碩豪.廣東工業(yè)大學學報[J].2017,34：20-26.

[4]張慶輝,萬晨霞.卷積神經網絡綜述[J].2017,28：82-86.

[5]馬衛(wèi)飛.ALexNet模型的詳解[EB/OL]. http：//blog.csdn.net/maweifei/article/details/53117830,2016-11-10

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡