劉浩++董軍宇++孫鑫++蹇木偉
[摘 要]本文適當(dāng)運(yùn)用主動(dòng)學(xué)習(xí)方法,提出了一種基于深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)反饋?zhàn)R別方法,可以從無(wú)標(biāo)記測(cè)試樣本中選擇最合適的樣本反饋訓(xùn)練深度網(wǎng)絡(luò)模型,使得識(shí)別系統(tǒng)在使用過(guò)程中逐漸提高目標(biāo)識(shí)別的準(zhǔn)確度和魯棒性。實(shí)驗(yàn)結(jié)果表明所提出的方法能夠在快速準(zhǔn)確地對(duì)目標(biāo)進(jìn)行辨別的同時(shí),逐漸提升真實(shí)場(chǎng)景下應(yīng)用的準(zhǔn)確度。
[關(guān)鍵詞]主動(dòng)學(xué)習(xí);深度神經(jīng)網(wǎng)絡(luò);反饋;目標(biāo)識(shí)別
中圖分類(lèi)號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-914X(2016)08-0383-01
Object Feedback Recognition System Base on Deep Learning
Hao Liu1,Junyu Dong1,Xin Sun1,Muwei Jian1
[Abstract]This paper proposed a novel deep neural network based object recognition method with a feedback process by using an appropriate active learning method. It selects better non-labeled samples to feedback and retrain the deep neural network model, which makes the accuracy and robustness of the object recognition system improved gradually during use. The experiments show that the proposed method can recognize the target object in a fast way and improve the accuracy of application in the real scene gradually.
[Key words]Active Learning; Deep Neural Network; Feedback; Object Recognition
1.介紹
目標(biāo)識(shí)別一直以來(lái)都是機(jī)器學(xué)習(xí)領(lǐng)域研究的前沿問(wèn)題,近些年來(lái),出現(xiàn)了一些優(yōu)秀的基于特征的物體識(shí)別方法,例如基于梯度信息的SIFT/SURF[1]算法等,但隨著數(shù)據(jù)集樣本的增多,逐漸達(dá)到了一定的瓶頸。近年來(lái),基于深度學(xué)習(xí)所提取的抽象特征在物體識(shí)別中取得了非常好的表現(xiàn)。2012年Krizhevsky等人通過(guò)使用卷積神經(jīng)網(wǎng)絡(luò)取得了較高的圖像分類(lèi)準(zhǔn)確率。2014年R. Girshick[2]等人所提出的Region Based CNN算法在目標(biāo)識(shí)別領(lǐng)域也取得了較好的結(jié)果。雖然這些方法取得了較好的效果,但是日常生活中的場(chǎng)景是多變的,因此需要所得到的模型能夠自動(dòng)學(xué)習(xí)和適應(yīng)新的場(chǎng)景和需求,本文將基于RCNN方法提出一種帶反饋的自適應(yīng)學(xué)習(xí)目標(biāo)識(shí)別算法,它隨著反饋的增加,模型越來(lái)越完善和智能。
2.相關(guān)技術(shù)介紹
2.1 RCNN算法
Region Based CNN算法首先使用Selective search算法在圖像上產(chǎn)生約2000個(gè)候選窗口,進(jìn)行目標(biāo)檢測(cè)。然后使用CNN對(duì)每一個(gè)候選窗口提取4096維特征來(lái)表示每個(gè)Proposal,最后用SVM分類(lèi)器對(duì)目標(biāo)進(jìn)行分類(lèi)。
2.2 主動(dòng)反饋學(xué)習(xí)
主動(dòng)學(xué)習(xí)具有減少冗余和快速收斂的優(yōu)勢(shì)。通過(guò)一定的主動(dòng)學(xué)習(xí)方法選擇出一個(gè)或一批最有用的樣本,并向檢查者詢(xún)問(wèn)標(biāo)簽,然后利用獲得的新知識(shí)來(lái)訓(xùn)練分類(lèi)器和進(jìn)行下一輪查詢(xún)。本文使用主動(dòng)學(xué)習(xí)的思想對(duì)反饋?zhàn)R別過(guò)程進(jìn)行控制。
3.基于主動(dòng)學(xué)習(xí)的物體反饋?zhàn)R別
目標(biāo)反饋?zhàn)R別是一個(gè)智能化的交互過(guò)程,它先使用有限訓(xùn)練數(shù)據(jù)訓(xùn)練出一個(gè)初始分類(lèi)模型,這個(gè)模型對(duì)物體進(jìn)行識(shí)別的準(zhǔn)確率可能并不高。接下來(lái),我們希望后續(xù)的每次識(shí)別都能夠?yàn)槟P吞峁┬畔ⅲP鸵罁?jù)這些信息重新訓(xùn)練,實(shí)現(xiàn)對(duì)分類(lèi)模型的修改與完善。本文基于RCNN算法,首先使用有限標(biāo)定樣本進(jìn)行訓(xùn)練,利用RCNN 生成一個(gè)初始模型。然后每次使用主動(dòng)學(xué)習(xí)的方法,從未標(biāo)記樣本集中選擇出n0個(gè)最有用的、最利于完善分類(lèi)模型的樣本圖像;最后利用檢查者對(duì)樣本所做的標(biāo)記,進(jìn)一步訓(xùn)練分類(lèi)器,完善模型,迭代進(jìn)行,最終實(shí)現(xiàn)模型的自動(dòng)更新達(dá)到最優(yōu)的識(shí)別效果。
4.實(shí)驗(yàn)
以1.1圖的Train圖像為例進(jìn)行識(shí)別,圖1.2得到識(shí)別結(jié)果為Bus,識(shí)別發(fā)生錯(cuò)誤,此時(shí)使用本文方法進(jìn)行反饋,系統(tǒng)將結(jié)果反饋給分類(lèi)模型,這樣選擇出的每張圖像都會(huì)反饋一個(gè)結(jié)果來(lái)優(yōu)化模型,迭代進(jìn)行。如果如圖1.3再次對(duì)這張圖像進(jìn)行識(shí)別,得到識(shí)別結(jié)果“未檢測(cè)到Bus”,識(shí)別正確,說(shuō)明反饋過(guò)程起到了應(yīng)有的作用。通過(guò)實(shí)驗(yàn)可以表明,本文提出的方法會(huì)使物體識(shí)別變得越來(lái)越智能。
5.結(jié)論
本文提出的基于深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)反饋?zhàn)R別方法,使用主動(dòng)學(xué)習(xí)來(lái)對(duì)反饋?zhàn)R別過(guò)程進(jìn)行控制,通過(guò)對(duì)VOC2007數(shù)據(jù)集中的Train類(lèi)圖像進(jìn)行識(shí)別試驗(yàn)的結(jié)果可以看到,本文提出的方法成功提升了目標(biāo)識(shí)別系統(tǒng)的準(zhǔn)確度和魯棒性,逐漸提升了在復(fù)雜多樣的真實(shí)場(chǎng)景下識(shí)別目標(biāo)的準(zhǔn)確度,使得系統(tǒng)越來(lái)越完善與智能,最終實(shí)現(xiàn)了非常好的目標(biāo)識(shí)別效果。
參考文獻(xiàn)
[1]Lowe, D. G., "Distinctive Image Features from Scale-Invariant Keypoints ", International Journal of Computer Vision, 60, 2, pp. 91-110, 2004.
[2]Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation,R. Girshick, J. Donahue, T. Darrell, J. Malik,IEEE CVPR (Oral), 2014.